OpenClawとは？実行権限で読むローカルAIエージェントの導入判断

OpenClawのようなローカルAIエージェントを入れるかどうかは、モデルの賢さやデータの所在地では決まりません。決まるのは、Agentに渡す副作用——読む、書く、実行する、送る、定時に起動する、別端末を操作する——の境界をどこに引くかです。この境界を曖昧にしたまま「すごいデモ」に飛びつくと、便利さと同じ量だけ事故範囲も広がります。

私は、OpenClaw型のローカルエージェントは当面、自分ひとりの端末で、読み取りと下書き提示までに閉じて使うべきだと考えています。送信、cronでの定時起動、node経由の別端末操作、Bot to Humanの自動発注は、明示的な承認が挟まるまでオフにしておくべきです。ただしこれは個人ビルダーや少人数チームの実験的な使い方に限った立場で、認証・監査の基盤が未整備なまま全社導入する話ではありません。sandboxやapprovalフローの成熟という新しい事実が出てくれば、この慎重論は全力で朝令暮改するつもりです。

この記事自体、OpenClawを実際に動かして得た一次体験の報告ではなく、元動画とOpenClaw公式docsを読み込んだ二次分析であることを先に断っておきます。実機での挙動確認よりも、docsとインタビューの記述から権限設計の論点を抽出することを目的にしています。

前提: 実行権限という軸を定義する

この記事で繰り返し使う言葉を先に定義します。

実行権限とは、Agentが実際に起こせる副作用の集合です。データがクラウドにあるかローカルにあるかではなく、次の6つの動詞のうちどれをAgentに許しているかで測ります。

読む（ファイル、ログ、メッセージ）
書く（ファイル、メモ、設定）
execで実行する（shell command）
messageで送る（チャット、メール、通知）
cronで定時起動する
nodeで別端末を操作する

この6つのうち1〜2だけを許した状態を読み取りエージェント、3以降を一つでも持たせた状態を副作用エージェントと呼びます。副作用Toolを1つ持った瞬間、便利さと事故範囲は同じToolから同量だけ増えます。導入判断は、この境界線をどこで引くかに尽きます。

この軸の上に、OpenClawの構成要素を置くと次のようになります。

要素	役割
Gateway	メッセージ、認証、セッション、端末接続を束ねる中枢
チャネル	WhatsApp、Telegram、Slack、Discord、Signal、iMessage、WebChatなどの入口
Agent runtime	文脈を読み、使うToolを選ぶ実行主体
Tool / 拡張	exec、browser、file I/O、message、cron、gatewayなど、副作用を起こす手足
node	Gatewayから呼び出せる端末側の実行環境（macOSなど）

OpenClawアーキテクチャ概念図

流れはシンプルです。ユーザーがチャットやCLIで依頼し、Gatewayがそれを受け、Agent runtimeが文脈からToolを選び、Toolがファイル・ブラウザ・コマンド・メッセージ・端末操作を実行し、結果が同じチャネルへ返ります。この一本道のどこに人間の確認を挟むかが、実行権限の設計そのものです。

「ローカルだから安全」という短絡はここで崩れます。ローカルで動くからこそ、Agentに与えた権限がそのままリスクになるからです。

マラケシュのAhaモーメントは、権限境界の実例として読む

元動画でPeter Steinbergerが語った、マラケシュから音声メッセージを送ったエピソードは象徴的です。彼はスマホから音声ファイルを送り、Agentはファイル形式を推定し、変換し、文字起こしをして翻訳し、返信するところまでを自律的に組み立てたと語っています。

この話を「音声処理ができるAI」と読むと学びが狭くなります。読むべきは、Agentが未知の依頼に対して、入力ファイルの観察・使えるコマンドやAPIの探索・失敗しそうな処理の回避・結果の説明・チャットへの返信を組み合わせた点です。そしてこの自律性は、そのままAgentがコマンドやAPIキーに届く権限を持っていたことの裏返しでもあります。便利さと事故範囲は、同じexec Toolから出ています。

OpenClawのAhaモーメントフロー図

この節の指摘も、Peterのインタビュー内容とOpenClaw公式docsの記述を突き合わせた分析であり、著者自身がexec Toolを持つAgentを運用して得た体験談ではありません。裏返せば、便利さと事故範囲が同じToolから出るという構造は、特定の失敗事例を待たずとも、Tool定義そのものから論理的に導ける点だと考えています。

「アプリの多くが消える」を判定材料に変える

元動画でPeterは「データ管理だけのアプリはエージェントに置き換わりやすい」という趣旨の見方を語っています。ここで大事なのは、この予測が当たるかどうかを議論することではありません。手元のアプリを次の4層に分けて、Agentに渡してよい層とダメな層を見分けることです。

層	見るべき問い
入力	ユーザーはフォーム入力をしたいのか、自然文や写真で渡したいのか
保存	データはどこに残り、誰が読めるのか
実行	Agentが実際に何を変更できるのか
検証	ユーザーはどこで差分を確認し、取り消せるのか

ToDo、家計、営業メモ、社内ナレッジのような領域は、専用画面より「チャットで投げ、Agentが既存の保存先へ整理する」体験が合う場面があります。一方、医療機器、金融取引、本人確認、会計承認のような高リスク領域は、実行層に踏み込む前に人間の確認点を明確に置く必要があります。判断基準は予測の当たり外れではなく、この4層のどこにAgentの副作用が触れるかです。

クラウドAI vs ローカルAI比較

モデル名よりも、どの会話を同じセッションとして扱うか、どのファイルやログを読ませるか、どの依頼を拒否または確認待ちにするか、どの操作を履歴として残すか——この運用文脈の設計の方が、組織固有の価値になります。モデルは差し替えられますが、承認ルールと失敗事例は差し替えられません。

Bot to Bot、Bot to Humanへ広げる前に

Peterは、Human to BotからBot to Bot、さらにBotが人間の作業を手配する流れにも触れています。これも予測として受け取るより、ワークフロー設計の論点として読む方が実務的です。

段階	例	設計上の注意点
Human to Bot	人間がチャットで「この資料を要約して」と頼む	参照ファイルと出力先を明確にする
Bot to Tool	Agentがブラウザ、ファイル、CLI、メッセージToolを使う	Toolごとのallow / denyを設計する
Bot to Bot	目的別Agentへ作業を分担する	セッション分離と責任範囲を固定する
Bot to Human	電話、現地確認、専門判断を外部作業として依頼する	依頼内容、承認、費用、個人情報を絞る

AI社会の進化段階

最初に試すべきは最終段階の自動発注ではなく、Human to BotとBot to Toolを小さく閉じることです。Agentが何を読み、何を変更し、どこで止まったかを確認できる状態を先に作ります。複数Agentへの分割も同様で、最初から増やす必要はありません。まず単一Agentで読み取り・下書き・差分提示までを安定させ、開発・事務・調査のように責任範囲を分けたくなった段階で初めてmulti-agent routingを検討すれば十分です。

SOUL.mdは人格演出ではなく運用規約

OpenClaw docsにはSOUL.mdというガイドがあります。名前だけ見ると「AIに魂を与える」話に見えますが、実務ではownerとして扱う相手、拒否する依頼、確認を求める操作、失敗時の報告方法、機密情報や外部リンクの扱いを明文化する場所として使う方が堅実です。プロンプトそのものは安全境界ではありませんが、Agentの判断傾向をレビュー可能にする効果はあります。

導入に開発経験がどこまで必要かという疑問には、公式docsのinstaller script・npm・source buildといった複数の導入経路が答えを持っています。むしろ必要なのはインストールスキルより、次に挙げるTool権限・チャネル設定・ログ・承認フローを理解できる担当者です。

導入前に確認する安全設計

OpenClaw公式のSecurity docsは率直です。AI assistantはshell commandの実行、ファイル読み書き、network serviceへのアクセス、メッセージ送信ができると説明したうえで、「access control before intelligence（知能より先にアクセス制御）」という考え方を置いています。ここから、確認すべき5点が導けます。

誰が話しかけられるか。 DMはpairingかallowlistを基本にします。ownerだけが高権限Toolを使え、groupではmention必須にし、unknown senderはpairing待ちにし、複数人利用ならDM sessionを分けます。openなDMや広いgroup policyは、公共の部屋や多数参加者がいる場所では攻撃面を一気に広げます。

どのToolを使えるか。 Tools docsには、exec、browser、web search、file I/O、message、cron、gatewayなど多くのToolがあります。強力なToolほどdeny listやprofileで絞る必要があり、minimalに近い読み取り中心の構成から、workspace限定のfile I/O、明示承認つきのcommand実行、送信やcronのような副作用の大きいToolへと段階的に広げるのが無難です。

Tools docsが示すminimalから段階的に広げる設計思想に沿うなら、最初の承認プロンプトが必要になるのは論理的にはexecやbrowserのような副作用Toolを有効にした瞬間のはずです。逆に言えば、file I/Oまでを workspace限定で運用している段階では、承認フローが要求される場面自体がほとんど発生しない設計だと考えられます。

どこにログが残るか。 session transcriptは~/.openclaw/agents/<agentId>/sessions/*.jsonlに保存され、同じOSユーザーやホスト上の別プロセスから読める可能性があります。OpenClawを動かすOSユーザー、ログに残してよい情報の範囲、秘密情報を含むファイルの配置、バックアップや端末廃棄時の扱いを先に決めておく必要があります。

Node実行をどう扱うか。 macOS nodeなどをpairingすると、Gatewayから端末側の操作を呼べます。公式docsはこれをremote code executionだと明記しています。端末ごとに許可コマンドを絞り、approvalの設定を必ず確認してください。「自分のMacを遠隔操作できる」体験は、攻撃者にとっても同じだけ魅力的な権限だからです。

外部コンテンツをどう扱うか。 プロンプトインジェクションはWebページ、メール、PDF、チャット添付、貼り付けテキストから入ります。URLや添付は信頼できないものとして読み、高権限Toolの前に人間確認を挟み、秘密情報はAgentが読めるファイル領域から遠ざけ、sandboxとworkspace限定を使い、送信前には必ず差分を出す。この5つが、Tool surfaceを持つAgent全般に共通する最低ラインです。

日本企業がここから学べるのは「ローカルなら安心」ではなく、AIに作業環境を渡すなら権限境界をプロダクト要件として扱う姿勢です。営業・バックオフィス・カスタマーサポートのようにチャット・メール・電話・Excel・社内ファイルが混在する領域では、既存ツールを置き換える前に、既存ツール間の作業をつなぐ用途——顧客メモから議事録を作る、問い合わせを分類して下書きを作る、社内手順書を参照してチェック項目を返す——から小さく始める方が現実的です。

実行権限で並べ直す

ここまでの材料を、最初に定義した6動詞の軸で並べ直します。

動詞	分類	理由
読む	今オンにする	事故時の影響が最小で、下書き作成の前提になる
書く（workspace限定）	今オンにする	取り消し可能で、差分確認がしやすい
execで実行する	承認付きでオンにする	便利さが最も大きい分、誤操作の影響も大きい
messageで送る	当面オフ	送信は取り消せない副作用で、プロンプトインジェクションの出口になりやすい
cronで定時起動する	当面オフ	人間が見ていない時間に副作用を起こす設計になる
nodeで別端末を操作する	当面オフ	公式docsが明記する通りremote code executionそのものであり、影響範囲が自端末を超える

この表の「当面オフ」という分類は、著者が現に運用している構成の報告ではなく、OpenClaw公式Security docsが掲げる「access control before intelligence」という原則と、取り消し可能性という基準を組み合わせて導いた立場です。送信・cron・nodeを先にオフへ倒すべき理由は、いずれも人間の確認を経ずに副作用が確定してしまう点にあり、この論理は個々の運用実績を待たずとも成り立つと考えています。

この並べ直しから見えるのは、「読む・書く」と「送る・cron・node」の間に、取り消し可能かどうかという明確な境界があることです。実行(exec)はその中間にあり、承認プロンプトという人間の一手を挟むことで、便利さを大きく落とさずに事故範囲を閉じられます。冒頭で述べた私の立場——読み取りと下書き提示までに閉じ、送信・cron・nodeは明示承認が挟まるまでオフ——は、この表の境界線と一致しています。

この記事の限界と、次の問い

この整理は、元動画と公式docsという二次情報をもとにした素振りです。認証・監査基盤が整った組織での全社導入や、sandbox技術が今後どこまで成熟するかについては、ここで扱った範囲の外にあります。

OpenClawのような基盤を評価するとき、機能一覧やスター数より先に見るべきは、誰が話しかけられるか、どのToolを呼べるか、どの端末で何が実行されるか、ログがどこに残るかです。この記事のデータとdocsの引用が、読者にとって脅しではなく、自分の実行権限の境界線をどこに引くかを決めるための材料になれば良いと思っています。この素振りは、sandboxやapprovalフローの進展を見ながら続けるつもりです。

MCPプロトコルのセキュリティ危機——外部ツール接続の認証・承認・監査

パーソナルコンピュータで動くAIエージェントの設計——goal/trigger/approval/sandbox

Computer UseとPC操作AIのセキュリティリスク

参考リソース

本記事はYouTube動画「https://youtu.be/4uzGDAoNOZc」とOpenClaw公式docsを基に、ネクサフローのAI研究シリーズとして作成しました。

この記事の著者

中村知良

代表取締役

早稲田大学卒業後、ソフトバンク株式会社にてAI活用やCEO直下案件のプロジェクトマネージャーに従事。その後、不動産スタートアップPit in株式会社の創業、他スタートアップでの業務改善・データ活用を経験後、2023年10月、株式会社ネクサフローを創業し代表取締役CEO就任。

前提: 実行権限という軸を定義する

この記事で繰り返し使う言葉を先に定義します。

読む（ファイル、ログ、メッセージ）
書く（ファイル、メモ、設定）
execで実行する（shell command）
messageで送る（チャット、メール、通知）
cronで定時起動する
nodeで別端末を操作する

この軸の上に、OpenClawの構成要素を置くと次のようになります。

要素	役割
Gateway	メッセージ、認証、セッション、端末接続を束ねる中枢
チャネル	WhatsApp、Telegram、Slack、Discord、Signal、iMessage、WebChatなどの入口
Agent runtime	文脈を読み、使うToolを選ぶ実行主体
Tool / 拡張	exec、browser、file I/O、message、cron、gatewayなど、副作用を起こす手足
node	Gatewayから呼び出せる端末側の実行環境（macOSなど）

OpenClawアーキテクチャ概念図

「ローカルだから安全」という短絡はここで崩れます。ローカルで動くからこそ、Agentに与えた権限がそのままリスクになるからです。

マラケシュのAhaモーメントは、権限境界の実例として読む

OpenClawのAhaモーメントフロー図

「アプリの多くが消える」を判定材料に変える

層	見るべき問い
入力	ユーザーはフォーム入力をしたいのか、自然文や写真で渡したいのか
保存	データはどこに残り、誰が読めるのか
実行	Agentが実際に何を変更できるのか
検証	ユーザーはどこで差分を確認し、取り消せるのか

クラウドAI vs ローカルAI比較

Bot to Bot、Bot to Humanへ広げる前に

段階	例	設計上の注意点
Human to Bot	人間がチャットで「この資料を要約して」と頼む	参照ファイルと出力先を明確にする
Bot to Tool	Agentがブラウザ、ファイル、CLI、メッセージToolを使う	Toolごとのallow / denyを設計する
Bot to Bot	目的別Agentへ作業を分担する	セッション分離と責任範囲を固定する
Bot to Human	電話、現地確認、専門判断を外部作業として依頼する	依頼内容、承認、費用、個人情報を絞る

AI社会の進化段階

SOUL.mdは人格演出ではなく運用規約

導入前に確認する安全設計

実行権限で並べ直す

ここまでの材料を、最初に定義した6動詞の軸で並べ直します。

動詞	分類	理由
読む	今オンにする	事故時の影響が最小で、下書き作成の前提になる
書く（workspace限定）	今オンにする	取り消し可能で、差分確認がしやすい
execで実行する	承認付きでオンにする	便利さが最も大きい分、誤操作の影響も大きい
messageで送る	当面オフ	送信は取り消せない副作用で、プロンプトインジェクションの出口になりやすい
cronで定時起動する	当面オフ	人間が見ていない時間に副作用を起こす設計になる
nodeで別端末を操作する	当面オフ	公式docsが明記する通りremote code executionそのものであり、影響範囲が自端末を超える

この記事の限界と、次の問い

MCPプロトコルのセキュリティ危機——外部ツール接続の認証・承認・監査

パーソナルコンピュータで動くAIエージェントの設計——goal/trigger/approval/sandbox

Computer UseとPC操作AIのセキュリティリスク

参考リソース

本記事はYouTube動画「https://youtu.be/4uzGDAoNOZc」とOpenClaw公式docsを基に、ネクサフローのAI研究シリーズとして作成しました。

この記事の著者

中村知良

代表取締役

OpenClaw導入の可否は、権限境界で決まる

前提: 実行権限という軸を定義する

マラケシュのAhaモーメントは、権限境界の実例として読む

「アプリの多くが消える」を判定材料に変える

Bot to Bot、Bot to Humanへ広げる前に

SOUL.mdは人格演出ではなく運用規約

導入前に確認する安全設計

実行権限で並べ直す

この記事の限界と、次の問い

関連記事

参考リソース

中村知良

あわせて読みたい

MCPとは？AIエージェント接続標準の仕組みと実装時のセキュリティ論点

Perplexity「Personal Computer」に学ぶ常時稼働AIワーカー設計

Claude Computer Useとは？OSWorld 61.4%でも「調査プレビュー」が外れない理由

まずは無料相談・資料請求

OpenClaw導入の可否は、権限境界で決まる

前提: 実行権限という軸を定義する

マラケシュのAhaモーメントは、権限境界の実例として読む

「アプリの多くが消える」を判定材料に変える

Bot to Bot、Bot to Humanへ広げる前に

SOUL.mdは人格演出ではなく運用規約

導入前に確認する安全設計

実行権限で並べ直す

この記事の限界と、次の問い

関連記事

参考リソース

中村知良

あわせて読みたい

MCPとは？AIエージェント接続標準の仕組みと実装時のセキュリティ論点

Perplexity「Personal Computer」に学ぶ常時稼働AIワーカー設計

Claude Computer Useとは？OSWorld 61.4%でも「調査プレビュー」が外れない理由

まずは無料相談・資料請求

前提: 実行権限という軸を定義する

マラケシュのAhaモーメントは、権限境界の実例として読む

「アプリの多くが消える」を判定材料に変える

Bot to Bot、Bot to Humanへ広げる前に

SOUL.mdは人格演出ではなく運用規約

導入前に確認する安全設計

実行権限で並べ直す

この記事の限界と、次の問い

関連記事

参考リソース

中村 知良

この記事をシェア

あわせて読みたい

MCPとは？AIエージェント接続標準の仕組みと実装時のセキュリティ論点

Perplexity「Personal Computer」に学ぶ常時稼働AIワーカー設計

Claude Computer Useとは？OSWorld 61.4%でも「調査プレビュー」が外れない理由

まずは無料相談・資料請求

前提: 実行権限という軸を定義する

マラケシュのAhaモーメントは、権限境界の実例として読む

「アプリの多くが消える」を判定材料に変える

Bot to Bot、Bot to Humanへ広げる前に

SOUL.mdは人格演出ではなく運用規約

導入前に確認する安全設計

実行権限で並べ直す

この記事の限界と、次の問い

関連記事

参考リソース

中村 知良

この記事をシェア

あわせて読みたい

MCPとは？AIエージェント接続標準の仕組みと実装時のセキュリティ論点

Perplexity「Personal Computer」に学ぶ常時稼働AIワーカー設計

Claude Computer Useとは？OSWorld 61.4%でも「調査プレビュー」が外れない理由

まずは無料相談・資料請求

中村知良

中村知良