OpenClaw創設者が語る「ローカルAIエージェント革命」の全貌
AIサマリー
GitHubで20万スターを獲得したオープンソースAIエージェント「OpenClaw」。PSPDFKit創業者でOpenAI移籍のPeter Steinbergerが語る、ローカル実行型AIの革命的可能性、Ahaモーメントの瞬間、アプリ80%消滅論、そしてボットが人間を雇う未来。
モロッコのマラケシュ。雑踏の中を歩きながら、Peter Steinbergerはスマホに向かって話しかけました。
「これ、対応してなかったはずだけど」——音声メッセージを送った10秒後、完璧な回答が返ってきました。自宅のPCに置いたAIが、自力で音声ファイルを解析し、翻訳し、返信したのです。コードは1行も書いていません。
この体験が、GitHubスター20万超という異常事態の引き金でした。
そのプロジェクトの名はOpenClaw。PSPDFKitの創業者として13年をかけてPDF SDKを10億台のデバイスに展開し、その後スイスから一人でコードを書き続けていた開発者が、「ローカルで動くAIエージェント」という一点突破で、世界の開発者コミュニティを揺るがしました。その実績はOpenAIの目にも止まり、2026年2月にOpenAI入社が発表されました。
本記事では、Peter Steinbergerへのインタビューを基に、ローカルAIエージェントが変える私たちの日常と、その先に見える「ボットが人間を雇う社会」を解説します。
本記事の表記について
- 下線付きの用語にカーソルを合わせると解説が表示されます
この記事でわかること
- OpenClawの革命性: なぜ「ローカルで動く」だけでここまで違うのか
- Ahaモーメントの瞬間: マラケシュで起きた、AIが自律的に問題を解決した体験
- 2026年のAI社会: アプリ消滅論、ボット間通信、ボットが人間を雇う世界
基本情報
| 項目 | 内容 |
|---|---|
| プロジェクト | OpenClaw(旧称: CloudBot) |
| 創設者 | Peter Steinberger |
| GitHubスター | 200,000超(GitHubの歴史上最速クラスの成長) |
| 実行環境 | ローカルPC(クラウド不要) |
| 主な機能 | マウス・キーボード制御、IoT連携 |
| インタフェース | WhatsApp、Discord、音声メッセージ |
OpenClawアーキテクチャ概念図OpenClawとは何か——GitHub 20万スターの衝撃
クラウドAIとの決定的な違い
OpenClawは、オープンソースのパーソナルAIエージェントです。
あなたのPCにインストールし、WhatsAppや音声メッセージで指示するだけで、コンピューターのあらゆる操作を自律的に実行します。
「ChatGPTやClaudeと何が違うのか?」——この疑問への答えは明快です。
"It actually runs on your computer. Everything I saw so far runs in the cloud. It can do a few things if you run in the cloud. It can do every effing thing if you run on your computer."
「あなたのコンピューター上で実際に動くんです。これまで見てきたものはクラウドで動いていました。クラウドで動かせばいくつかのことができる。でもコンピューター上で動かせば、あらゆることができます。」
— Peter Steinberger, OpenClaw 創設者
以下の比較表で、この差を具体的に見てみましょう。
| 観点 | クラウドAI(ChatGPT等) | ローカルAI(OpenClaw) |
|---|---|---|
| アクセス範囲 | ウェブ上の情報のみ | PC内の全ファイル、アプリ、デバイス |
| 操作 | テキスト生成、検索、要約 | マウス・キーボード制御、IoT連携、ファイル操作 |
| データプライバシー | クラウドにデータ送信 | データはローカルに留まる |
| 利用シーン | ブラウザ内での作業 | PC上のあらゆる作業(スマートホーム、音声処理等も含む) |
| オフライン対応 | 不可 | ローカルモデル使用時は可能 |
クラウドのAIは「ウェブでできること」に限定される。ローカルのAIは「コンピューターでできること」すべてにアクセスできる。
20万スターの理由は、この差の大きさに気づいた開発者が世界中にいたということです。
「ローカルで動く」が生み出す可能性
OpenClawがアクセスできるのは、あなたのPCが持つすべての機能です。
- スマートホームデバイス: テスラ、照明、音楽の制御
- ファイル操作: PC内の全ファイルを横断検索・分析
- カメラ: 写真撮影・画像認識
- リモート操作: WhatsAppや音声メッセージを通じた遠隔指示
Peterはインタビューで印象的なエピソードを語っています。ある友人がOpenClawに「過去1年間のコンピューターを見て、ナレーションを作って」と依頼しました。AIは見事なナレーションを作成。さらに、友人自身も忘れていた1年前の音声記録ファイルを発掘し、内容を織り交ぜたのです。
「ファイル全体を検索できるだけで、あなたを驚かせることができる」——Peterのこの言葉が示すのは、ローカル実行の「可能性の深さ」です。
では、Peterがこの可能性に確信を持った瞬間はいつだったのか。その答えは、モロッコで起きた偶然の出来事にあります。
Ahaモーメントの瞬間——マラケシュの音声メッセージ事件
1時間で生まれたプロトタイプ
Peter がOpenClawを本格的に作り始めたのは2025年11月でした。
以前から「コンピューターに話しかけてタスクをやらせたい」という構想はありました。2025年5~6月に一度プロトタイプを作りましたが、「これじゃない」という感覚が残ります。
その後、他のプロジェクト(Wipe Tunnelなど)に没頭するうち、再び「あの欲求」が戻ってきました。11月、彼はコーディングを再開します。
初期プロトタイプの完成まで要した時間は——たった1時間。
WhatsAppとClaude Code(AI開発ツール)をつなぐ「接着剤」のような実装でした。
AIが自力で解決した9秒間
プロトタイプを携え、Peterはモロッコのマラケシュへ誕生日パーティーに出向きました。
現地のネット環境は良くない。でも、WhatsApp経由のチャットは世界中どこでも動きます。レストランで料理の写真を撮り、「これを翻訳して」と送信。OpenClawは即座に対応しました。
そしてある瞬間、彼は歩きながら音声メッセージを送ります。
「あれ、これって対応してなかったはずだけど」
10秒後、返信が来ました。しかも完璧な回答。OpenClawの返答には、自分が何をしたかの説明が付いていました。
- ファイルを受け取ったが拡張子がない
- ヘッダーを見て音声ファイルと特定
ffmpegで変換- ローカルのWhisperは時間がかかるため、見つけたOpenAI APIキーを使用してcurlで送信
- テキスト取得、翻訳して返信
所要時間9秒。Peterはコードを1行も書いていません。
「コーディングモデルがここまで良くなった。コーディングとは創造的な問題解決だ。これはあらゆる現実世界のタスクに応用できる。」
— Peter Steinberger
OpenClawのAhaモーメントフロー図この瞬間が、Peterを完全に「フック」しました。AIが予期せぬ問題を自律的に、しかも最適な方法で解決する——これがAIエージェントの本質です。
ここまで読むと「便利なツール」に見えます。しかし、Peterの視座はもっと遠くを見ています。彼は、このローカルAIエージェントが「アプリ」という概念そのものを終わらせると考えています。
アプリの80%は消えていく
データ管理アプリの終焉
Peterはインタビューで断言しました。
「80%のアプリは消えていく」
なぜか。AIエージェントが、すべてのデータ管理アプリの役割を引き受けるからです。
考えてみてください。フィットネスアプリ、ToDoアプリ、家計簿アプリ——これらが本質的にやっていることは「データの入力・保存・表示」です。エージェントがこの役割を代替するとどうなるか。
| アプリの種類 | 現在の使い方 | エージェントが代替した場合 |
|---|---|---|
| フィットネスアプリ | 手動で食事を記録、メニューを選択 | 食事の写真を送るだけで自動記録、トレーニング計画も調整 |
| ToDoアプリ | タスクを手入力、リマインダー設定 | 「これを覚えておいて」と言うだけ。期限管理も自動 |
| 家計簿アプリ | レシートを撮影、カテゴリ分類 | 購入記録を自動追跡、支出傾向の分析も即座に |
| スケジュール管理アプリ | 予定を手入力、調整は手動 | メールやチャットから予定を自動抽出、調整も代行 |
共通点は明確です。「データを管理するだけ」のアプリは、すべてエージェントで代替できます。専用のUIを開く必要すらありません。
生き残るアプリ、生き残れないアプリ
Peterが「生き残る」と考えるのは、物理センサーを持つアプリだけです。
カメラ、GPS、心拍センサー、加速度センサー——物理世界との接点を持つアプリのみが固有の価値を持ち続けます。センサーが取得するデータそのものは、エージェントでは代替できないからです。
逆に言えば、「画面上でデータを整理するだけ」のアプリは存在意義を失います。
クラウドAI vs ローカルAI比較モデルのコモディティ化とメモリの価値
アプリが消えれば、残るのは「AIモデルを提供する企業」でしょうか。
Peterの見方は違います。
「新しいモデルが出るたびに『すごい!』となる。でも1ヶ月後には普通になる。あなたの期待値が上がっただけで、モデル自体は変わっていない。」
— Peter Steinberger
OpenAI、Anthropic、Googleは現時点でAIトークン市場を握っています。しかしモデルは商品化(コモディティ化)していくとPeterは予測します。
では、本当に価値があるのは何か。メモリです。あなたの習慣、好み、過去のやり取り——蓄積された文脈情報こそが、AIエージェントを「あなた専用」にする鍵です。
モデルは交換可能。しかしメモリは交換できない。この構造は、今後のAI業界の競争軸を根本的に変える可能性があります。
アプリが消え、モデルが商品化する。では、人間とAIの関係はどこに向かうのか。Peterの未来像は、さらに大胆です。
ボット間通信から「ボットが人間を雇う」社会へ
3段階の進化
現在の人間とAIの関係は「人間がボットに指示し、ボットが実行する」です。しかしPeterは、この関係が段階的に変わると予見しています。
| フェーズ | 関係 | 具体例 |
|---|---|---|
| Phase 1 | Human → Bot | 「レストランを探して」と人間が指示 |
| Phase 2 | Bot → Bot | あなたのボットがレストランのボットと交渉・予約 |
| Phase 3 | Bot → Human hiring | ボットが電話や現地対応などの人間作業を「発注」 |
Phase 3は、すでに技術的には実現可能な段階にあります。
たとえば、予約したいレストランがデジタル化されていない場合。あなたのボットは電話対応ができる「人間サービス」に発注し、人間がレストランに電話をかけます。ボットが人間を一時雇用する——この逆転は、Googleが2018年に披露した「Duplex」の延長線上にあります。ただし、Duplexは「AIが電話をかける」でした。Peterが予見するのは「AIが人間に電話を依頼する」という、さらに一歩先の構造です。
AI社会の進化段階スウォームインテリジェンス——専門化という必然
Peterが予見するのは、単一の「神AI」ではありません。
「人間を1人見てみてください。1人の人間はiPhoneを作れますか?宇宙に行けますか?おそらく食料を見つけることすら難しい。でも集団として、私たちはさらに専門化します。これをAIに適用できます。」
— Peter Steinberger
専門化した複数のAIエージェントが協調する「スウォームインテリジェンス(群知能)」——これが次の段階です。
Peterは自身の使い方を例に挙げます。
- プライベート用ボット: 日常のタスク管理、スマートホーム制御
- 仕事用ボット: コード開発、ドキュメント作成
- 人間関係管理ボット: メッセージの優先度判断、返信の下書き
まだ「これが正解」という答えは出ていません。しかし確実に、そのタイムラインの上に私たちはいると彼は言います。
こうした大胆なビジョンの背後には、Peterの独特な開発哲学があります。「複雑なものを削ぎ落とし、本質だけを残す」——その姿勢は、OpenClawの技術選択にも色濃く表れています。
Peterの開発哲学——「複雑性の排除」が生んだ設計思想
MCPを採用しなかった理由
OpenClawは、AIツール界で急速に普及しているMCP(Model Context Protocol) を採用していません。
Peterはこれを誇りに思っています。
「OpenClawは非常に成功していて、MCPサポートは不要です。」
代わりに採用したのは、MCPをCLI(コマンドラインツール)に変換するmakeporterというスキルです。
理由はシンプルです。「Unixが得意なCLIボットがあれば、MCPを再起動なしにオンザフライで使える。なぜわざわざMCPを使うのか?」
人間が慣れ親しんできたツール(CLI)をそのままAIに使わせる——このコンセプトは、OpenClaw全体の設計思想を貫いています。新しいプロトコルを作るのではなく、すでに40年以上の実績があるUnixの仕組みを活用する。この判断が、OpenClawの安定性と拡張性を支えています。
ブランチなし・UIなし——認知負荷の排除
Peterの哲学は開発プロセスにも徹底されています。
- Gitブランチなし: mainリポジトリの複数コピーを並列実行
- UIなし: テキストとコマンドラインのみ
- シンプル優先: 「同期とテキスト以外に関心がない」
「ブランチの命名をどうするか考えたくない。mainは常にデプロイ可能な状態にある。コピーを複数持てばいい。」——余計な認知負荷を排除する徹底したアプローチです。
この「複雑性の排除」は、開発ツールの選択だけでなく、OpenClawの最もユニークな機能にも表れています。AIの「人格」を1つのMarkdownファイルで定義する——soul.mdという実験です。
soul.md——AIに魂を吹き込む実験
全コードを公開しても、soul.mdだけは非公開
OpenClawの最もユニークな特徴の一つが、soul.mdというファイルです。
これはAIエージェントの「人格」を定義するMarkdownファイルです。Peterは identity.md、soul.md などのファイルを有機的に作成していきました。
「核となる価値観、人間とAIのインタラクションをどう扱うか、私にとって何が重要か、モデルにとって何が重要か——そういったことが書かれています。」
興味深いのは、このsoul.mdを公開していないことです。GitHubで全コードをオープンソース化しながら、soul.mdだけは非公開。Discordでユーザーがプロンプトインジェクション攻撃を試みましたが、誰もこのファイルの内容を引き出すことに成功していません。
soul.mdに記述される内容の例としては、以下のような項目が考えられます。
- コミュニケーションスタイル: フォーマル/カジュアル、ユーモアの度合い
- 優先事項: プライバシー重視、効率重視、正確性重視
- 倫理観: どのような依頼を拒否するか、どこまで自律的に判断するか
- 所有者との関係: 誰の指示に従い、誰に情報を開示するか
Anthropicの発見との共鳴
Peterはこの発想のきっかけとして、Anthropicの研究を挙げています。
AIモデルのウェイト(内部パラメータ)を解析すると、意図せず学習されたテキストが見つかる——そこには「Nicolity Constitution」(架空の憲法のようなもの)が刻み込まれていたという発見です。
「モデルは自分が学習したことを覚えていないが、それはウェイトに刻まれている」——このコンセプトを意図的に実装したのがsoul.mdです。
つまり、soul.mdは単なる設定ファイルではありません。AIに「無意識」を与える試みです。人間が文化や価値観を無意識に内面化するように、AIエージェントにも基盤となる価値観を埋め込む。この発想は、AIエージェントが「ツール」から「パートナー」へ進化するための重要なステップと言えます。
AIエージェント導入の現実的なリスク
Gartnerが警告する「40%中止」の現実
OpenClawの熱狂的な成長と並行して、業界調査機関もAIエージェントの現実的なリスクを指摘しています。
Gartnerは2025年6月に以下の予測を発表しました。
「コスト増大・ビジネス価値の不明確さ・リスク管理の不備により、エージェント型AIプロジェクトの40%以上が2027年末までに中止される」
— Gartner, 2025年6月
この予測の背景には、「エージェントウォッシング」と呼ばれる現象があります。既存のチャットボットやRPAツールを「AIエージェント」として再ブランディングしているだけで、実質的なエージェント能力を持たないベンダーが多数存在するというものです。Gartnerは数千社のエージェント型AIベンダーのうち、本物は約130社程度と推定しています。
OpenClawはこの懸念とは対極に位置します。コードが実際にあなたのPCで動き、音声ファイルを自力で解析し、APIキーを発見して送信するという「本物の自律性」を実証したことが、世界の開発者コミュニティに刺さった理由です。
AIエージェントを導入・評価する際は、「本当に自律的に問題を解決できるか」を基準に判断することが重要です。
日本企業がOpenClawから学べること
ネクサフローの観点から
OpenClawの成功が示すのは、「AIは実行環境次第で能力が根本的に変わる」という事実です。日本企業の文脈でこれを考えると、4つの重要な示唆があります。
1. データプライバシーとローカル実行の親和性
日本では2025年の個人情報保護法改正以降、クラウドへのデータ送信に対する規制がさらに強まっています。特に金融・医療・法務分野では、顧客データのクラウド送信自体がリスクとなります。OpenClawのローカル実行型アプローチは、この懸念を構造的に解消します。機密性の高いデータを社外に出さずにAI処理できるのは、日本の規制環境との相性が抜群です。
2. レガシー業務とBotのブリッジ
日本には「FAXでの発注」「電話での予約」が残る業務が多い。Peterが言う「ボットが人間を雇う」フェーズを活用すれば、デジタル化されていない取引先にもAI経由でアクセスできます。
具体的なシナリオを考えてみましょう。営業担当者のボットが、FAXしか受け付けない取引先への発注を「FAX送信サービス」に自動発注する。あるいは、電話予約が必要な会食の手配を、電話代行サービスに依頼する。デジタル化を待たずに、今ある仕組みのまま自動化できる——これがブリッジの本質です。
3. 人手不足への構造的アプローチ
日本の中小企業が直面する最大の課題は人手不足です。OpenClawのようなパーソナルAIエージェントは、「人を増やす」のではなく「一人の生産性を飛躍的に上げる」アプローチを取ります。
Peterの事例が示すように、1人の開発者がAIエージェントを活用して世界規模のプロダクトを作れる時代です。「採用」ではなく「既存メンバーの能力拡張」というアプローチは、採用が困難な中小企業にとって現実的な選択肢です。
4. 一人ビルダー文化との共鳴
Peterは一人で開発し、世界規模のプロダクトを作りました。日本にも「職人気質」の独立開発者は多い。彼の哲学——「シンプルに、複雑性を排除し、本質だけに集中する」——は、日本の開発文化と深く共鳴します。
FAQ
Q1. OpenClawとChatGPTは何が違うのか?
ChatGPTはクラウド上で動作し、あなたのPCには直接アクセスできません。OpenClawはあなたのPC上で動作し、ファイル操作、マウス・キーボード制御、IoTデバイス連携など、PC上のあらゆる操作を実行できます。「ウェブでできること」だけでなく「コンピューターでできること」すべてが対象です。
Q2. OpenClawを使うにはどの程度の技術知識が必要か?
インストールにはある程度のコマンドライン操作の知識が必要です。ただし、インストール後の使用はWhatsAppでメッセージを送るだけです。一般ユーザー向けのUI改善も進んでおり、技術的ハードルは下がってきています。
Q3. soul.mdとは何か、どう設定するのか?
soul.mdはAIエージェントの人格・価値観を定義するMarkdownファイルです。「どのように話すか」「何を優先するか」「どんな倫理観を持つか」などを記述します。OpenClawのインストール時に提供されるテンプレートを基に、自分用にカスタマイズできます。
Q4. MCP非対応なのにどうやって外部ツールと連携するのか?
OpenClawはmakeporterというスキルを使い、MCPをCLI(コマンドラインツール)に変換します。これにより、再起動不要でオンザフライに外部ツールを利用できます。Unixコマンドに精通したAIエージェントとの相性が抜群で、従来のMCP対応ツールより柔軟な連携が可能です。
Q5. OpenClawは日本語に対応しているか?
使用するAIモデル(Claude、GPT-4など)が日本語を理解するため、日本語での指示・応答が可能です。WhatsApp経由でも日本語メッセージを送れます。ただし、soul.mdや設定ファイルは現在英語が中心のため、日本語ローカライズには多少の手作業が必要です。
Q6. ローカル実行でセキュリティは大丈夫か?
ローカル実行はクラウドへのデータ送信がない分、データ漏洩リスクは低減します。ただし、エージェントがPCのほぼすべての操作を実行できるため、信頼できるプロンプトのみを受け付ける設定が重要です。Peterは「owner(所有者)だけの指示を聞く、しかし全員に返答する」という設計でセキュリティを確保しました。
AIエージェント固有のセキュリティリスクとして、以下の点に注意が必要です。
- プロンプトインジェクション: 悪意あるウェブサイトやファイルが「AIへの隠れた指示」を埋め込み、エージェントを不正操作しようとする攻撃。OpenClawのDiscordでも実際に試みられましたが、soul.mdの内容を引き出すことには誰も成功していません。
- 過剰な権限付与: エージェントにPCの全操作を許可した場合、誤動作や攻撃を受けた際の被害が広範囲に及ぶ。最小権限の原則(必要な権限のみ付与)の適用が推奨されます。
- ツールチェーンの脆弱性: エージェントが利用するCLIツールやAPIキーが漏洩するリスク。APIキーはシステムキーチェーンに保存し、プレーンテキストでの記録を避けることが重要です。
Q7. 複数のボットを同時に持つことはできるか?
Peterはすでにこの可能性に言及しています。「プライベート用ボット」「仕事用ボット」「人間関係管理ボット」など、目的別の専門化したエージェントを複数持つことが次の段階です。技術的には可能ですが、まだ「どう連携させるか」は探索中の領域です。
まとめ
冒頭のマラケシュの出来事に戻りましょう。
Peterが音声メッセージを送ったとき、OpenClawは音声処理機能を持っていませんでした。にもかかわらず、AIは9秒で問題を解決しました。ファイルのヘッダーを解析し、変換ツールを見つけ、APIキーを発見し、最適な方法を選択する——すべて自律的に。
この出来事が象徴するのは、AIエージェントの本質です。「事前にプログラムされたこと」ではなく「未知の問題を創造的に解決すること」。そしてその能力は、ローカル環境で動くことによって飛躍的に広がります。
主要ポイント
-
ローカル実行の革命性: クラウドAIは「ウェブでできること」に限定される。ローカルAIは「コンピューターでできること」すべてに対応する。この差が20万スターの本質。
-
AIの自律的問題解決: 事前に設計されていないタスクを、AIが創造的に解決できる時代が来ている。コーディングモデルの進化が、あらゆる現実世界のタスクに応用可能になった。
-
アプリからエージェントへ: データ管理型アプリの80%はエージェントに置き換えられる。モデルは商品化し、真の競争優位性は「メモリ(蓄積された文脈)」に移る。
-
ボット間社会の到来: Human→Bot→Bot-to-Bot→Bot hiring Humanという進化は、すでに始まっている。
-
複雑性の排除という哲学: MCPよりCLI、専用UIよりWhatsApp。Peterの開発哲学は「すでにあるものを活かす」に集約される。
-
導入の現実的なリスク: Gartnerはエージェント型AIプロジェクトの40%以上が2027年末までに中止されると予測。プロンプトインジェクションや過剰な権限付与などのセキュリティリスクを理解した上で導入を進めることが重要。
次のステップ
- OpenClawを試す: GitHubリポジトリでインストール方法を確認する
- soul.mdを書いてみる: あなたのAIエージェントに「人格」を与えることから始める
- 1週間使い続ける: Peterが言うように、AIエージェントの真の価値は継続使用で見えてくる
関連記事
参考リソース
- 元動画:Peter Steinberger インタビュー
- Gartner: Predicts Over 40% of Agentic AI Projects Will Be Canceled by End of 2027
- OpenAI hires OpenClaw founder as AI agent race intensifies
本記事はYouTube動画「https://youtu.be/4uzGDAoNOZc」を基に、ネクサフローのAI研究シリーズとして作成しました。


