この記事の要約
Cognitionが提供するAIソフトウェアエンジニアDevinを、公式サイト・料金ページ・公開事例を軸に整理します。基本コンセプト、使い始める導線、課金モデルの見方、Windsurfとの関係、導入事例を確認するときのポイントまでまとめました。
Devinは、チャットやSlackから依頼した開発タスクをサンドボックス上で進め、計画と実装結果を人がレビューできる形で返す AIソフトウェアエンジニア として紹介されています。
Cognitionの公式発表を追うと、Devinの重心は単発のコード補完ではなく、まとまった task を受け取って調査、実装、テスト、PR 準備までを進める使い方にあります。
本記事では、Cognitionの公式サイト、料金ページ、Windsurf買収発表、DeNAの公開発表、導入事例ページを起点に、Devinを理解するときに先に押さえておきたい論点を整理します。
本記事の表記について
| 項目 | 内容 |
|---|---|
| 提供元 | Cognition |
| プロダクト | Devin |
| 関連製品面 | Windsurf |
| カテゴリ | AIソフトウェアエンジニア |
| 公式導線 | devin.ai / 料金ページ / Docs / 導入事例ページ / cognition.ai/blog |
| 創業チーム | Scott Wu / Steven Hao / Walden Yan |
| 拠点 | San Francisco, California |
| 利用導線 | Session(Web) / Slack / API / Windsurf |
| 課金モデル | Core は pay-as-you-go、Team は monthly plan、大規模導入は個別案内 |
| 公開事例の軸 | migration / documentation / QA / rollout |
Devinの全体像Devinは、Cognitionが「AI software engineer」として提供する agent です。強みは、issue や migration のようなまとまりのある task を引き受け、調査、実装、テスト、レビュー準備までを一つの流れで進められる点にあります。
補完型の IDE ツールと違い、Devin は「どの task を渡すか」「どこで checkpoint を置くか」を人が先に決めてから使う前提のプロダクトとして読む方が実態に近いです。
IDE 補助ツールとの見方の違い:
| 観点 | Devin | IDE補助ツール |
|---|---|---|
| 作業単位 | issue / migration / docs / QA | file / function 単位 |
| 実行場所 | sandbox / remote workspace | editor 上 |
| 人の役割 | scope 設計、制約指定、review | その場で一緒に書く |
| 向いている場面 | 長めの task、PR 準備、定型 backlog | 速い編集、補完、対話しながらの実装 |
公開されている case study を並べると、繰り返し現れるのは次の種類の task です。
どれも「完全に自動化したい」というより、境界がはっきりした作業を backlog から切り出して、AI に先行実行させたい場面で使われています。
Devinは3つの利用方法と複数の機能モジュールで構成されています。
| コンポーネント | 機能概要 | 主なユーザー |
|---|---|---|
| Session(Web) | チャット形式でのタスク依頼、リアルタイム進捗確認 | 個人開発者 |
| Slackbot | Slackチャンネルでのメンション起動、スレッド進捗報告 | チーム開発 |
| API | CI/CDパイプライン統合、大量タスク一括処理 | エンタープライズ |
| Devin Search | コードベースへの直接クエリ、引用付き回答 | 全ユーザー |
| Devin Wiki | リポジトリ自動インデックス化、アーキテクチャ図付きWiki | 全ユーザー |
| MultiDevin | マネージャーDevin + 最大10ワーカーDevinの並列実行 | エンタープライズ |
最も基本的な利用方法です。devin.aiにログインし、チャット形式でタスクを依頼します。
使い方:
向いているケース: 初めてDevinを試す場合、単発のタスク依頼
チームでの利用に最適な方法です。SlackチャンネルでDevinをメンションするだけでタスクを依頼できます。
使い方:
@Devin このバグを修正して [GitHub Issue URL] とメンション向いているケース: チーム開発、非同期でのタスク依頼、進捗の可視化
CI/CDパイプラインや自社ツールとの統合に使用します。Teamプラン以上で利用可能。
curl -X POST https://api.devin.ai/v1/sessions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"task": "Fix security vulnerability in auth module", "repo": "org/repo"}'
向いているケース: 自動化されたワークフロー、セキュリティ修正の自動実行、大量タスクの一括処理
Devinは、独自開発モデルをベースに以下の技術を組み合わせています:
Devinは以下のツールを統合したサンドボックス環境で動作します:
| ツール | 機能 |
|---|---|
| Code Editor | コード生成に特化したファインチューニングされたLLMを使用 |
| Shell | プロジェクト作成、ライブラリインストール、テスト実行 |
| Web Browser | 未知の技術の学習、ドキュメント参照、問題解決方法の検索 |
| Planner | タスクを分解し、自然言語の指示を連続的なステップに変換する |
Devinの自律性の核心は、このループにあります:
このループにより、Devinは人間の介入なしで自己修正しながらタスクを進めます。
技術アーキテクチャDevinは、セキュアなサンドボックス環境で動作し、2つのチェックポイントで人間の承認を求めます:
Cognitionの公式 blog を追うと、Devinの進化は「より大きな数値」よりも、コードベース理解と長い task の運用に寄っています。特に recent post では、次の3点が繰り返し強調されています。
個別 benchmark や throughput は更新されやすいため、本記事では「どの workflow が強化されているか」を主な読みどころにします。
devin.ai/pricing では、Devinは「まず試す」「継続運用する」「大規模導入する」の3層で案内されています。固定の seat 料金だけで捉えるより、どれだけ task を委任するかとどこまで security / admin control が必要かで見る方が実務に合います。
| プラン | 料金ページでの見え方 | 向いているケース |
|---|---|---|
| Core | $20 から始める pay-as-you-go | 個人や小さな team が試す |
| Team | $500 / month、included ACUs あり | 継続して task を回す team |
| Enterprise | 問い合わせベース | VPC、SSO、admin control が必要な組織 |
ACU(Agent Compute Unit) は、Devin が使う計算資源をまとめて扱う単位です。料金を見るときは、月額そのものよりも次の観点が重要です。
Devin を他の coding tool と比べるなら、価格の絶対値より 課金の考え方 を揃えて見る方が判断しやすいです。
| ツール群 | よくある課金モデル | 向いている使い方 |
|---|---|---|
| Devin のような agent | usage + session ベース | backlog task の委任、PR 準備 |
| IDE 補助ツール | seat / request cap ベース | inline edit、補完、短い対話 |
| クラウドIDE / builder | workspace / flow / usage ベース | prototype、deploy まで一気に試す場面 |
コスト比較のポイント: Devin は「毎日ずっとエディタで使う補助ツール」ではなく、「まとまった task を何本回すか」で費用感が変わる agent として見た方がミスが少なくなります。
1997年、ルイジアナ州。中国系移民の家庭に、一人の少年が生まれました。
Scott Wuがプログラミングに出会ったのは9歳のとき。彼はそこに「魔法」を見ました。
"I first learned to program when I was nine years old and fell in love with the ability to turn my ideas into reality."
「9歳でプログラミングを学び、アイデアを現実に変える能力に魅了されました」
— Scott Wu
Scott Wuの才能は、競技プログラミングで開花します。
IOI(国際情報オリンピック) は、世界中の高校生プログラマーが競う最高峰の大会。Scott Wuはここで3年連続金メダルを獲得しました。
| 年 | 大会 | 結果 |
|---|---|---|
| 2012年 | IOI | 金メダル(15歳) |
| 2013年 | IOI | 金メダル(16歳) |
| 2014年 | IOI | 金メダル・満点600点・総合1位(17歳) |
2014年は満点で総合1位。世界中の天才プログラマーの頂点に立ちました。
その後もICPC(国際大学対抗プログラミングコンテスト)で金メダル、Google Code Jamで3位と、彼の才能は衰えることを知りません。
"A lot of my kind of framing has always been rooted in terms of math... even when we're going and doing a sale or something or when we're figuring out product strategy, like in my head it all actually maps to just doing math questions."
「私の思考の枠組みは常に数学に根ざしています。セールスや製品戦略を考えるときでさえ、頭の中では数学の問題を解くようにマッピングしています」
— Scott Wu
すべてを数学の問題として捉える——この思考が、Devinの「Reason → Act → Observe → Correct」ループの設計に直結しています。
ハーバード大学在学中の2017年、Scott WuはAIマッチングアプリ「Lunchclub」を共同創業します。
$55.9M(約84億円)を調達し、Forbes 30 Under 30に選出。成功でした。
しかし彼の頭の中には、もっと大きな「ゲーム」がありました。
"It's almost like this game that we've all been playing in our minds for years, and now there's this chance to code it into an AI system."
「まるで何年も頭の中でプレイしてきたゲームを、今AIシステムにコード化するチャンスが訪れたようなものです」
— Scott Wu
Steven HaoもIOI金メダリストで、Cognitionの技術基盤を設計しています。共同創業者として、Devinのコアアーキテクチャと強化学習パイプラインの構築を主導。
3人目の共同創業者Walden YanもIOI金メダリスト。プロダクト全体のビジョンとユーザー体験を統括しています。
3人の共同創業者全員がIOI金メダリスト——これは、AIスタートアップの中でも異例の技術力の集中です。
Russell Kaplanは2024年にPresidentとして参画しました。前職はScale AIでML・MLインフラの責任者を務め、その前はTeslaでML開発、さらにHeliaを共同創業した経歴を持ちます。
Windsurf買収の72時間交渉を指揮したのもKaplanで、ビジネス面でのリーダーシップを担っています。
Scott Wuの兄であるNeal WuもIOI金メダリストで、Google Code Jam 2位の実績を持ちます。Google在籍後にCognitionに参加し、Devinの開発に従事しています。
private company の revenue / valuation / funding は動きが速く、単独の数値だけを article の軸にするとすぐ古くなります。Devin を追うときは、プロダクト発表と組織の動きを anchor にする方が保守しやすいです。
| テーマ | 公式 anchor | この記事での読み方 |
|---|---|---|
| Devin の初出 | Introducing Devin | sandbox で task を進める product positioning を押さえる |
| 利用範囲の広がり | 2025 Performance Review | docs / planning / QA / PR review の使い所を見る |
| IDE との接続 | Cognition’s acquisition of Windsurf | agent 実行と editor workflow をどう寄せるかを見る |
| 日本展開 | DeNA AI Link の公開発表 | rollout と governance の設計を確認する |
Cognitionの買収発表で durable なのは、単一の買収額ではなく 何を統合したいのか です。発表文は、Windsurf の product、IP、team を取り込みながら、Devin の agent execution と IDE workflow を近づける方向を示しています。
この節で見るべき論点は次の通りです。
case study を読むときは、数値そのものよりも task の境界 と 人の review 位置 を先に見ると実務に落とし込みやすくなります。
Goldman Sachs についての公開報道で繰り返し現れるのは、Devin を「万能な代替人員」としてではなく、docs、security fix、test preparation のような backlog task を前に進める補助線として使う見方です。
durable なポイントは、人が問題設定を行い、agent が先に動き、人が最後に review する という operating model にあります。headcount や productivity uplift の数字は時点依存なので、本文では運用モデルの方を重視します。
DeNA AI Link の公開発表では、Devin は日本展開の中心プロダクトとして扱われています。注目すべきなのは人数規模よりも、どの governance を先に整えたか です。
日本企業が参考にすべきなのは、prompt の巧拙よりも、隔離環境・権限設計・review flow をセットで用意する という導入順序です。
スタートアップのGumroadは、Devinを「チームメンバー」として使い倒しました。
バグ修正、設定変更、バージョンアップグレード——定型タスクをDevinに任せ、人間は新機能開発に集中しました。
ブラジル最大のデジタルバンクNubankは、モノリシックコードベースの大規模リファクタリングという難題を抱えていました。
人間だけでは何年もかかる作業。Devinを投入した結果:
特に劇的な効果が出たのは、セキュリティ脆弱性の修正です。
| 指標 | 人間開発者 | Devin | 効率向上 |
|---|---|---|---|
| 修正時間 | 30分/脆弱性 | 1.5分/脆弱性 | 20倍 |
セキュリティ修正時間の比較2026年にはシステムインテグレーター大手との提携も進んでいます:
Devinは18ヶ月の運用で、以下の改善を達成しています:
| 指標 | 昨年 | 今年 | 改善率 |
|---|---|---|---|
| 問題解決速度 | - | - | 4倍 |
| リソース消費効率 | - | - | 2倍 |
| PRマージ率 | 34% | 67% | 約2倍 |
「Devin と Cursor、どちらを使うべき?」——結論から言うと、両者は競合ではなく、補完関係にあります。
| 比較項目 | Devin | Cursor |
|---|---|---|
| 開発元 | Cognition Labs | Anysphere |
| 料金 | $20/月〜(Core)、$500/月(Team) | $20/月(Pro)、$40/月(Business) |
| 動作方式 | 完全自律型(タスク全体を完了) | インタラクティブ支援(対話しながら開発) |
| 応答時間 | 12-15分(タスク完了まで) | 数秒(即座に提案) |
| 統合方式 | GitHub/Slack/Windsurf IDE | VS Code互換IDE |
| 操作感 | 「人と働いている」感覚 | 「ツールを使っている」感覚 |
| 開発者コントロール | 低(委任型) | 高(対話型) |
| コード品質 | 不要なパッケージを含む傾向 | クリーンでフォーカスされた傾向 |
| 得意なタスク | 複数ファイル変更、PR作成、定型作業 | 現在のファイル編集、即座のコード生成 |
| 日本語対応 | 対応(プロンプト入力可) | 対応(UI・プロンプト両方) |
| ARR | $155M(2025年7月) | $1B超(2025年11月) |
結論: 日常コーディングはCursor、定型タスクの自動化はDevin。Goldman Sachsの事例では、GitHub Copilotの20%効率向上に対し、Devinは3-4倍の生産性向上を報告しています。
| 観点 | Devin | GitHub Copilot |
|---|---|---|
| アプローチ | 自律型AIソフトウェアエンジニア | リアルタイムIDE内支援 |
| 動作環境 | 独自サンドボックス / Windsurf IDE | IDE内(VS Code, IntelliJ等) |
| タスク範囲 | 計画→コード→テスト→デプロイ | 即時のインライン補完 |
| デバッグ | コード実行→エラー確認→検索→修正→再実行 | コンテキストベースの提案 |
| 価格 | $20/月〜(Core) | $10/月/ユーザー |
| 最適な用途 | 自己完結型の機能開発 | タイピング速度とフローの向上 |
| 観点 | Devin | Replit Agent |
|---|---|---|
| フォーカス | ソフトウェア開発の自動化 | アプリケーションの高速構築 |
| 実行環境 | 独自サンドボックス / Windsurf IDE | Replit クラウドIDE |
| ターゲット | プロのエンジニア・チーム | 個人開発者・プロトタイパー |
| 対応言語 | 30以上のプログラミング言語 | 30以上のプログラミング言語 |
| デプロイ | GitHub PR → 既存CI/CDフロー | Replit内でワンクリックデプロイ |
| 価格 | $20/月〜 | $25/月〜 |
| 最適な用途 | 既存コードベースの保守・改善 | ゼロからのアプリ構築・プロトタイプ |
| 観点 | Devin | Lovable |
|---|---|---|
| フォーカス | 汎用ソフトウェアエンジニアリング | React/TypeScript Webアプリの高速生成 |
| コード品質 | タスク依存(監督が必要) | クリーンなReact/TypeScriptコード |
| DB連携 | 任意のDB・インフラに対応 | Supabaseネイティブ統合 |
| 評価額 | $10.2B | $1.14B |
| ARR | $155M | $35M |
| 最適な用途 | エンタープライズ開発の自動化 | MVPの高速プロトタイピング |
| 観点 | Devin | Claude Code |
|---|---|---|
| 開発元 | Cognition Labs | Anthropic |
| 動作方式 | 完全自律型(サンドボックス内) | ターミナルベースの対話型エージェント |
| 課金 | ACU従量課金($20/月〜) | API従量課金 |
| 実行環境 | クラウドサンドボックス | ローカルマシン |
| 強み | エンドツーエンドの自動化 | 深いコンテキスト理解、柔軟な対話 |
| 最適な用途 | 定型タスクの委任 | 複雑な設計判断を伴う開発 |
多くの開発者は、複数のツールを併用しています:
| 場面 | 推奨ツール | 理由 |
|---|---|---|
| 日常のコーディング | Cursor / Copilot | 即座の補完でフロー維持 |
| 定型タスクの自動化 | Devin | 委任して放置、PR完成を待つ |
| ゼロからのプロトタイプ | Lovable / Replit | 対話的に素早くMVP構築 |
| 複雑な設計・リファクタリング | Claude Code | 深い文脈理解で適切な判断 |
AIコーディングツール市場は爆発的な成長を遂げています。
| 指標 | 数値 |
|---|---|
| 2025年 市場規模 | $4.7B(約7,050億円、Gartner推計) |
| 2033年 予測規模 | $14.6B(約2.2兆円) |
| CAGR(年平均成長率) | 15.3%(2026-2033年) |
| 開発者のAIツール採用率 | 84%(利用中または利用予定) |
2024年中盤から2025年にかけて、AIコーディングスタートアップの合計評価額は350%成長しました。
| 企業 | 評価額 | ARR | 特記事項 |
|---|---|---|---|
| Cognition(Devin) | $10.2B | $155M | Windsurf統合、73倍成長 |
| Anysphere(Cursor) | $9.9B | $1B超 | 10ヶ月で$100M→$1B |
| Replit | $1.16B | 非公開 | クラウドIDEベース |
| Lovable | $1.14B | $35M | プロンプト→アプリ生成 |
Cognitionは2025年のパフォーマンスレビューで、PRマージ率67%を公表しました。これは昨年の34%から約2倍の改善です。ただし、タスクの種類によって大きく異なる点に注意が必要です。
PRマージ率67%の内訳2025年1月、AIリサーチ企業Answer.AIが冷水を浴びせるレポートを公開しました。3人のデータサイエンティストで20の実世界コーディング課題をDevinに与えた結果:
| 結果 | タスク数 | 割合 |
|---|---|---|
| 成功 | 3 | 15% |
| 失敗 | 14 | 70% |
| 結論なし | 3 | 15% |
成功率15%。Goldman Sachsの華々しい報告とは、あまりにもかけ離れた数字でした。
最も深刻だったのは、パフォーマンスの予測不可能性です。
"More concerning was our inability to predict which tasks would succeed. Even tasks similar to our early wins would fail in complex, time-consuming ways."
「より懸念されるのは、どのタスクが成功するか予測できないことでした。初期の成功と似たタスクでさえ、複雑で時間のかかる方法で失敗しました」
— Answer.AI
さらに衝撃的だったのは、ハルシネーション(幻覚)問題です。
あるタスクで、DevinはRailway(クラウドプラットフォーム)に単一デプロイメントで複数アプリケーションをデプロイしようとしました。問題は、Railwayにそんな機能は存在しないということ。
Devinは存在しない機能を「幻覚」しながら、1日以上かけて様々なアプローチを試行し続けました。人間なら10分で「これは無理だ」と気づくことに、丸1日を費やしたのです。
"Cognition overpromises with Devin, refuses to touch upon critical limitations of the systems, and relies on demos that feel very bait and switch-y."
「Cognitionは過剰な約束をし、システムの重要な限界に触れず、チェリーピッキングされたデモに依存している」
— Answer.AI
Answer.AIの結論は、「使い方次第」 というものでした。
Devinはシニアエンジニアの代替ではありません。「ジュニアエンジニア」として扱う必要があります:
正しく使えば、定型タスクの自動化で大きな効果を発揮する。しかし、「AIエンジニアに丸投げ」はできない——これがAnswer.AIの結論でした。
| スキル | レベル |
|---|---|
| コードベース理解 | シニアレベル |
| 実行能力 | ジュニアレベル |
| キャパシティ | 無制限(24時間稼働、並列実行可能) |
| ソフトスキル | 苦手(ステークホルダー管理、メンタリング不可) |
フロントエンド、バックエンド、DevOps専門の異なるDevinが同期された「スクワッド」として連携し、人間のコード入力なしでプラットフォーム全体を構築する未来が描かれています。
エンジニアの役割は、「コードを書く」から「タスクを定義し、AIの作業を監督する」へシフトしていく可能性があります。Goldman SachsのCIO Marco Argentiはこれを「ハイブリッドワークフォース」と呼びます。
Windsurf IDEとDevinの統合により、2026年後半には「最初の完全AI駆動開発環境」の実現を目指しています。開発者がIDEから離れることなく、自律型エージェントと対話型IDEのメリットを両立できる世界です。
2026年3月のDeNA全社導入は、日本におけるDevin活用の重要なマイルストーンです。
DeNAの導入プロセスは、日本企業がDevinを導入する際のモデルケースとなります:
| 課題 | DeNAの対応 |
|---|---|
| セキュリティ要件 | VPC版をクラウド環境に独立配備、物理隔離 |
| 認証管理 | SSO連携を含む独自認証・認可システム構築 |
| 部門別最適化 | 各事業部門のドメインに合わせたカスタマイズ |
| オフショア連携 | 検収・品質管理の「日単位→分単位」短縮 |
日本企業の状況に応じた選択肢:
| ニーズ | 推奨ツール | 理由 |
|---|---|---|
| エンタープライズ全社導入 | Devin Enterprise | VPC/SSO対応、DeNAの前例あり |
| チーム開発の効率化 | Cursor Business | 日本語UI対応、低コスト |
| 個人開発者の生産性向上 | GitHub Copilot | 最も安価、IDE統合が充実 |
| プロトタイプ高速構築 | Lovable / Replit | コード不要でMVP構築可能 |
検索でよく調べられている質問に回答します。
Q: Devinの料金は?
A: 月額$20(約3,000円)から利用可能です。2025年4月のDevin 2.0リリースで96%値下げされました。
| プラン | 月額 | 特徴 |
|---|---|---|
| Core | $20〜(約3,000円〜) | 個人開発者向け、9 ACU含む(1ACU=$2.25) |
| Team | $500(約75,000円) | 250 ACU含む、Slack/API連携可能 |
| Enterprise | カスタム | VPCデプロイ、SSO、カスタムDevin対応 |
Coreプランでは$20で2〜3タスク程度を試せます。
Q: Devinは日本語対応している?
A: はい、対応しています。プロンプト(タスク指示)は日本語で入力可能です。ただし、UIは英語のみです。日本語でのタスク依頼例:
コード生成やコミットメッセージは英語が推奨されますが、日本語でのやり取りは問題なく機能します。
Q: CursorとDevinどちらがいい?
A: 用途によって使い分けるのがベストです。両者は競合ではなく補完関係にあります。
| 比較 | Devin | Cursor |
|---|---|---|
| 料金 | $20/月〜 | $20/月〜 |
| 動作 | 自律型(タスク全体を完了) | 対話型(リアルタイム支援) |
| 応答 | 12-15分 | 数秒 |
| 向いている人 | 定型タスクを自動化したい | コーディング効率を上げたい |
結論: 日常コーディングはCursor、定型タスクの自動化はDevin。多くの開発者は両方を併用しています。
Q: Devinの使い方は?
A: 3つの方法があります。
@Devin タスク内容 とメンション初めての方はSessionから試すのがおすすめです。
Q: Devinの実際の性能は?PRマージ率67%は信用できる?
A: PRマージ率67%はCognition公式発表の数値ですが、タスクの種類によって大きく異なります。
得意なタスク(マージ率高): ドキュメンテーション、テスト作成、バグ修正、小規模な反復タスク
苦手なタスク(マージ率低): 曖昧な要件のタスク、視覚デザイン、要件変更が多いタスク
Answer.AIの独立テストでは20タスク中3成功・14失敗という結果も出ており、「ジュニアエンジニアレベルの扱いが必要」と評価されています。
Q: Scott Wuはどんな人?
A: 1997年生まれの競技プログラマー出身の起業家です。IOI(国際情報オリンピック)3年連続金メダル、2014年は満点600点で世界1位。ハーバード大学卒業後、Lunchclub共同創業($55.9M調達)を経て、2023年にCognition Labsを創業しました。
Q: Goldman SachsはなぜDevinを導入した?
A: 12,000人のエンジニアを抱えるGoldman Sachsでも、定型タスク(セキュリティ修正、ドキュメント更新)が滞留していました。GitHub Copilotの20%効率向上では不十分だったため、Devinを導入。結果、3-4倍の生産性向上を報告しています。「Employee #1」として数百のDevinインスタンスを運用中です。
Q: Devinの限界は?
A: Answer.AIの独立テストで明らかになった主な限界:
正しい活用には「明確な要件」「検証可能な結果」「人間による監督」が必須です。
Q: 日本企業はDevinを導入すべき?
A: 以下の条件に当てはまるエンタープライズ企業には検討価値があります:
DeNAは2,000人超への全社導入でコードマイグレーション6倍効率化を実現しています。個人開発者やスタートアップには、Cursor($20/月〜)が現実的な選択肢です。
Q: ACU(Agent Compute Unit)とは?
A: Devinが行う作業を測定する独自の単位です。タスク実行時、ブラウザ操作時、コンテキスト収集時に消費されます。ユーザーの応答待ち、テスト実行待ち、リポジトリのセットアップ時には消費されません。Coreプラン($20/月)には9 ACU、Teamプラン($500/月)には250 ACUが含まれます。
Q: DevinとLovable/Replitの違いは?
A: 目的が異なります。Devinは既存コードベースの保守・改善(PR作成、バグ修正、マイグレーション)に強く、LovableやReplitはゼロからのアプリ構築やプロトタイピングに向いています。プロのエンジニアチームにはDevin、MVPの高速構築にはLovable/Replitという棲み分けです。
Q: Windsurf買収でDevinはどう変わった?
A: Cognitionは2025年7月にWindsurf(旧Codeium)を推定$250Mで買収し、IDE + エージェントの統合を実現しました。Windsurf IDEの中からDevinを直接起動でき、対話型IDEと自律型エージェントのメリットを同一環境で享受できます。ARRは$82Mが加算され、$155Mに到達しました。
Q: Devinのセキュリティは大丈夫?
A: Enterprise版ではVPCデプロイメント(専用クラウド環境での隔離実行)、SSO対応、カスタムDevin設定が可能です。DeNAの事例では、独立した物理隔離環境にVPC版を配備し、独自の認証・認可管理システムを構築しています。サンドボックス環境での実行と、Planning/PRの2段階承認チェックポイントもセキュリティ対策です。
Q: SWE-1.5とは何?
A: 2025年10月にCognitionがリリースした独自の高速コーディングモデルです。Cerebrasとの提携により950トークン/秒の推論速度を実現(Claude Sonnet 4.5の13.7倍)。SWE-Bench Proでは40.08%のスコアで、性能と速度を両立しています。Windsurf IDEで利用可能です。
Q: 個人開発者がDevinを試すには?
A: Coreプラン(月額$20〜)から始められます。devin.aiにアクセスし、GitHubアカウントで登録するだけで利用開始できます。まずはSessionモードで「READMEの更新」「テスト追加」など小さなタスクから試すのがおすすめです。$20で約9 ACU(2〜3タスク分)を利用できます。
冒頭の問いに戻りましょう。
「フェイクだ」「チェリーピッキングされたデモだ」——2024年3月の批判は、正しかったのでしょうか?
答えは、「半分正しく、半分間違い」 です。
正しかった点:Devinは万能ではありません。Answer.AIのテストが示したように、20タスク中14タスクで失敗します。曖昧な指示には弱く、「ジュニアエンジニアレベルの扱い」が必要です。
間違っていた点:Devinは「フェイク」ではありませんでした。Goldman Sachsは12,000人のエンジニアと並べて導入し、3-4倍の生産性向上を報告しています。DeNAは全社2,000人に展開し、コードマイグレーション6倍効率化を実現しました。
Devinは「AIがエンジニアを置き換える」未来ではありません。
「人間とAIが協働する」未来の、最初の一歩です。
エンジニアの役割は「コードを書く」から「タスクを定義し、AIの作業を監督する」へ。Scott Wuが9歳で魅了された「アイデアを現実に変える能力」は、AIによってさらに加速されようとしています。
| 項目 | 内容 |
|---|---|
| 創業者 | Scott Wu(IOI 3年連続金メダル、14歳で世界1位) |
| 技術 | Reason→Act→Observe→Correctループによる自律実行 |
| 実績 | PRマージ率67%、Goldman Sachs・DeNA導入、ARR $155M |
| 限界 | Answer.AIテストで20タスク中14失敗、ジュニアレベルの扱いが必要 |
| 評価額 | $10.2B(約1.5兆円)、18ヶ月で達成 |
| 料金 | $20/月〜(Core)、$500/月(Team) |
本記事はネクサフローのAI研究シリーズの一部です。
この記事の著者

代表取締役
早稲田大学卒業後、ソフトバンク株式会社にてAI活用やCEO直下案件のプロジェクトマネージャーに従事。その後、不動産スタートアップPit in株式会社の創業、他スタートアップでの業務改善・データ活用を経験後、2023年10月、株式会社ネクサフローを創業し代表取締役CEO就任。
次に読む

Cursor、Devin、Lovable、Replit、LangChain は同じ土俵の競合ではありません。AI-native IDE、非同期エージェント、ブラウザ開発、prompt-first app builder、エージェント基盤という5つの surface に分けて、選び方を整理します。

Chain-of-Thought(CoT)は、答えだけでなく途中の推論ステップを例示・出力させることで、複数ステップの算術や論理問題を解きやすくするプロンプト技法です。2022年の論文で報告されたGSM8Kの17.9%→58.1%という改善を起点に、Few-shot / Zero-shotの違い、モデルサイズ依存、忠実性とコストの注意点を整理します。

Swarm は、Agent と handoff を最小単位にした lightweight な multi-agent orchestration の実験実装です。本記事では popularity や年次の話ではなく、README とサンプルから読み取れる責務分割、context_variables の扱い、運用へ持ち込む前に確認すべき論点を整理します。