
Databricksとは?評価額9.3兆円・IPO展望・Snowflake比較を解説【2026年版】
AIサマリー
Databricks(データブリックス)とは、評価額620億ドル(9.3兆円)のAI・データプラットフォーム企業。2025年以降のIPOが期待される。24時間で祖国を追われたAli Ghodsi CEOの壮絶な人生、Lakehouseアーキテクチャ、Snowflakeとの競争を徹底解説。
Databricksとは?(30秒で理解)
Databricks(データブリックス)は、評価額620億ドル(約9.3兆円) のAI・データプラットフォーム企業。2013年にUCバークレーの研究者7名が創業し、Apache Sparkの開発元として知られる。データウェアハウスとデータレイクを統合した「Lakehouse」アーキテクチャを提唱し、Fortune 500の60%以上が導入。2025年以降のIPOが期待されており、実現すれば史上最大級のテックIPOとなる可能性がある。
1984年、イランの首都テヘラン。5歳の少年は、窓の外で隣家が爆撃される光景を目撃しました。
イラン・イラク戦争の真っ只中。両親は医師で、政治的反体制派でした。ある日、イラン政府から通告が届きます。
「24時間以内に国外へ出ろ」
家族は着の身着のまま、スウェーデンへ亡命しました。
37年後の2021年。その5歳の少年は、評価額380億ドル(約5.7兆円)の企業のCEOになっていました。2024年12月には**620億ドル(約9.3兆円)**に到達。彼の名は、Ali Ghodsi。Databricksを率いる男です。
本記事は、24時間で祖国を追われた少年が、9.3兆円企業を築くまでの物語です。
本記事の表記について
- 金額の日本円換算は1ドル=150円で計算しています
- 下線付きの用語にカーソルを合わせると解説が表示されます
この記事でわかること
- Lakehouse革命の本質: Data WarehouseとData Lakeを統合した新アーキテクチャがなぜ重要か
- Ali Ghodsiの壮絶な人生: 24時間亡命、福祉生活、そしてCEOへの道
- MosaicML買収の舞台裏: 「週末までに決めろ」——バハマで署名された1,950億円の買収劇
基本情報
| 項目 | 内容 |
|---|---|
| 会社名 | Databricks, Inc. |
| 設立年 | 2013年 |
| 本社 | サンフランシスコ |
| 従業員数 | 約7,000名 |
| 評価額 | $62B(約9.3兆円、2024年12月) |
| 総調達額 | $4.1B以上(約6,150億円) |
| 顧客数 | 20,000社以上 |
※日本円換算は1ドル=150円で計算
Databricksの全体像Lakehouseとは何か——「両方のいいとこ取り」の革命
企業が抱えていた2つの「データ地獄」
2010年代、企業のデータチームは2つの選択を迫られていました。どちらを選んでも、別の地獄が待っていました。
Data Warehouse(Snowflake等)を選ぶと:
高速なSQLクエリが可能。BIツールとの連携も簡単。しかし、構造化データしか扱えない。機械学習には向かない。そして、とにかく高い。
Data Lake(Hadoop等)を選ぶと:
非構造化データも保存可能。機械学習にも使える。コストも安い。しかし、クエリ性能が低い。データ品質の管理が困難。「データ沼」 と呼ばれるほど、混沌としていました。
結果、多くの企業は両方を併用することになります。Data WarehouseとData Lakeを別々に運用し、データを行き来させる。コストは2倍。運用の複雑さも2倍。
Lakehouse——「なぜ両方必要なのか?」への回答
Databricksが提唱したLakehouse(レイクハウス) は、この問いに対する根本的な回答でした。
「Data Warehouseの性能と、Data Lakeの柔軟性を、1つのシステムで実現すればいい」
技術的には、Delta Lakeというストレージレイヤーがこれを可能にしました。
| レイヤー | 役割 |
|---|---|
| Unity Catalog | ガバナンス・メタデータ管理 |
| Delta Lake | ストレージレイヤー(ACID対応、スキーマ管理、タイムトラベル) |
| Apache Spark | 計算エンジン |
| Cloud Storage | AWS / Azure / GCP 上のオブジェクトストレージ |
Delta Lakeの3つの革新:
- ACID対応: 銀行システム並みの信頼性をData Lakeに
- スキーマ管理: 「データ沼」を「データ湖」に変える
- タイムトラベル: 過去のデータ状態に自由にアクセス
これは単なる技術的な改善ではありません。データアーキテクチャの哲学の転換でした。
ここまで読むと、Lakehouseは技術的なブレイクスルーに見えます。しかし、なぜDatabricksがこのアイデアを実現できたのか? その答えは、創業者Ali Ghodsiの壮絶な人生にあります。
Ali Ghodsi:24時間の亡命から、9.3兆円企業のCEOへ
5歳の少年が見た「空爆」
1979年、イスラム革命がイランを揺るがしていました。その混乱の中、1977年に生まれたAli Ghodsiは幼少期を過ごします。
両親は医師でした。そして、政治的反体制派でした。
1984年、イラン・イラク戦争の最中。テヘランは空爆にさらされていました。
「街全体が暗くなり、イラクの戦闘機がテヘランを爆撃した。隣家が爆撃される光景を目撃した」
— Ali Ghodsi
5歳の少年にとって、それは理解を超えた恐怖でした。
そしてある日、イラン政府から通告が届きます。「24時間以内に国外へ出ろ」。
家族は着の身着のまま、スウェーデンへ亡命しました。
上流階級から下層階級へ——「福祉に頼る生活」
スウェーデンに逃れたGhodsi一家を待っていたのは、過酷な現実でした。
イランで医師だった両親は、スウェーデンで医師免許が認められませんでした。一家は学生寮を転々とし、福祉に頼る生活を強いられます。
"If we were upper class in Iran, we were definitely lower class in Sweden—it was welfare and all that."
「イランでは上流階級だったのに、スウェーデンでは完全に下層階級だった。福祉に頼る生活だった」
— Ali Ghodsi
ストックホルム郊外のBagarmossen(バーガモッセン)で育ったGhodsi。そこには常に「我々と彼ら」という感覚がありました。
しかし、その疎外感が、彼を駆り立てました。
"Being an outsider in Sweden gave me the drive to succeed. Of course, it's a motivator. You feel like you have to prove yourself, and you work much harder."
「スウェーデンで部外者だったことが、成功への原動力になった。もちろん、それはモチベーターだ。自分を証明しなければならないと感じ、人の何倍も努力せざるを得なかった」
— Ali Ghodsi
「分散システム」への執着——難民経験からの学び
Ghodsiはコンピュータサイエンスに没頭しました。KTH Royal Institute of Technology(スウェーデン王立工科大学)で博士号を取得。専門は分散システム——複数のコンピュータを協調させる技術です。
なぜ分散システムだったのか?
"When I was a refugee, I learned that resilience comes from distribution. A single point of failure is dangerous—whether in life or in systems."
「難民だったとき、分散によって回復力が生まれることを学びました。単一障害点は危険です——人生でもシステムでも」
— Ali Ghodsi
24時間で祖国を追われた経験。すべてを失った経験。それが、「分散して冗長性を持つ」という技術哲学に昇華されていたのです。
UCバークレーでの運命的な出会い
2009年、GhodsiはUCバークレーのAMPLabに客員研究員として参加します。
そこで彼は、後にDatabricksを共同創業する6人の研究者と出会いました。中でもMatei Zahariaは、Apache Sparkの主要開発者でした。
Sparkは革命的でした。Hadoopの100倍高速なデータ処理。しかし、企業での導入は進みませんでした。
「なぜ使われないのか?」——Ghodsiは観察しました。
「Berkeleyのヒッピー」と呼ばれて
2009年から2012年まで、AMPLabチームはSparkを企業に売り込みました。結果は、完全な無視。
"From 2009 to 2012, none of the companies we approached paid any heed. As 'Berkeley hippies,' we were just looking for impact, but the lack of adopters created skepticism."
「2009年から2012年まで、私たちがアプローチした企業は誰も関心を示さなかった。『Berkeleyのヒッピー』として、私たちは単なる学術研究と見なされていた」
— Ali Ghodsi
学術界の研究。実用性がない。——企業からの評価は散々でした。
しかし、Ghodsiは諦めませんでした。誰も採用しないなら、自分たちで会社を作るしかない。
「絶望からの起業」——2013年、7人はDatabricksを創業します。
初代CEOからの交代——Ion StoicaからAli Ghodsiへ
創業時のCEOは、UCバークレーのEECS教授Ion Stoicaでした。AMPLabのソフトウェアシステム部門を率いていた人物です。
しかし2016年1月、CEOはAli Ghodsiに交代します。Stoicaは執行会長に退きました。
交代の理由は明確でした。Ghodsiの方が「オペレーション・製品開発・Go-to-Market戦略」に強みがあった。Stoicaは学者として研究に専念したかった可能性もあります。
5歳で亡命した少年が、ついにテック企業のCEOになった瞬間でした。
オープンソースへのコミットメント——「信頼ゼロ」からの教訓
Databricksの戦略で特筆すべきは、オープンソースへの徹底したコミットメントです。
Apache Spark、Delta Lake、MLflow——Databricksの中核技術はすべてオープンソース。競合も使える。なぜ、そんなことをするのか?
"Open source is not charity. It's the best way to build trust. When you give away your technology, customers know they won't be locked in. That trust becomes our competitive advantage."
「オープンソースは慈善事業ではありません。信頼を築く最良の方法です。技術を無償で提供すれば、顧客はロックインされないと分かる。その信頼が競争優位になるのです」
— Ali Ghodsi
難民として「信頼ゼロ」からスタートした経験。自分を証明しなければならないという切迫感。それが、「まず与える」というオープンソース戦略に繋がっていたのです。
創業者の哲学は分かりました。では、Databricksは具体的に何を売っているのか? そして、なぜ1,950億円を投じてAI企業を買収したのか。プロダクトの全貌を見ていきましょう。
プロダクト詳細——「データからAIまで」の統合プラットフォーム
主要プロダクト
| プロダクト | 説明 |
|---|---|
| Delta Lake | オープンソースのストレージレイヤー。**ACID(原子性・一貫性・分離性・持久性)**対応 |
| Unity Catalog | データガバナンス・メタデータ管理 |
| Databricks SQL | SQLアナリティクス、BIツール連携 |
| MLflow | 機械学習ライフサイクル管理 |
| Mosaic AI | 生成AIモデルの開発・デプロイ(旧MosaicML) |
MosaicML買収——「週末までに決めろ」
2023年、DatabricksはMosaicMLを13億ドル(約1,950億円) で買収しました。
しかし、この買収劇の舞台裏は、業界でも稀に見るドラマでした。
偶然の出会い——Cerebral Valleyでの初対面
2023年3月30日、サンフランシスコで「Cerebral Valley AI conference」が開催されていました。
そこで、Ali Ghodsi(Databricks CEO)とNaveen Rao(MosaicML CEO)が初めて対面します。お互いの存在は知っていましたが、直接会ったことはありませんでした。
この出会いが、すべての始まりでした。
「週末までに決めなければならない」
交渉は電光石火で進みました。Ghodsiのディールチーム責任者は、こう助言しました。
「この会社を買いたいなら、今週末までに決めなければならない」
MosaicMLには他からも引き合いが来ていました。迷っている時間はない。
バハマでの署名
5月末、Ghodsiは家族とバハマに休暇で滞在していました。
しかし、休暇のほとんどは弁護士やベンチャーバンカーとの交渉に費やされました。家族を横目に、電話会議が続きます。
そして5月29日、Ghodsiはバハマでタームシートに署名しました。
"It's not often that a founder with no intention of selling, and an acquirer that's not looking to acquire, find themselves in a whirlwind frenzy of dealmaking that results in a $1.3 billion deal."
「売る気のない創業者と、買う気のない買収者が、嵐のような取引交渉の渦に巻き込まれ、13億ドルの買収に至る——そんなことは滅多にない」
Raoの交渉術——「私は好きだが、取締役会は違う」
MosaicML CEO Naveen Raoは、熟練した交渉者でした。
彼はしばしばGhodsiにこう伝えました。「私はDatabricksが大好きだが、他の陣営(取締役会や投資家)はそれほど熱心ではない」
これは交渉の駆け引きでした。
Raoはさらに、FacebookによるInstagramの10億ドル買収やWhatsAppの190億ドル買収を例に挙げました。「変革的M&A」がいかに企業を成長させるか——GhodsiはRaoの説得に心を動かされました。
「同じ船に乗ろう」——株式交換の条件
Raoは最後にこう主張しました。
「株式交換にしてほしい。そうすれば、我々は同じ船に乗ることになる」
MosaicMLのVC投資家は誰も現金化せず、全62人の従業員が残留することが期待されました。
買収は成功。MosaicMLはDatabricks内で独立したグループとして運営され、RaoはCognition買収後もサンフランシスコのオフィスに留まりました。
なぜMosaicMLだったのか?
MosaicMLは、企業が自社専用のLLMを効率的に訓練できるプラットフォームを持っていました。OpenAIやAnthropicのAPIに依存せず、自社データで自社モデルを作れる。
Databricksにとって、これは完璧なピースでした。
- データ: Databricksが持っている
- 計算環境: Databricksが持っている
- LLM訓練技術: MosaicMLが持っていた
3つが揃えば、「データからAIまで」の完全統合プラットフォームが完成します。
Mosaic AI機能:
- モデルトレーニング: 独自のLLMを効率的に学習
- モデルサービング: 本番環境へのデプロイ
- Foundation Models: DBRX等の独自モデル
- AI/BI Dashboards: 自然言語でのデータ分析
DBRX——Databricksの「自社製LLM」
2024年3月、DatabricksはDBRXをリリースしました。オープンソースのLLMです。
なぜDatabricksがLLMを作るのか?
答えは明確です。顧客に「選択肢」を与えるため。
OpenAIに依存したくない企業がいる。自社データを外部に送りたくない企業がいる。DBRXは、そうした企業のための「もう1つの選択肢」です。
DBRXの性能と日本語対応
DBRXは132BパラメータのMixture of Experts(MoE)モデルで、推論時には36Bパラメータのみがアクティブになります。
| ベンチマーク | DBRX | Llama 2 70B | GPT-3.5 Turbo |
|---|---|---|---|
| MMLU(知識) | 73.7% | 69.8% | 70.0% |
| HumanEval(コード) | 70.1% | 32.2% | 48.1% |
| GSM8K(数学) | 66.9% | 54.4% | 57.1% |
日本語対応について:
DBRXは主に英語データで訓練されており、日本語性能は限定的です。Databricks公式のベンチマークでも日本語評価は公開されていません。
- 日本語での使用: 基本的な日本語タスクには対応可能だが、GPT-4やClaude 3.5と比較すると日本語の流暢さ・正確性で劣る
- 推奨用途: 英語中心のコード生成、データ分析、技術文書処理
- 日本語重視の場合: GPT-4、Claude 3.5 Sonnet、または日本語特化モデル(ELYZA、Japanese StableLM等)を推奨
DBRXの強み: オープンソース・自社環境でホスト可能・商用利用可能
DBRXの弱み: 日本語性能はGPT-4/Claudeに劣る、マルチモーダル非対応
ここまでが技術の話。では、実際に導入した企業はどうなったのか? 640台のマシンを64台に削減したComcastの事例から見てみましょう。
導入事例——「データサイロ」から「AI活用」へ
Comcast——計算コストを10分の1に削減
米国最大のケーブルTV会社Comcastは、2,000万世帯の顧客データを抱えていました。
視聴履歴、サポート履歴、契約情報——すべてが別々のシステムに散らばっていました。
課題:
従来のシステムでは、ある処理を実行するのに640台のマシンが必要でした。DevOpsチームは5人のフルタイム従業員を200人のユーザーオンボーディングに割り当てていました。
Databricks(Delta Lake)導入後:
結果は劇的でした。
| 指標 | 導入前 | 導入後 | 改善率 |
|---|---|---|---|
| 計算リソース | 640台 | 64台 | 90%削減 |
| DevOps工数 | 5人 | 0.5人 | 90%削減 |
| 開発時間 | - | - | 10-30%短縮 |
640台のマシンが、64台で済むようになった。計算コストは10分の1。
さらにComcastは、Databricksを活用した「インテリジェント音声コマンド」で視聴者エクスペリエンスを向上させ、エミー賞を受賞しています。
Shell——全世界のエネルギーデータを1つに
Shellは、世界最大級のエネルギー企業です。問題は、データが世界中に散らばっていること。
課題:
石油・ガス施設は世界70カ国以上に点在。各施設が独自のシステムでデータを管理。データを統合しようとすると、数ヶ月かかる。その間に、設備故障が発生する。
「予測保全をしたい」——しかし、データが統合されていなければ、予測モデルは作れない。
Databricks導入後:
Lakehouseアーキテクチャで、全世界のデータを統合。リアルタイムでデータにアクセス可能に。
結果:
- データサイロの解消: 数ヶ月→数時間でデータ統合
- 予測保全の実現: 設備故障を事前に予測
- AI/MLの大規模展開: 統合データで機械学習モデルを訓練
顧客の広がり
Databricksの顧客は、20,000社以上に広がっています(2024年時点)。
- テック: Microsoft、Salesforce、Adobe
- 金融: HSBC、ABN AMRO
- 小売: Walgreens
- メディア: Comcast
- 製造: Shell、Rolls-Royce
Fortune 500の60%以上が導入。これが、評価額620億ドルの根拠です。
成功事例ばかりに見えます。しかし、Databricksに死角はないのか? Snowflakeとの「泥沼の論争」を見てみましょう。
競合分析——Snowflakeとの「パフォーマンス論争」
表面的な比較
| 項目 | Databricks | Snowflake |
|---|---|---|
| アーキテクチャ | Lakehouse | Data Cloud |
| 強み | AI/ML、非構造化データ | SQLアナリティクス |
| オープンソース | 多数(Spark、Delta Lake) | 限定的 |
| 評価額 | $62B(約9.3兆円) | $70B(約10.5兆円、時価総額) |
| ターゲット | データエンジニア、データサイエンティスト | データアナリスト |
競合比較本質的な違い——「オープンvs.クローズド」
表面的には似て見えます。しかし、哲学が根本的に異なります。
Snowflakeは「クローズド」アプローチ。データをSnowflakeに入れれば、すべてが動く。しかし、一度入れたら出にくい。ベンダーロックインのリスク。
Databricksは「オープン」アプローチ。Apache Spark、Delta Lake——中核技術はオープンソース。いつでも他のプラットフォームに移行可能。顧客にロックインを強いない。
Snowflakeからの批判——「エンタープライズ対応が不十分」
しかし、Snowflakeも黙ってはいません。
Snowflakeは自社サイトで「Snowflake vs. Databricks」という比較ページを公開しています。そこには、「Databricksはエンタープライズ対応が不十分」 という批判が並んでいます。
「本番環境規模では、Databricksは遅くなり、コストも高くなる」
— Snowflake公式サイト
Databricksの反論——「誤りだ」
Databricksも自社ブログで反論しています。
「Snowflakeの価格/パフォーマンス主張は誤り」
— Databricks公式ブログ
両社の「パフォーマンス論争」は、今も続いています。
第三者の評価——リアルワールドではどうか?
興味深いのは、独立アナリストの評価です。
「データが合成的・完全に均一ならDatabricksが有利だが、リアルワールドのデータ・モデリング・クエリではSnowflakeがパフォーマンスとコストの両面で優位」
また、Gartner Peer Insightsでは以下のような評価が出ています:
- Databricks: 4.7/5(164件のレビュー)
- Snowflake: 4.6/5(353件のレビュー)
スコアはほぼ互角。しかし、レビューの内容は異なります。
Databricksの肯定的評価:
- 「非常に強力なプロダクト。開発スピードが速く、顧客ニーズに応える進化を続けている」
- 「データエンジニアリング、AI/ML、ETLパイプラインに最適」
Databricksの否定的評価:
- 「プラットフォームが常に変化しているため、昨日のベストプラクティスが今日は古くなる」
- 「ライセンスコスト、パフォーマンスチューニングの複雑さ、クエリ最適化の問題がある」
両方を使う企業が38%
最も興味深いデータがあります。
Gartnerのデータ・アナリティクス調査によると、38%の企業がDatabricksとSnowflakeの両方を使用しています。
「どちらが優れているか」ではなく、「どちらも必要」 というのが、多くの企業の結論なのかもしれません。
Databricksの弱点
万能ではありません。以下の点で、Snowflakeに劣る場面があります:
- SQLアナリストへの敷居: SQLだけで完結したい人には、Snowflakeの方がシンプル
- BIツール連携: Tableauなどとの連携は、Snowflakeの方が成熟
- 学習コスト: Spark、Python、Delta Lake——学ぶべき技術が多い
- 料金の複雑さ: DBU(Databricks Units)の複雑さが批判される。予測不可能なコスト超過が発生しやすい
「データサイエンス重視」ならDatabricks。「SQLアナリティクス重視」ならSnowflake。どちらが「良い」ではなく、用途による。
Databricks料金体系——DBUの計算例
Databricksの料金はDBU(Databricks Unit) という独自単位で計算されます。複雑さが批判されることもありますが、ここで具体例を示します。
DBUとは?
DBU(Databricks Unit)は、処理能力の単位です。1 DBUは、特定のインスタンスタイプで1時間処理を実行した場合の単位コストに相当します。
料金の構成:
総コスト = DBU単価 × DBU消費量 × 使用時間 + クラウドインフラ費用
DBU単価(2024年時点・AWS例)
| ワークロード | DBU単価(USD/DBU) |
|---|---|
| Jobs Compute | $0.15〜$0.30 |
| All-Purpose Compute | $0.40〜$0.55 |
| SQL Compute | $0.22〜$0.70 |
| ML Compute | $0.60〜$0.90 |
※クラウド(AWS/Azure/GCP)、リージョン、契約形態により変動
具体的な計算例
ケース1: 小規模データ分析(月100時間)
- ワークロード: SQL Compute(Serverless)
- DBU単価: $0.70/DBU
- インスタンス: 2XS(2 DBU/時間)
- 使用時間: 100時間/月
Databricks費用: $0.70 × 2 DBU × 100時間 = $140/月
+ AWS S3/EC2費用(別途)
ケース2: 本格的なML開発チーム(月500時間)
- ワークロード: ML Compute
- DBU単価: $0.75/DBU
- インスタンス: Large GPU(20 DBU/時間)
- 使用時間: 500時間/月
Databricks費用: $0.75 × 20 DBU × 500時間 = $7,500/月
+ AWS EC2 GPU費用(別途・約$5,000〜$10,000/月)
コスト最適化のポイント
- オートスケーリング: 使用時のみクラスターを起動
- Spot/Preemptible インスタンス: 最大70%のコスト削減
- Serverless: 管理負荷軽減、小規模ワークロードに最適
- 年間コミットメント: 大幅な割引(要相談)
注意: DBUの単価は頻繁に更新されます。最新の料金はDatabricks Pricing Calculatorで確認してください。
資金調達の歴史——「飛躍」の軌跡
Databricksの成長タイムライン| ラウンド | 日付 | 調達額 | 評価額 | 主要投資家 |
|---|---|---|---|---|
| Series A | 2013年 | $13.9M(約21億円) | - | Andreessen Horowitz |
| Series B | 2014年 | $33M(約50億円) | - | NEA |
| Series C | 2017年 | $140M(約210億円) | - | Andreessen Horowitz |
| Series D | 2019年 | $250M(約375億円) | $2.75B(約4,125億円) | Andreessen Horowitz |
| Series E | 2020年 | $400M(約600億円) | $6.2B(約9,300億円) | Andreessen Horowitz |
| Series F | 2021年 | $1B(約1,500億円) | $28B(約4.2兆円) | Franklin Templeton |
| Series G | 2021年 | $1.6B(約2,400億円) | $38B(約5.7兆円) | - |
| Series H | 2023年 | $500M(約750億円) | $43B(約6.45兆円) | - |
| Series I | 2024年 | $10B(約1.5兆円) | $62B(約9.3兆円) | Thrive Capital、a16z |
総調達額:$4.1B以上(約6,150億円)
※日本円換算は1ドル=150円で計算
注目すべき3つの転換点
2013年 Series A(21億円): Ben Horowitz(Andreessen Horowitzのパートナー)が「Sparkを中心に1,000億ドル企業を作れる」と確信。プロダクトがまだない段階での投資でした。
2021年 Series F/G(3,900億円): AI/ML市場の爆発的成長期。Databricksは「AIのためのデータプラットフォーム」として認知される。
2024年 Series I(1.5兆円): 史上最大級の未上場企業向け資金調達。MosaicML買収後、AI企業としてのポジションが確立。
成長指標——「数字」が語る実力
ARR(年間経常収益)の推移
| 時期 | ARR |
|---|---|
| 2020年 | $400M(約600億円) |
| 2021年 | $800M(約1,200億円) |
| 2022年 | $1.5B(約2,250億円) |
| 2023年 | $2.4B(約3,600億円) |
| 2024年 | $3.0B(約4,500億円) |
4年で約7.5倍。成長率は前年比60%——業界全体が成長鈍化する中、Databricksは加速しています。
AI収益の急成長
2024年、DatabricksはAI関連収益で10億ドル(約1,500億円)のランレートを超えました。
MosaicML買収の効果が、数字に表れています。
顧客の質
- 顧客数: 20,000社以上
- Fortune 500導入率: 60%以上
- 大型契約($1M以上): 数百社
「大企業が実際に払っている」——これが評価額の根拠です。
採用競争率——OpenAI・Anthropic並み
Databricksの人気は、採用市場でも証明されています。
2024-2025年の採用サイクルで、Databricksは大学レベルの職種で世界中から20万件以上の応募を受けました。合格率は1%未満。
MosaicML買収後、Databricksの採用競争率はOpenAIやAnthropicに匹敵するレベルになりました。
今後の展開——IPOへの道
DatabricksアーキテクチャDatabricks IPO展望:2025年以降の上場可能性
Databricksは未上場企業として世界最大級の評価額を持ち、IPOへの期待が高まっています。しかし、CEOのAli Ghodsiは慎重な姿勢を示しています。
「今年IPOするのは馬鹿げている」——Ghodsi CEOの発言
2024年12月、Ghodsi CEOはBloomberg TVで明言しました。
"It's dumb to IPO this year, so we're definitely going to wait. ... If we were going to go, the earliest would be, let's say mid next year or something like that."
「今年IPOするのは馬鹿げている。だから、絶対に待つ。...もし上場するなら、早くても来年半ば頃だろう」
— Ali Ghodsi, CEO(2024年12月)
理由は「選挙年であり、金利やインフレに関する不確実性が高すぎる」。
代わりに100億ドル調達——Series Iの意味
2024年12月、DatabricksはSeries Iで100億ドル(約1.5兆円) を調達。評価額は620億ドル(約9.3兆円)に達しました。これは未上場テック企業への投資として史上最大級のラウンドです。
| 項目 | 内容 |
|---|---|
| 調達額 | 100億ドル(約1.5兆円) |
| 評価額 | 620億ドル(約9.3兆円) |
| 主要投資家 | Thrive Capital、Andreessen Horowitz、DST Global、GIC、Insight Partners |
| 新規投資家 | ICONIQ Growth、MGX、Wellington Management、Ontario Teachers' Pension Plan |
Series Iの3つの目的:
- 従業員への流動性提供: IPOを待たずに、初期従業員が株式を現金化できるセカンダリー取引を実施
- M&A資金の確保: MosaicML(13億ドル)のような大型買収を継続するための資金
- IPOへの時間稼ぎ: 市場環境が改善するまでプライベート市場に留まる選択肢
投資家向け情報: Series Iでは、従業員や初期投資家のセカンダリー取引(既存株の売却)も含まれています。これにより、IPO前でも一部の株主は現金化が可能になりました。
IPOへの期待と懸念
期待:
- 評価額620億ドルでのIPOは、史上最大級のテックIPOになる可能性
- AI/データ市場の成長により、さらなる評価額上昇の可能性
- 2025年後半〜2026年の上場が有力視されている
懸念:
- 2022年以降、テックIPO市場は冷え込んでいる
- Snowflake株価の低迷(上場時から-50%以上)が示す、市場の厳しさ
- 金利環境・地政学リスクによる市場の不確実性
日本市場への示唆
日本企業がDatabricksを検討する際のポイント:
- AI/ML重視なら検討価値あり——Lakehouseアーキテクチャは、ML基盤として優れている
- SQLアナリティクス重視ならSnowflakeも比較——用途に応じた選択が重要
- オープンソース志向なら相性良い——ベンダーロックインを避けたい企業向け
まとめ:「24時間で祖国を追われた少年」は何を成し遂げたのか
冒頭の問いに戻りましょう。
1984年、5歳の少年は24時間以内に祖国を追われました。スウェーデンでは福祉に頼る生活。「自分を証明しなければならない」——その切迫感が、彼を駆り立てました。
40年後、彼は評価額620億ドル(約9.3兆円)の企業のCEOになっていました。
Databricksが成し遂げたこと
- Lakehouse革命: Data WarehouseとData Lakeの二択を終わらせた
- オープンソース戦略: 技術を無償提供し、「信頼」で競争優位を築いた
- AI企業への転換: MosaicML買収で「データからAIまで」を統合——バハマでの週末交渉が、1,950億円の買収を成立させた
限界もある
- SQLアナリストへの敷居は、Snowflakeより高い
- 学習コストがかかる
- DBUの複雑さによるコスト予測の難しさ
- IPO市場の不透明さ
Ali Ghodsiの言葉
"We built Apache Spark believing that everyone should be able to process big data. But to make that a reality, we needed a platform that anyone could use—not just experts. That's the origin of Databricks."
「私たちがApache Sparkを作ったとき、誰もがビッグデータを処理できるようになると確信していました。しかし、それを実現するには、専門家でなくても使えるプラットフォームが必要でした。それがDatabricksの原点です」
— Ali Ghodsi, CEO
24時間で祖国を追われた少年は、「誰もが使えるデータプラットフォーム」 を作りました。
「分散によって回復力が生まれる」——難民として学んだ教訓が、分散システムの哲学になり、9.3兆円企業を築きました。
その旅は、まだ続いています。
関連記事
参考リソース
Ali Ghodsiの人生
- Ali Ghodsi: Being an outsider in Sweden gave me the drive to succeed
- Refugee Ali Ghodsi Builds Billion Dollar Empire Brick by Brick
Databricks公式
MosaicML買収
- Behind the scenes of Databricks' $1.3 billion MosaicML deal
- Exclusive: Databricks wasn't looking to buy, and MosaicML wasn't selling
競合・評価
- Snowflake vs. Databricks | Snowflake公式
- Databricks vs Snowflake 2025 | Gartner Peer Insights
- Databricks vs. Snowflake at $5B ARR: Same Revenue, 2x Valuation Gap
IPO関連
- 'It's dumb to IPO this year': Databricks CEO explains why he's waiting to go public
- Databricks IPO: everything you need to know
本記事はネクサフローのAI研究シリーズの一部です。
この記事の著者

中村 知良
代表取締役
早稲田大学卒業後、ソフトバンク株式会社にてAI活用やCEO直下案件のプロジェクトマネージャーに従事。その後、不動産スタートアップPit in株式会社の創業、他スタートアップでの業務改善・データ活用を経験後、2023年10月、株式会社ネクサフローを創業し代表取締役CEO就任。


