ブログ

AI、データ活用、業務改善に関する最新情報やNexaflowの取り組みをお届けします

Databricksとは？評価額9.3兆円・IPO展望・Snowflake比較を解説【2026年版】

56分で読める|2026/02/05|

DatabricksLakehouseApache Sparkデータ分析IPODBRX

AIサマリー

Databricks（データブリックス）とは、評価額620億ドル（9.3兆円）のAI・データプラットフォーム企業。2025年以降のIPOが期待される。24時間で祖国を追われたAli Ghodsi CEOの壮絶な人生、Lakehouseアーキテクチャ、Snowflakeとの競争を徹底解説。

Databricksとは？（30秒で理解）

Databricks（データブリックス）は、評価額620億ドル（約9.3兆円） のAI・データプラットフォーム企業。2013年にUCバークレーの研究者7名が創業し、Apache Sparkの開発元として知られる。データウェアハウスとデータレイクを統合した「Lakehouse」アーキテクチャを提唱し、Fortune 500の60%以上が導入。2025年以降のIPOが期待されており、実現すれば史上最大級のテックIPOとなる可能性がある。

1984年、イランの首都テヘラン。5歳の少年は、窓の外で隣家が爆撃される光景を目撃しました。

イラン・イラク戦争の真っ只中。両親は医師で、政治的反体制派でした。ある日、イラン政府から通告が届きます。

「24時間以内に国外へ出ろ」

家族は着の身着のまま、スウェーデンへ亡命しました。

37年後の2021年。その5歳の少年は、評価額380億ドル（約5.7兆円）の企業のCEOになっていました。2024年12月には620億ドル（約9.3兆円）に到達。彼の名は、Ali Ghodsi。Databricksを率いる男です。

本記事は、24時間で祖国を追われた少年が、9.3兆円企業を築くまでの物語です。

本記事の表記について

金額の日本円換算は1ドル=150円で計算しています
下線付きの用語にカーソルを合わせると解説が表示されます

この記事でわかること

Lakehouse革命の本質: Data WarehouseとData Lakeを統合した新アーキテクチャがなぜ重要か
Ali Ghodsiの壮絶な人生: 24時間亡命、福祉生活、そしてCEOへの道
MosaicML買収の舞台裏: 「週末までに決めろ」——バハマで署名された1,950億円の買収劇

基本情報

項目	内容
会社名	Databricks, Inc.
設立年	2013年
本社	サンフランシスコ
従業員数	約7,000名
評価額	$62B（約9.3兆円、2024年12月）
総調達額	$4.1B以上（約6,150億円）
顧客数	20,000社以上

※日本円換算は1ドル=150円で計算

Databricksの全体像

Lakehouseとは何か——「両方のいいとこ取り」の革命

企業が抱えていた2つの「データ地獄」

2010年代、企業のデータチームは2つの選択を迫られていました。どちらを選んでも、別の地獄が待っていました。

Data Warehouse（Snowflake等）を選ぶと:

高速なSQLクエリが可能。BIツールとの連携も簡単。しかし、構造化データしか扱えない。機械学習には向かない。そして、とにかく高い。

Data Lake（Hadoop等）を選ぶと:

非構造化データも保存可能。機械学習にも使える。コストも安い。しかし、クエリ性能が低い。データ品質の管理が困難。「データ沼」 と呼ばれるほど、混沌としていました。

結果、多くの企業は両方を併用することになります。Data WarehouseとData Lakeを別々に運用し、データを行き来させる。コストは2倍。運用の複雑さも2倍。

Lakehouse——「なぜ両方必要なのか？」への回答

Databricksが提唱したLakehouse（レイクハウス） は、この問いに対する根本的な回答でした。

「Data Warehouseの性能と、Data Lakeの柔軟性を、1つのシステムで実現すればいい」

技術的には、Delta Lakeというストレージレイヤーがこれを可能にしました。

レイヤー	役割
Unity Catalog	ガバナンス・メタデータ管理
Delta Lake	ストレージレイヤー（ACID対応、スキーマ管理、タイムトラベル）
Apache Spark	計算エンジン
Cloud Storage	AWS / Azure / GCP 上のオブジェクトストレージ

Delta Lakeの3つの革新:

ACID対応: 銀行システム並みの信頼性をData Lakeに
スキーマ管理: 「データ沼」を「データ湖」に変える
タイムトラベル: 過去のデータ状態に自由にアクセス

これは単なる技術的な改善ではありません。データアーキテクチャの哲学の転換でした。

ここまで読むと、Lakehouseは技術的なブレイクスルーに見えます。しかし、なぜDatabricksがこのアイデアを実現できたのか？ その答えは、創業者Ali Ghodsiの壮絶な人生にあります。

Ali Ghodsi：24時間の亡命から、9.3兆円企業のCEOへ

5歳の少年が見た「空爆」

1979年、イスラム革命がイランを揺るがしていました。その混乱の中、1977年に生まれたAli Ghodsiは幼少期を過ごします。

両親は医師でした。そして、政治的反体制派でした。

1984年、イラン・イラク戦争の最中。テヘランは空爆にさらされていました。

「街全体が暗くなり、イラクの戦闘機がテヘランを爆撃した。隣家が爆撃される光景を目撃した」

— Ali Ghodsi

5歳の少年にとって、それは理解を超えた恐怖でした。

そしてある日、イラン政府から通告が届きます。「24時間以内に国外へ出ろ」。

家族は着の身着のまま、スウェーデンへ亡命しました。

上流階級から下層階級へ——「福祉に頼る生活」

スウェーデンに逃れたGhodsi一家を待っていたのは、過酷な現実でした。

イランで医師だった両親は、スウェーデンで医師免許が認められませんでした。一家は学生寮を転々とし、福祉に頼る生活を強いられます。

"If we were upper class in Iran, we were definitely lower class in Sweden—it was welfare and all that."

「イランでは上流階級だったのに、スウェーデンでは完全に下層階級だった。福祉に頼る生活だった」

— Ali Ghodsi

ストックホルム郊外のBagarmossen（バーガモッセン）で育ったGhodsi。そこには常に「我々と彼ら」という感覚がありました。

しかし、その疎外感が、彼を駆り立てました。

"Being an outsider in Sweden gave me the drive to succeed. Of course, it's a motivator. You feel like you have to prove yourself, and you work much harder."

「スウェーデンで部外者だったことが、成功への原動力になった。もちろん、それはモチベーターだ。自分を証明しなければならないと感じ、人の何倍も努力せざるを得なかった」

— Ali Ghodsi

「分散システム」への執着——難民経験からの学び

Ghodsiはコンピュータサイエンスに没頭しました。KTH Royal Institute of Technology（スウェーデン王立工科大学）で博士号を取得。専門は分散システム——複数のコンピュータを協調させる技術です。

なぜ分散システムだったのか？

"When I was a refugee, I learned that resilience comes from distribution. A single point of failure is dangerous—whether in life or in systems."

「難民だったとき、分散によって回復力が生まれることを学びました。単一障害点は危険です——人生でもシステムでも」

— Ali Ghodsi

24時間で祖国を追われた経験。すべてを失った経験。それが、「分散して冗長性を持つ」という技術哲学に昇華されていたのです。

UCバークレーでの運命的な出会い

2009年、GhodsiはUCバークレーのAMPLabに客員研究員として参加します。

そこで彼は、後にDatabricksを共同創業する6人の研究者と出会いました。中でもMatei Zahariaは、Apache Sparkの主要開発者でした。

Sparkは革命的でした。Hadoopの100倍高速なデータ処理。しかし、企業での導入は進みませんでした。

「なぜ使われないのか？」——Ghodsiは観察しました。

「Berkeleyのヒッピー」と呼ばれて

2009年から2012年まで、AMPLabチームはSparkを企業に売り込みました。結果は、完全な無視。

"From 2009 to 2012, none of the companies we approached paid any heed. As 'Berkeley hippies,' we were just looking for impact, but the lack of adopters created skepticism."

「2009年から2012年まで、私たちがアプローチした企業は誰も関心を示さなかった。『Berkeleyのヒッピー』として、私たちは単なる学術研究と見なされていた」

— Ali Ghodsi

学術界の研究。実用性がない。——企業からの評価は散々でした。

しかし、Ghodsiは諦めませんでした。誰も採用しないなら、自分たちで会社を作るしかない。

「絶望からの起業」——2013年、7人はDatabricksを創業します。

初代CEOからの交代——Ion StoicaからAli Ghodsiへ

創業時のCEOは、UCバークレーのEECS教授Ion Stoicaでした。AMPLabのソフトウェアシステム部門を率いていた人物です。

しかし2016年1月、CEOはAli Ghodsiに交代します。Stoicaは執行会長に退きました。

交代の理由は明確でした。Ghodsiの方が「オペレーション・製品開発・Go-to-Market戦略」に強みがあった。Stoicaは学者として研究に専念したかった可能性もあります。

5歳で亡命した少年が、ついにテック企業のCEOになった瞬間でした。

オープンソースへのコミットメント——「信頼ゼロ」からの教訓

Databricksの戦略で特筆すべきは、オープンソースへの徹底したコミットメントです。

Apache Spark、Delta Lake、MLflow——Databricksの中核技術はすべてオープンソース。競合も使える。なぜ、そんなことをするのか？

"Open source is not charity. It's the best way to build trust. When you give away your technology, customers know they won't be locked in. That trust becomes our competitive advantage."

「オープンソースは慈善事業ではありません。信頼を築く最良の方法です。技術を無償で提供すれば、顧客はロックインされないと分かる。その信頼が競争優位になるのです」

— Ali Ghodsi

難民として「信頼ゼロ」からスタートした経験。自分を証明しなければならないという切迫感。それが、「まず与える」というオープンソース戦略に繋がっていたのです。

創業者の哲学は分かりました。では、Databricksは具体的に何を売っているのか？ そして、なぜ1,950億円を投じてAI企業を買収したのか。プロダクトの全貌を見ていきましょう。

プロダクト詳細——「データからAIまで」の統合プラットフォーム

主要プロダクト

プロダクト	説明
Delta Lake	オープンソースのストレージレイヤー。ACID（原子性・一貫性・分離性・持久性）対応
Unity Catalog	データガバナンス・メタデータ管理
Databricks SQL	SQLアナリティクス、BIツール連携
MLflow	機械学習ライフサイクル管理
Mosaic AI	生成AIモデルの開発・デプロイ（旧MosaicML）

MosaicML買収——「週末までに決めろ」

2023年、DatabricksはMosaicMLを13億ドル（約1,950億円） で買収しました。

しかし、この買収劇の舞台裏は、業界でも稀に見るドラマでした。

偶然の出会い——Cerebral Valleyでの初対面

2023年3月30日、サンフランシスコで「Cerebral Valley AI conference」が開催されていました。

そこで、Ali Ghodsi（Databricks CEO）とNaveen Rao（MosaicML CEO）が初めて対面します。お互いの存在は知っていましたが、直接会ったことはありませんでした。

この出会いが、すべての始まりでした。

「週末までに決めなければならない」

交渉は電光石火で進みました。Ghodsiのディールチーム責任者は、こう助言しました。

「この会社を買いたいなら、今週末までに決めなければならない」

MosaicMLには他からも引き合いが来ていました。迷っている時間はない。

バハマでの署名

5月末、Ghodsiは家族とバハマに休暇で滞在していました。

しかし、休暇のほとんどは弁護士やベンチャーバンカーとの交渉に費やされました。家族を横目に、電話会議が続きます。

そして5月29日、Ghodsiはバハマでタームシートに署名しました。

"It's not often that a founder with no intention of selling, and an acquirer that's not looking to acquire, find themselves in a whirlwind frenzy of dealmaking that results in a $1.3 billion deal."

「売る気のない創業者と、買う気のない買収者が、嵐のような取引交渉の渦に巻き込まれ、13億ドルの買収に至る——そんなことは滅多にない」

Raoの交渉術——「私は好きだが、取締役会は違う」

MosaicML CEO Naveen Raoは、熟練した交渉者でした。

彼はしばしばGhodsiにこう伝えました。「私はDatabricksが大好きだが、他の陣営（取締役会や投資家）はそれほど熱心ではない」

これは交渉の駆け引きでした。

Raoはさらに、FacebookによるInstagramの10億ドル買収やWhatsAppの190億ドル買収を例に挙げました。「変革的M&A」がいかに企業を成長させるか——GhodsiはRaoの説得に心を動かされました。

「同じ船に乗ろう」——株式交換の条件

Raoは最後にこう主張しました。

「株式交換にしてほしい。そうすれば、我々は同じ船に乗ることになる」

MosaicMLのVC投資家は誰も現金化せず、全62人の従業員が残留することが期待されました。

買収は成功。MosaicMLはDatabricks内で独立したグループとして運営され、RaoはCognition買収後もサンフランシスコのオフィスに留まりました。

なぜMosaicMLだったのか？

MosaicMLは、企業が自社専用のLLMを効率的に訓練できるプラットフォームを持っていました。OpenAIやAnthropicのAPIに依存せず、自社データで自社モデルを作れる。

Databricksにとって、これは完璧なピースでした。

データ: Databricksが持っている
計算環境: Databricksが持っている
LLM訓練技術: MosaicMLが持っていた

3つが揃えば、「データからAIまで」の完全統合プラットフォームが完成します。

Mosaic AI機能:

モデルトレーニング: 独自のLLMを効率的に学習
モデルサービング: 本番環境へのデプロイ
Foundation Models: DBRX等の独自モデル
AI/BI Dashboards: 自然言語でのデータ分析

DBRX——Databricksの「自社製LLM」

2024年3月、DatabricksはDBRXをリリースしました。オープンソースのLLMです。

なぜDatabricksがLLMを作るのか？

答えは明確です。顧客に「選択肢」を与えるため。

OpenAIに依存したくない企業がいる。自社データを外部に送りたくない企業がいる。DBRXは、そうした企業のための「もう1つの選択肢」です。

DBRXの性能と日本語対応

DBRXは132BパラメータのMixture of Experts（MoE）モデルで、推論時には36Bパラメータのみがアクティブになります。

ベンチマーク	DBRX	Llama 2 70B	GPT-3.5 Turbo
MMLU（知識）	73.7%	69.8%	70.0%
HumanEval（コード）	70.1%	32.2%	48.1%
GSM8K（数学）	66.9%	54.4%	57.1%

日本語対応について：

DBRXは主に英語データで訓練されており、日本語性能は限定的です。Databricks公式のベンチマークでも日本語評価は公開されていません。

日本語での使用: 基本的な日本語タスクには対応可能だが、GPT-4やClaude 3.5と比較すると日本語の流暢さ・正確性で劣る
推奨用途: 英語中心のコード生成、データ分析、技術文書処理
日本語重視の場合: GPT-4、Claude 3.5 Sonnet、または日本語特化モデル（ELYZA、Japanese StableLM等）を推奨

DBRXの強み: オープンソース・自社環境でホスト可能・商用利用可能

DBRXの弱み: 日本語性能はGPT-4/Claudeに劣る、マルチモーダル非対応

ここまでが技術の話。では、実際に導入した企業はどうなったのか？ 640台のマシンを64台に削減したComcastの事例から見てみましょう。

導入事例——「データサイロ」から「AI活用」へ

Comcast——計算コストを10分の1に削減

米国最大のケーブルTV会社Comcastは、2,000万世帯の顧客データを抱えていました。

視聴履歴、サポート履歴、契約情報——すべてが別々のシステムに散らばっていました。

課題:

従来のシステムでは、ある処理を実行するのに640台のマシンが必要でした。DevOpsチームは5人のフルタイム従業員を200人のユーザーオンボーディングに割り当てていました。

Databricks（Delta Lake）導入後:

結果は劇的でした。

指標	導入前	導入後	改善率
計算リソース	640台	64台	90%削減
DevOps工数	5人	0.5人	90%削減
開発時間	-	-	10-30%短縮

640台のマシンが、64台で済むようになった。計算コストは10分の1。

さらにComcastは、Databricksを活用した「インテリジェント音声コマンド」で視聴者エクスペリエンスを向上させ、エミー賞を受賞しています。

Shell——全世界のエネルギーデータを1つに

Shellは、世界最大級のエネルギー企業です。問題は、データが世界中に散らばっていること。

課題:

石油・ガス施設は世界70カ国以上に点在。各施設が独自のシステムでデータを管理。データを統合しようとすると、数ヶ月かかる。その間に、設備故障が発生する。

「予測保全をしたい」——しかし、データが統合されていなければ、予測モデルは作れない。

Databricks導入後:

Lakehouseアーキテクチャで、全世界のデータを統合。リアルタイムでデータにアクセス可能に。

結果:

データサイロの解消: 数ヶ月→数時間でデータ統合
予測保全の実現: 設備故障を事前に予測
AI/MLの大規模展開: 統合データで機械学習モデルを訓練

顧客の広がり

Databricksの顧客は、20,000社以上に広がっています（2024年時点）。

テック: Microsoft、Salesforce、Adobe
金融: HSBC、ABN AMRO
小売: Walgreens
メディア: Comcast
製造: Shell、Rolls-Royce

Fortune 500の60%以上が導入。これが、評価額620億ドルの根拠です。

成功事例ばかりに見えます。しかし、Databricksに死角はないのか？ Snowflakeとの「泥沼の論争」を見てみましょう。

競合分析——Snowflakeとの「パフォーマンス論争」

表面的な比較

項目	Databricks	Snowflake
アーキテクチャ	Lakehouse	Data Cloud
強み	AI/ML、非構造化データ	SQLアナリティクス
オープンソース	多数（Spark、Delta Lake）	限定的
評価額	$62B（約9.3兆円）	$70B（約10.5兆円、時価総額）
ターゲット	データエンジニア、データサイエンティスト	データアナリスト

競合比較

本質的な違い——「オープンvs.クローズド」

表面的には似て見えます。しかし、哲学が根本的に異なります。

Snowflakeは「クローズド」アプローチ。データをSnowflakeに入れれば、すべてが動く。しかし、一度入れたら出にくい。ベンダーロックインのリスク。

Databricksは「オープン」アプローチ。Apache Spark、Delta Lake——中核技術はオープンソース。いつでも他のプラットフォームに移行可能。顧客にロックインを強いない。

Snowflakeからの批判——「エンタープライズ対応が不十分」

しかし、Snowflakeも黙ってはいません。

Snowflakeは自社サイトで「Snowflake vs. Databricks」という比較ページを公開しています。そこには、「Databricksはエンタープライズ対応が不十分」 という批判が並んでいます。

「本番環境規模では、Databricksは遅くなり、コストも高くなる」

— Snowflake公式サイト

Databricksの反論——「誤りだ」

Databricksも自社ブログで反論しています。

「Snowflakeの価格/パフォーマンス主張は誤り」

— Databricks公式ブログ

両社の「パフォーマンス論争」は、今も続いています。

第三者の評価——リアルワールドではどうか？

興味深いのは、独立アナリストの評価です。

「データが合成的・完全に均一ならDatabricksが有利だが、リアルワールドのデータ・モデリング・クエリではSnowflakeがパフォーマンスとコストの両面で優位」

また、Gartner Peer Insightsでは以下のような評価が出ています：

Databricks: 4.7/5（164件のレビュー）
Snowflake: 4.6/5（353件のレビュー）

スコアはほぼ互角。しかし、レビューの内容は異なります。

Databricksの肯定的評価:

「非常に強力なプロダクト。開発スピードが速く、顧客ニーズに応える進化を続けている」
「データエンジニアリング、AI/ML、ETLパイプラインに最適」

Databricksの否定的評価:

「プラットフォームが常に変化しているため、昨日のベストプラクティスが今日は古くなる」
「ライセンスコスト、パフォーマンスチューニングの複雑さ、クエリ最適化の問題がある」

両方を使う企業が38%

最も興味深いデータがあります。

Gartnerのデータ・アナリティクス調査によると、38%の企業がDatabricksとSnowflakeの両方を使用しています。

「どちらが優れているか」ではなく、「どちらも必要」 というのが、多くの企業の結論なのかもしれません。

Databricksの弱点

万能ではありません。以下の点で、Snowflakeに劣る場面があります:

SQLアナリストへの敷居: SQLだけで完結したい人には、Snowflakeの方がシンプル
BIツール連携: Tableauなどとの連携は、Snowflakeの方が成熟
学習コスト: Spark、Python、Delta Lake——学ぶべき技術が多い
料金の複雑さ: DBU（Databricks Units）の複雑さが批判される。予測不可能なコスト超過が発生しやすい

「データサイエンス重視」ならDatabricks。「SQLアナリティクス重視」ならSnowflake。どちらが「良い」ではなく、用途による。

Databricks料金体系——DBUの計算例

Databricksの料金はDBU（Databricks Unit） という独自単位で計算されます。複雑さが批判されることもありますが、ここで具体例を示します。

DBUとは？

DBU（Databricks Unit）は、処理能力の単位です。1 DBUは、特定のインスタンスタイプで1時間処理を実行した場合の単位コストに相当します。

料金の構成:

総コスト = DBU単価 × DBU消費量 × 使用時間 + クラウドインフラ費用

DBU単価（2024年時点・AWS例）

ワークロード	DBU単価（USD/DBU）
Jobs Compute	$0.15〜$0.30
All-Purpose Compute	$0.40〜$0.55
SQL Compute	$0.22〜$0.70
ML Compute	$0.60〜$0.90

※クラウド（AWS/Azure/GCP）、リージョン、契約形態により変動

具体的な計算例

ケース1: 小規模データ分析（月100時間）

ワークロード: SQL Compute（Serverless）
DBU単価: $0.70/DBU
インスタンス: 2XS（2 DBU/時間）
使用時間: 100時間/月

Databricks費用: $0.70 × 2 DBU × 100時間 = $140/月
+ AWS S3/EC2費用（別途）

ケース2: 本格的なML開発チーム（月500時間）

ワークロード: ML Compute
DBU単価: $0.75/DBU
インスタンス: Large GPU（20 DBU/時間）
使用時間: 500時間/月

Databricks費用: $0.75 × 20 DBU × 500時間 = $7,500/月
+ AWS EC2 GPU費用（別途・約$5,000〜$10,000/月）

コスト最適化のポイント

オートスケーリング: 使用時のみクラスターを起動
Spot/Preemptible インスタンス: 最大70%のコスト削減
Serverless: 管理負荷軽減、小規模ワークロードに最適
年間コミットメント: 大幅な割引（要相談）

注意: DBUの単価は頻繁に更新されます。最新の料金はDatabricks Pricing Calculatorで確認してください。

資金調達の歴史——「飛躍」の軌跡

Databricksの成長タイムライン

ラウンド	日付	調達額	評価額	主要投資家
Series A	2013年	$13.9M（約21億円）	-	Andreessen Horowitz
Series B	2014年	$33M（約50億円）	-	NEA
Series C	2017年	$140M（約210億円）	-	Andreessen Horowitz
Series D	2019年	$250M（約375億円）	$2.75B（約4,125億円）	Andreessen Horowitz
Series E	2020年	$400M（約600億円）	$6.2B（約9,300億円）	Andreessen Horowitz
Series F	2021年	$1B（約1,500億円）	$28B（約4.2兆円）	Franklin Templeton
Series G	2021年	$1.6B（約2,400億円）	$38B（約5.7兆円）	-
Series H	2023年	$500M（約750億円）	$43B（約6.45兆円）	-
Series I	2024年	$10B（約1.5兆円）	$62B（約9.3兆円）	Thrive Capital、a16z

総調達額：$4.1B以上（約6,150億円）

※日本円換算は1ドル=150円で計算

注目すべき3つの転換点

2013年 Series A（21億円）: Ben Horowitz（Andreessen Horowitzのパートナー）が「Sparkを中心に1,000億ドル企業を作れる」と確信。プロダクトがまだない段階での投資でした。

2021年 Series F/G（3,900億円）: AI/ML市場の爆発的成長期。Databricksは「AIのためのデータプラットフォーム」として認知される。

2024年 Series I（1.5兆円）: 史上最大級の未上場企業向け資金調達。MosaicML買収後、AI企業としてのポジションが確立。

成長指標——「数字」が語る実力

ARR（年間経常収益）の推移

時期	ARR
2020年	$400M（約600億円）
2021年	$800M（約1,200億円）
2022年	$1.5B（約2,250億円）
2023年	$2.4B（約3,600億円）
2024年	$3.0B（約4,500億円）

4年で約7.5倍。成長率は前年比60%——業界全体が成長鈍化する中、Databricksは加速しています。

AI収益の急成長

2024年、DatabricksはAI関連収益で10億ドル（約1,500億円）のランレートを超えました。

MosaicML買収の効果が、数字に表れています。

顧客の質

顧客数: 20,000社以上
Fortune 500導入率: 60%以上
大型契約（$1M以上）: 数百社

「大企業が実際に払っている」——これが評価額の根拠です。

採用競争率——OpenAI・Anthropic並み

Databricksの人気は、採用市場でも証明されています。

2024-2025年の採用サイクルで、Databricksは大学レベルの職種で世界中から20万件以上の応募を受けました。合格率は1%未満。

MosaicML買収後、Databricksの採用競争率はOpenAIやAnthropicに匹敵するレベルになりました。

今後の展開——IPOへの道

Databricksアーキテクチャ

Databricks IPO展望：2025年以降の上場可能性

Databricksは未上場企業として世界最大級の評価額を持ち、IPOへの期待が高まっています。しかし、CEOのAli Ghodsiは慎重な姿勢を示しています。

「今年IPOするのは馬鹿げている」——Ghodsi CEOの発言

2024年12月、Ghodsi CEOはBloomberg TVで明言しました。

"It's dumb to IPO this year, so we're definitely going to wait. ... If we were going to go, the earliest would be, let's say mid next year or something like that."

「今年IPOするのは馬鹿げている。だから、絶対に待つ。...もし上場するなら、早くても来年半ば頃だろう」

— Ali Ghodsi, CEO（2024年12月）

理由は「選挙年であり、金利やインフレに関する不確実性が高すぎる」。

代わりに100億ドル調達——Series Iの意味

2024年12月、DatabricksはSeries Iで100億ドル（約1.5兆円） を調達。評価額は620億ドル（約9.3兆円）に達しました。これは未上場テック企業への投資として史上最大級のラウンドです。

項目	内容
調達額	100億ドル（約1.5兆円）
評価額	620億ドル（約9.3兆円）
主要投資家	Thrive Capital、Andreessen Horowitz、DST Global、GIC、Insight Partners
新規投資家	ICONIQ Growth、MGX、Wellington Management、Ontario Teachers' Pension Plan

Series Iの3つの目的：

従業員への流動性提供: IPOを待たずに、初期従業員が株式を現金化できるセカンダリー取引を実施
M&A資金の確保: MosaicML（13億ドル）のような大型買収を継続するための資金
IPOへの時間稼ぎ: 市場環境が改善するまでプライベート市場に留まる選択肢

投資家向け情報: Series Iでは、従業員や初期投資家のセカンダリー取引（既存株の売却）も含まれています。これにより、IPO前でも一部の株主は現金化が可能になりました。

IPOへの期待と懸念

期待:

評価額620億ドルでのIPOは、史上最大級のテックIPOになる可能性
AI/データ市場の成長により、さらなる評価額上昇の可能性
2025年後半〜2026年の上場が有力視されている

懸念:

2022年以降、テックIPO市場は冷え込んでいる
Snowflake株価の低迷（上場時から-50%以上）が示す、市場の厳しさ
金利環境・地政学リスクによる市場の不確実性

日本市場への示唆

日本企業がDatabricksを検討する際のポイント:

AI/ML重視なら検討価値あり——Lakehouseアーキテクチャは、ML基盤として優れている
SQLアナリティクス重視ならSnowflakeも比較——用途に応じた選択が重要
オープンソース志向なら相性良い——ベンダーロックインを避けたい企業向け

まとめ：「24時間で祖国を追われた少年」は何を成し遂げたのか

冒頭の問いに戻りましょう。

1984年、5歳の少年は24時間以内に祖国を追われました。スウェーデンでは福祉に頼る生活。「自分を証明しなければならない」——その切迫感が、彼を駆り立てました。

40年後、彼は評価額620億ドル（約9.3兆円）の企業のCEOになっていました。

Databricksが成し遂げたこと

Lakehouse革命: Data WarehouseとData Lakeの二択を終わらせた
オープンソース戦略: 技術を無償提供し、「信頼」で競争優位を築いた
AI企業への転換: MosaicML買収で「データからAIまで」を統合——バハマでの週末交渉が、1,950億円の買収を成立させた

限界もある

SQLアナリストへの敷居は、Snowflakeより高い
学習コストがかかる
DBUの複雑さによるコスト予測の難しさ
IPO市場の不透明さ

Ali Ghodsiの言葉

"We built Apache Spark believing that everyone should be able to process big data. But to make that a reality, we needed a platform that anyone could use—not just experts. That's the origin of Databricks."

「私たちがApache Sparkを作ったとき、誰もがビッグデータを処理できるようになると確信していました。しかし、それを実現するには、専門家でなくても使えるプラットフォームが必要でした。それがDatabricksの原点です」

— Ali Ghodsi, CEO

24時間で祖国を追われた少年は、「誰もが使えるデータプラットフォーム」 を作りました。

「分散によって回復力が生まれる」——難民として学んだ教訓が、分散システムの哲学になり、9.3兆円企業を築きました。

その旅は、まだ続いています。

参考リソース

Ali Ghodsiの人生

Databricks公式

MosaicML買収

競合・評価

IPO関連

本記事はネクサフローのAI研究シリーズの一部です。

この記事の著者

中村知良

代表取締役

早稲田大学卒業後、ソフトバンク株式会社にてAI活用やCEO直下案件のプロジェクトマネージャーに従事。その後、不動産スタートアップPit in株式会社の創業、他スタートアップでの業務改善・データ活用を経験後、2023年10月、株式会社ネクサフローを創業し代表取締役CEO就任。

この記事をシェア

X Facebook はてな LinkedIn

次に読む

【2026年版】Databricks vs Snowflake徹底比較｜データ分析基盤の選び方

Databricks（評価額9.3兆円）とSnowflake（時価総額10兆円）を徹底比較。Fivetran、dbt Labs、Monte Carloを含む主要5社の機能・料金・ユースケースを解説。38%の企業が両方使う理由とは？データ基盤選定の決定版ガイド。

2026/01/17

データ分析Databricks

Snowflake徹底解説｜史上最大IPO・Buffettが投資した理由【時価総額10兆円】

Snowflake（スノーフレーク）は、ソフトウェア企業史上最大のIPOを達成したData Cloud企業。Warren Buffettが投資、Frank Slootman CEOの経営手腕、Databricksとの競争戦略、Cortex AIの今後まで徹底分析。

2026/01/17

SnowflakeIPO

dbt Labs徹底解説：評価額42億ドル、データ変換の標準を確立した企業を完全分析

評価額42億ドルに到達したdbt Labsの全貌を徹底解説。SQLベースのデータ変換を標準化し、Analytics Engineeringという職種を生み出した革新と、Fivetranとの統合の意味に迫ります。

2026/01/17

AIData

まずは無料相談・資料請求

AIやDXの導入について、具体的な進め方や費用対効果など、まずはお気軽にご相談ください。貴社の状況に合わせた最適なプランをご提案します。

お問い合わせ

お気軽にご相談ください

ブログ

AI、データ活用、業務改善に関する最新情報やNexaflowの取り組みをお届けします

Databricksとは？評価額9.3兆円・IPO展望・Snowflake比較を解説【2026年版】

56分で読める|2026/02/05|

DatabricksLakehouseApache Sparkデータ分析IPODBRX

AIサマリー

Databricksとは？（30秒で理解）

1984年、イランの首都テヘラン。5歳の少年は、窓の外で隣家が爆撃される光景を目撃しました。

イラン・イラク戦争の真っ只中。両親は医師で、政治的反体制派でした。ある日、イラン政府から通告が届きます。

「24時間以内に国外へ出ろ」

家族は着の身着のまま、スウェーデンへ亡命しました。

本記事は、24時間で祖国を追われた少年が、9.3兆円企業を築くまでの物語です。

本記事の表記について

金額の日本円換算は1ドル=150円で計算しています
下線付きの用語にカーソルを合わせると解説が表示されます

この記事でわかること

Lakehouse革命の本質: Data WarehouseとData Lakeを統合した新アーキテクチャがなぜ重要か
Ali Ghodsiの壮絶な人生: 24時間亡命、福祉生活、そしてCEOへの道
MosaicML買収の舞台裏: 「週末までに決めろ」——バハマで署名された1,950億円の買収劇

基本情報

項目	内容
会社名	Databricks, Inc.
設立年	2013年
本社	サンフランシスコ
従業員数	約7,000名
評価額	$62B（約9.3兆円、2024年12月）
総調達額	$4.1B以上（約6,150億円）
顧客数	20,000社以上

※日本円換算は1ドル=150円で計算

Databricksの全体像

Lakehouseとは何か——「両方のいいとこ取り」の革命

企業が抱えていた2つの「データ地獄」

2010年代、企業のデータチームは2つの選択を迫られていました。どちらを選んでも、別の地獄が待っていました。

Data Warehouse（Snowflake等）を選ぶと:

高速なSQLクエリが可能。BIツールとの連携も簡単。しかし、構造化データしか扱えない。機械学習には向かない。そして、とにかく高い。

Data Lake（Hadoop等）を選ぶと:

Lakehouse——「なぜ両方必要なのか？」への回答

Databricksが提唱したLakehouse（レイクハウス） は、この問いに対する根本的な回答でした。

「Data Warehouseの性能と、Data Lakeの柔軟性を、1つのシステムで実現すればいい」

技術的には、Delta Lakeというストレージレイヤーがこれを可能にしました。

レイヤー	役割
Unity Catalog	ガバナンス・メタデータ管理
Delta Lake	ストレージレイヤー（ACID対応、スキーマ管理、タイムトラベル）
Apache Spark	計算エンジン
Cloud Storage	AWS / Azure / GCP 上のオブジェクトストレージ

Delta Lakeの3つの革新:

ACID対応: 銀行システム並みの信頼性をData Lakeに
スキーマ管理: 「データ沼」を「データ湖」に変える
タイムトラベル: 過去のデータ状態に自由にアクセス

これは単なる技術的な改善ではありません。データアーキテクチャの哲学の転換でした。

Ali Ghodsi：24時間の亡命から、9.3兆円企業のCEOへ

5歳の少年が見た「空爆」

1979年、イスラム革命がイランを揺るがしていました。その混乱の中、1977年に生まれたAli Ghodsiは幼少期を過ごします。

両親は医師でした。そして、政治的反体制派でした。

1984年、イラン・イラク戦争の最中。テヘランは空爆にさらされていました。

「街全体が暗くなり、イラクの戦闘機がテヘランを爆撃した。隣家が爆撃される光景を目撃した」

— Ali Ghodsi

5歳の少年にとって、それは理解を超えた恐怖でした。

そしてある日、イラン政府から通告が届きます。「24時間以内に国外へ出ろ」。

家族は着の身着のまま、スウェーデンへ亡命しました。

上流階級から下層階級へ——「福祉に頼る生活」

スウェーデンに逃れたGhodsi一家を待っていたのは、過酷な現実でした。

イランで医師だった両親は、スウェーデンで医師免許が認められませんでした。一家は学生寮を転々とし、福祉に頼る生活を強いられます。

"If we were upper class in Iran, we were definitely lower class in Sweden—it was welfare and all that."

「イランでは上流階級だったのに、スウェーデンでは完全に下層階級だった。福祉に頼る生活だった」

— Ali Ghodsi

ストックホルム郊外のBagarmossen（バーガモッセン）で育ったGhodsi。そこには常に「我々と彼ら」という感覚がありました。

しかし、その疎外感が、彼を駆り立てました。

"Being an outsider in Sweden gave me the drive to succeed. Of course, it's a motivator. You feel like you have to prove yourself, and you work much harder."

— Ali Ghodsi

「分散システム」への執着——難民経験からの学び

なぜ分散システムだったのか？

"When I was a refugee, I learned that resilience comes from distribution. A single point of failure is dangerous—whether in life or in systems."

「難民だったとき、分散によって回復力が生まれることを学びました。単一障害点は危険です——人生でもシステムでも」

— Ali Ghodsi

24時間で祖国を追われた経験。すべてを失った経験。それが、「分散して冗長性を持つ」という技術哲学に昇華されていたのです。

UCバークレーでの運命的な出会い

2009年、GhodsiはUCバークレーのAMPLabに客員研究員として参加します。

そこで彼は、後にDatabricksを共同創業する6人の研究者と出会いました。中でもMatei Zahariaは、Apache Sparkの主要開発者でした。

Sparkは革命的でした。Hadoopの100倍高速なデータ処理。しかし、企業での導入は進みませんでした。

「なぜ使われないのか？」——Ghodsiは観察しました。

「Berkeleyのヒッピー」と呼ばれて

2009年から2012年まで、AMPLabチームはSparkを企業に売り込みました。結果は、完全な無視。

"From 2009 to 2012, none of the companies we approached paid any heed. As 'Berkeley hippies,' we were just looking for impact, but the lack of adopters created skepticism."

— Ali Ghodsi

学術界の研究。実用性がない。——企業からの評価は散々でした。

しかし、Ghodsiは諦めませんでした。誰も採用しないなら、自分たちで会社を作るしかない。

「絶望からの起業」——2013年、7人はDatabricksを創業します。

初代CEOからの交代——Ion StoicaからAli Ghodsiへ

創業時のCEOは、UCバークレーのEECS教授Ion Stoicaでした。AMPLabのソフトウェアシステム部門を率いていた人物です。

しかし2016年1月、CEOはAli Ghodsiに交代します。Stoicaは執行会長に退きました。

5歳で亡命した少年が、ついにテック企業のCEOになった瞬間でした。

オープンソースへのコミットメント——「信頼ゼロ」からの教訓

Databricksの戦略で特筆すべきは、オープンソースへの徹底したコミットメントです。

Apache Spark、Delta Lake、MLflow——Databricksの中核技術はすべてオープンソース。競合も使える。なぜ、そんなことをするのか？

"Open source is not charity. It's the best way to build trust. When you give away your technology, customers know they won't be locked in. That trust becomes our competitive advantage."

— Ali Ghodsi

プロダクト詳細——「データからAIまで」の統合プラットフォーム

主要プロダクト

プロダクト	説明
Delta Lake	オープンソースのストレージレイヤー。ACID（原子性・一貫性・分離性・持久性）対応
Unity Catalog	データガバナンス・メタデータ管理
Databricks SQL	SQLアナリティクス、BIツール連携
MLflow	機械学習ライフサイクル管理
Mosaic AI	生成AIモデルの開発・デプロイ（旧MosaicML）

MosaicML買収——「週末までに決めろ」

2023年、DatabricksはMosaicMLを13億ドル（約1,950億円） で買収しました。

しかし、この買収劇の舞台裏は、業界でも稀に見るドラマでした。

偶然の出会い——Cerebral Valleyでの初対面

2023年3月30日、サンフランシスコで「Cerebral Valley AI conference」が開催されていました。

この出会いが、すべての始まりでした。

「週末までに決めなければならない」

交渉は電光石火で進みました。Ghodsiのディールチーム責任者は、こう助言しました。

「この会社を買いたいなら、今週末までに決めなければならない」

MosaicMLには他からも引き合いが来ていました。迷っている時間はない。

バハマでの署名

5月末、Ghodsiは家族とバハマに休暇で滞在していました。

しかし、休暇のほとんどは弁護士やベンチャーバンカーとの交渉に費やされました。家族を横目に、電話会議が続きます。

そして5月29日、Ghodsiはバハマでタームシートに署名しました。

"It's not often that a founder with no intention of selling, and an acquirer that's not looking to acquire, find themselves in a whirlwind frenzy of dealmaking that results in a $1.3 billion deal."

「売る気のない創業者と、買う気のない買収者が、嵐のような取引交渉の渦に巻き込まれ、13億ドルの買収に至る——そんなことは滅多にない」

Raoの交渉術——「私は好きだが、取締役会は違う」

MosaicML CEO Naveen Raoは、熟練した交渉者でした。

彼はしばしばGhodsiにこう伝えました。「私はDatabricksが大好きだが、他の陣営（取締役会や投資家）はそれほど熱心ではない」

これは交渉の駆け引きでした。

「同じ船に乗ろう」——株式交換の条件

Raoは最後にこう主張しました。

「株式交換にしてほしい。そうすれば、我々は同じ船に乗ることになる」

MosaicMLのVC投資家は誰も現金化せず、全62人の従業員が残留することが期待されました。

買収は成功。MosaicMLはDatabricks内で独立したグループとして運営され、RaoはCognition買収後もサンフランシスコのオフィスに留まりました。

なぜMosaicMLだったのか？

Databricksにとって、これは完璧なピースでした。

データ: Databricksが持っている
計算環境: Databricksが持っている
LLM訓練技術: MosaicMLが持っていた

3つが揃えば、「データからAIまで」の完全統合プラットフォームが完成します。

Mosaic AI機能:

モデルトレーニング: 独自のLLMを効率的に学習
モデルサービング: 本番環境へのデプロイ
Foundation Models: DBRX等の独自モデル
AI/BI Dashboards: 自然言語でのデータ分析

DBRX——Databricksの「自社製LLM」

2024年3月、DatabricksはDBRXをリリースしました。オープンソースのLLMです。

なぜDatabricksがLLMを作るのか？

答えは明確です。顧客に「選択肢」を与えるため。

OpenAIに依存したくない企業がいる。自社データを外部に送りたくない企業がいる。DBRXは、そうした企業のための「もう1つの選択肢」です。

DBRXの性能と日本語対応

DBRXは132BパラメータのMixture of Experts（MoE）モデルで、推論時には36Bパラメータのみがアクティブになります。

ベンチマーク	DBRX	Llama 2 70B	GPT-3.5 Turbo
MMLU（知識）	73.7%	69.8%	70.0%
HumanEval（コード）	70.1%	32.2%	48.1%
GSM8K（数学）	66.9%	54.4%	57.1%

日本語対応について：

DBRXは主に英語データで訓練されており、日本語性能は限定的です。Databricks公式のベンチマークでも日本語評価は公開されていません。

日本語での使用: 基本的な日本語タスクには対応可能だが、GPT-4やClaude 3.5と比較すると日本語の流暢さ・正確性で劣る
推奨用途: 英語中心のコード生成、データ分析、技術文書処理
日本語重視の場合: GPT-4、Claude 3.5 Sonnet、または日本語特化モデル（ELYZA、Japanese StableLM等）を推奨

DBRXの強み: オープンソース・自社環境でホスト可能・商用利用可能

DBRXの弱み: 日本語性能はGPT-4/Claudeに劣る、マルチモーダル非対応

ここまでが技術の話。では、実際に導入した企業はどうなったのか？ 640台のマシンを64台に削減したComcastの事例から見てみましょう。

導入事例——「データサイロ」から「AI活用」へ

Comcast——計算コストを10分の1に削減

米国最大のケーブルTV会社Comcastは、2,000万世帯の顧客データを抱えていました。

視聴履歴、サポート履歴、契約情報——すべてが別々のシステムに散らばっていました。

課題:

Databricks（Delta Lake）導入後:

結果は劇的でした。

指標	導入前	導入後	改善率
計算リソース	640台	64台	90%削減
DevOps工数	5人	0.5人	90%削減
開発時間	-	-	10-30%短縮

640台のマシンが、64台で済むようになった。計算コストは10分の1。

さらにComcastは、Databricksを活用した「インテリジェント音声コマンド」で視聴者エクスペリエンスを向上させ、エミー賞を受賞しています。

Shell——全世界のエネルギーデータを1つに

Shellは、世界最大級のエネルギー企業です。問題は、データが世界中に散らばっていること。

課題:

「予測保全をしたい」——しかし、データが統合されていなければ、予測モデルは作れない。

Databricks導入後:

Lakehouseアーキテクチャで、全世界のデータを統合。リアルタイムでデータにアクセス可能に。

結果:

データサイロの解消: 数ヶ月→数時間でデータ統合
予測保全の実現: 設備故障を事前に予測
AI/MLの大規模展開: 統合データで機械学習モデルを訓練

顧客の広がり

Databricksの顧客は、20,000社以上に広がっています（2024年時点）。

テック: Microsoft、Salesforce、Adobe
金融: HSBC、ABN AMRO
小売: Walgreens
メディア: Comcast
製造: Shell、Rolls-Royce

Fortune 500の60%以上が導入。これが、評価額620億ドルの根拠です。

成功事例ばかりに見えます。しかし、Databricksに死角はないのか？ Snowflakeとの「泥沼の論争」を見てみましょう。

競合分析——Snowflakeとの「パフォーマンス論争」

表面的な比較

項目	Databricks	Snowflake
アーキテクチャ	Lakehouse	Data Cloud
強み	AI/ML、非構造化データ	SQLアナリティクス
オープンソース	多数（Spark、Delta Lake）	限定的
評価額	$62B（約9.3兆円）	$70B（約10.5兆円、時価総額）
ターゲット	データエンジニア、データサイエンティスト	データアナリスト

競合比較

本質的な違い——「オープンvs.クローズド」

表面的には似て見えます。しかし、哲学が根本的に異なります。

Snowflakeからの批判——「エンタープライズ対応が不十分」

しかし、Snowflakeも黙ってはいません。

「本番環境規模では、Databricksは遅くなり、コストも高くなる」

— Snowflake公式サイト

Databricksの反論——「誤りだ」

Databricksも自社ブログで反論しています。

「Snowflakeの価格/パフォーマンス主張は誤り」

— Databricks公式ブログ

両社の「パフォーマンス論争」は、今も続いています。

第三者の評価——リアルワールドではどうか？

興味深いのは、独立アナリストの評価です。

また、Gartner Peer Insightsでは以下のような評価が出ています：

Databricks: 4.7/5（164件のレビュー）
Snowflake: 4.6/5（353件のレビュー）

スコアはほぼ互角。しかし、レビューの内容は異なります。

Databricksの肯定的評価:

「非常に強力なプロダクト。開発スピードが速く、顧客ニーズに応える進化を続けている」
「データエンジニアリング、AI/ML、ETLパイプラインに最適」

Databricksの否定的評価:

「プラットフォームが常に変化しているため、昨日のベストプラクティスが今日は古くなる」
「ライセンスコスト、パフォーマンスチューニングの複雑さ、クエリ最適化の問題がある」

両方を使う企業が38%

最も興味深いデータがあります。

Gartnerのデータ・アナリティクス調査によると、38%の企業がDatabricksとSnowflakeの両方を使用しています。

「どちらが優れているか」ではなく、「どちらも必要」 というのが、多くの企業の結論なのかもしれません。

Databricksの弱点

万能ではありません。以下の点で、Snowflakeに劣る場面があります:

SQLアナリストへの敷居: SQLだけで完結したい人には、Snowflakeの方がシンプル
BIツール連携: Tableauなどとの連携は、Snowflakeの方が成熟
学習コスト: Spark、Python、Delta Lake——学ぶべき技術が多い
料金の複雑さ: DBU（Databricks Units）の複雑さが批判される。予測不可能なコスト超過が発生しやすい

「データサイエンス重視」ならDatabricks。「SQLアナリティクス重視」ならSnowflake。どちらが「良い」ではなく、用途による。

Databricks料金体系——DBUの計算例

Databricksの料金はDBU（Databricks Unit） という独自単位で計算されます。複雑さが批判されることもありますが、ここで具体例を示します。

DBUとは？

DBU（Databricks Unit）は、処理能力の単位です。1 DBUは、特定のインスタンスタイプで1時間処理を実行した場合の単位コストに相当します。

料金の構成:

総コスト = DBU単価 × DBU消費量 × 使用時間 + クラウドインフラ費用

DBU単価（2024年時点・AWS例）

ワークロード	DBU単価（USD/DBU）
Jobs Compute	$0.15〜$0.30
All-Purpose Compute	$0.40〜$0.55
SQL Compute	$0.22〜$0.70
ML Compute	$0.60〜$0.90

※クラウド（AWS/Azure/GCP）、リージョン、契約形態により変動

具体的な計算例

ケース1: 小規模データ分析（月100時間）

ワークロード: SQL Compute（Serverless）
DBU単価: $0.70/DBU
インスタンス: 2XS（2 DBU/時間）
使用時間: 100時間/月

Databricks費用: $0.70 × 2 DBU × 100時間 = $140/月
+ AWS S3/EC2費用（別途）

ケース2: 本格的なML開発チーム（月500時間）

ワークロード: ML Compute
DBU単価: $0.75/DBU
インスタンス: Large GPU（20 DBU/時間）
使用時間: 500時間/月

Databricks費用: $0.75 × 20 DBU × 500時間 = $7,500/月
+ AWS EC2 GPU費用（別途・約$5,000〜$10,000/月）

コスト最適化のポイント

オートスケーリング: 使用時のみクラスターを起動
Spot/Preemptible インスタンス: 最大70%のコスト削減
Serverless: 管理負荷軽減、小規模ワークロードに最適
年間コミットメント: 大幅な割引（要相談）

注意: DBUの単価は頻繁に更新されます。最新の料金はDatabricks Pricing Calculatorで確認してください。

資金調達の歴史——「飛躍」の軌跡

Databricksの成長タイムライン

ラウンド	日付	調達額	評価額	主要投資家
Series A	2013年	$13.9M（約21億円）	-	Andreessen Horowitz
Series B	2014年	$33M（約50億円）	-	NEA
Series C	2017年	$140M（約210億円）	-	Andreessen Horowitz
Series D	2019年	$250M（約375億円）	$2.75B（約4,125億円）	Andreessen Horowitz
Series E	2020年	$400M（約600億円）	$6.2B（約9,300億円）	Andreessen Horowitz
Series F	2021年	$1B（約1,500億円）	$28B（約4.2兆円）	Franklin Templeton
Series G	2021年	$1.6B（約2,400億円）	$38B（約5.7兆円）	-
Series H	2023年	$500M（約750億円）	$43B（約6.45兆円）	-
Series I	2024年	$10B（約1.5兆円）	$62B（約9.3兆円）	Thrive Capital、a16z

総調達額：$4.1B以上（約6,150億円）

※日本円換算は1ドル=150円で計算

注目すべき3つの転換点

2021年 Series F/G（3,900億円）: AI/ML市場の爆発的成長期。Databricksは「AIのためのデータプラットフォーム」として認知される。

2024年 Series I（1.5兆円）: 史上最大級の未上場企業向け資金調達。MosaicML買収後、AI企業としてのポジションが確立。

成長指標——「数字」が語る実力

ARR（年間経常収益）の推移

時期	ARR
2020年	$400M（約600億円）
2021年	$800M（約1,200億円）
2022年	$1.5B（約2,250億円）
2023年	$2.4B（約3,600億円）
2024年	$3.0B（約4,500億円）

4年で約7.5倍。成長率は前年比60%——業界全体が成長鈍化する中、Databricksは加速しています。

AI収益の急成長

2024年、DatabricksはAI関連収益で10億ドル（約1,500億円）のランレートを超えました。

MosaicML買収の効果が、数字に表れています。

顧客の質

顧客数: 20,000社以上
Fortune 500導入率: 60%以上
大型契約（$1M以上）: 数百社

「大企業が実際に払っている」——これが評価額の根拠です。

採用競争率——OpenAI・Anthropic並み

Databricksの人気は、採用市場でも証明されています。

2024-2025年の採用サイクルで、Databricksは大学レベルの職種で世界中から20万件以上の応募を受けました。合格率は1%未満。

MosaicML買収後、Databricksの採用競争率はOpenAIやAnthropicに匹敵するレベルになりました。

今後の展開——IPOへの道

Databricksアーキテクチャ

Databricks IPO展望：2025年以降の上場可能性

Databricksは未上場企業として世界最大級の評価額を持ち、IPOへの期待が高まっています。しかし、CEOのAli Ghodsiは慎重な姿勢を示しています。

「今年IPOするのは馬鹿げている」——Ghodsi CEOの発言

2024年12月、Ghodsi CEOはBloomberg TVで明言しました。

"It's dumb to IPO this year, so we're definitely going to wait. ... If we were going to go, the earliest would be, let's say mid next year or something like that."

「今年IPOするのは馬鹿げている。だから、絶対に待つ。...もし上場するなら、早くても来年半ば頃だろう」

— Ali Ghodsi, CEO（2024年12月）

理由は「選挙年であり、金利やインフレに関する不確実性が高すぎる」。

代わりに100億ドル調達——Series Iの意味

項目	内容
調達額	100億ドル（約1.5兆円）
評価額	620億ドル（約9.3兆円）
主要投資家	Thrive Capital、Andreessen Horowitz、DST Global、GIC、Insight Partners
新規投資家	ICONIQ Growth、MGX、Wellington Management、Ontario Teachers' Pension Plan

Series Iの3つの目的：

従業員への流動性提供: IPOを待たずに、初期従業員が株式を現金化できるセカンダリー取引を実施
M&A資金の確保: MosaicML（13億ドル）のような大型買収を継続するための資金
IPOへの時間稼ぎ: 市場環境が改善するまでプライベート市場に留まる選択肢

IPOへの期待と懸念

期待:

評価額620億ドルでのIPOは、史上最大級のテックIPOになる可能性
AI/データ市場の成長により、さらなる評価額上昇の可能性
2025年後半〜2026年の上場が有力視されている

懸念:

2022年以降、テックIPO市場は冷え込んでいる
Snowflake株価の低迷（上場時から-50%以上）が示す、市場の厳しさ
金利環境・地政学リスクによる市場の不確実性

日本市場への示唆

日本企業がDatabricksを検討する際のポイント:

AI/ML重視なら検討価値あり——Lakehouseアーキテクチャは、ML基盤として優れている
SQLアナリティクス重視ならSnowflakeも比較——用途に応じた選択が重要
オープンソース志向なら相性良い——ベンダーロックインを避けたい企業向け

まとめ：「24時間で祖国を追われた少年」は何を成し遂げたのか

冒頭の問いに戻りましょう。

40年後、彼は評価額620億ドル（約9.3兆円）の企業のCEOになっていました。

Databricksが成し遂げたこと

Lakehouse革命: Data WarehouseとData Lakeの二択を終わらせた
オープンソース戦略: 技術を無償提供し、「信頼」で競争優位を築いた
AI企業への転換: MosaicML買収で「データからAIまで」を統合——バハマでの週末交渉が、1,950億円の買収を成立させた

限界もある

SQLアナリストへの敷居は、Snowflakeより高い
学習コストがかかる
DBUの複雑さによるコスト予測の難しさ
IPO市場の不透明さ

Ali Ghodsiの言葉

— Ali Ghodsi, CEO

24時間で祖国を追われた少年は、「誰もが使えるデータプラットフォーム」 を作りました。

「分散によって回復力が生まれる」——難民として学んだ教訓が、分散システムの哲学になり、9.3兆円企業を築きました。

その旅は、まだ続いています。

参考リソース

Ali Ghodsiの人生

Databricks公式

MosaicML買収

競合・評価

IPO関連

本記事はネクサフローのAI研究シリーズの一部です。

この記事の著者

中村知良

代表取締役

この記事をシェア

X Facebook はてな LinkedIn

次に読む

まずは無料相談・資料請求

AIやDXの導入について、具体的な進め方や費用対効果など、まずはお気軽にご相談ください。貴社の状況に合わせた最適なプランをご提案します。

お問い合わせ

お気軽にご相談ください

ブログ

この記事でわかること

基本情報

Lakehouseとは何か——「両方のいいとこ取り」の革命

企業が抱えていた2つの「データ地獄」

Lakehouse——「なぜ両方必要なのか？」への回答

Ali Ghodsi：24時間の亡命から、9.3兆円企業のCEOへ

5歳の少年が見た「空爆」

上流階級から下層階級へ——「福祉に頼る生活」

「分散システム」への執着——難民経験からの学び

UCバークレーでの運命的な出会い

「Berkeleyのヒッピー」と呼ばれて

初代CEOからの交代——Ion StoicaからAli Ghodsiへ

オープンソースへのコミットメント——「信頼ゼロ」からの教訓

プロダクト詳細——「データからAIまで」の統合プラットフォーム

主要プロダクト

MosaicML買収——「週末までに決めろ」

偶然の出会い——Cerebral Valleyでの初対面

「週末までに決めなければならない」

バハマでの署名

Raoの交渉術——「私は好きだが、取締役会は違う」

「同じ船に乗ろう」——株式交換の条件

なぜMosaicMLだったのか？

DBRX——Databricksの「自社製LLM」

DBRXの性能と日本語対応

導入事例——「データサイロ」から「AI活用」へ

Comcast——計算コストを10分の1に削減

Shell——全世界のエネルギーデータを1つに

顧客の広がり

競合分析——Snowflakeとの「パフォーマンス論争」

表面的な比較

本質的な違い——「オープンvs.クローズド」

Snowflakeからの批判——「エンタープライズ対応が不十分」

Databricksの反論——「誤りだ」

第三者の評価——リアルワールドではどうか？

両方を使う企業が38%

Databricksの弱点

Databricks料金体系——DBUの計算例

DBUとは？

DBU単価（2024年時点・AWS例）

具体的な計算例

コスト最適化のポイント

資金調達の歴史——「飛躍」の軌跡

注目すべき3つの転換点

成長指標——「数字」が語る実力

ARR（年間経常収益）の推移

AI収益の急成長

顧客の質

採用競争率——OpenAI・Anthropic並み

今後の展開——IPOへの道

Databricks IPO展望：2025年以降の上場可能性

「今年IPOするのは馬鹿げている」——Ghodsi CEOの発言

代わりに100億ドル調達——Series Iの意味

IPOへの期待と懸念

日本市場への示唆

まとめ：「24時間で祖国を追われた少年」は何を成し遂げたのか

Databricksが成し遂げたこと

限界もある

Ali Ghodsiの言葉

関連記事

参考リソース

Ali Ghodsiの人生

Databricks公式

MosaicML買収

競合・評価

IPO関連

中村 知良

この記事をシェア

関連記事

【2026年版】Databricks vs Snowflake徹底比較｜データ分析基盤の選び方

Snowflake徹底解説｜史上最大IPO・Buffettが投資した理由【時価総額10兆円】

dbt Labs徹底解説：評価額42億ドル、データ変換の標準を確立した企業を完全分析

まずは無料相談・資料請求

ブログ

この記事でわかること

基本情報

Lakehouseとは何か——「両方のいいとこ取り」の革命

企業が抱えていた2つの「データ地獄」

Lakehouse——「なぜ両方必要なのか？」への回答

Ali Ghodsi：24時間の亡命から、9.3兆円企業のCEOへ

中村知良

中村知良