Nexaflow
サービス導入事例ブログ勉強会会社情報
資料請求お問い合わせ

Nexaflow

社会を支える人々と伴に、
未来の希望を創る

サービス

  • プライシング戦略支援
  • Nexalog
  • AIトランスフォーメーション

会社情報

  • 会社概要
  • ミッション
  • メンバー

リソース

  • ブログ
  • 導入事例
  • お知らせ
  • 資料ダウンロード

© 2026 Nexaflow Inc. All rights reserved.

利用規約プライバシーポリシー

ブログ

AI、データ活用、業務改善に関する最新情報やNexaflowの取り組みをお届けします

ホーム/スタートアップ分析/Databricksとは?評価額9.3兆円・IPO展望・Snowflake比較を解説【2026年版】
Databricksとは?評価額9.3兆円・IPO展望・Snowflake比較を解説【2026年版】

Databricksとは?評価額9.3兆円・IPO展望・Snowflake比較を解説【2026年版】

56分で読める|2026/02/05|
DatabricksLakehouseApache Sparkデータ分析IPODBRX

AIサマリー

Databricks(データブリックス)とは、評価額620億ドル(9.3兆円)のAI・データプラットフォーム企業。2025年以降のIPOが期待される。24時間で祖国を追われたAli Ghodsi CEOの壮絶な人生、Lakehouseアーキテクチャ、Snowflakeとの競争を徹底解説。

Databricksとは?(30秒で理解)

Databricks(データブリックス)は、評価額620億ドル(約9.3兆円) のAI・データプラットフォーム企業。2013年にUCバークレーの研究者7名が創業し、Apache Sparkの開発元として知られる。データウェアハウスとデータレイクを統合した「Lakehouse」アーキテクチャを提唱し、Fortune 500の60%以上が導入。2025年以降のIPOが期待されており、実現すれば史上最大級のテックIPOとなる可能性がある。


1984年、イランの首都テヘラン。5歳の少年は、窓の外で隣家が爆撃される光景を目撃しました。

イラン・イラク戦争の真っ只中。両親は医師で、政治的反体制派でした。ある日、イラン政府から通告が届きます。

「24時間以内に国外へ出ろ」

家族は着の身着のまま、スウェーデンへ亡命しました。

37年後の2021年。その5歳の少年は、評価額380億ドル(約5.7兆円)の企業のCEOになっていました。2024年12月には**620億ドル(約9.3兆円)**に到達。彼の名は、Ali Ghodsi。Databricksを率いる男です。

本記事は、24時間で祖国を追われた少年が、9.3兆円企業を築くまでの物語です。

本記事の表記について

  • 金額の日本円換算は1ドル=150円で計算しています
  • 下線付きの用語にカーソルを合わせると解説が表示されます

この記事でわかること

  1. Lakehouse革命の本質: Data WarehouseとData Lakeを統合した新アーキテクチャがなぜ重要か
  2. Ali Ghodsiの壮絶な人生: 24時間亡命、福祉生活、そしてCEOへの道
  3. MosaicML買収の舞台裏: 「週末までに決めろ」——バハマで署名された1,950億円の買収劇

基本情報

項目内容
会社名Databricks, Inc.
設立年2013年
本社サンフランシスコ
従業員数約7,000名
評価額$62B(約9.3兆円、2024年12月)
総調達額$4.1B以上(約6,150億円)
顧客数20,000社以上

※日本円換算は1ドル=150円で計算

Databricksの全体像Databricksの全体像

Lakehouseとは何か——「両方のいいとこ取り」の革命

企業が抱えていた2つの「データ地獄」

2010年代、企業のデータチームは2つの選択を迫られていました。どちらを選んでも、別の地獄が待っていました。

Data Warehouse(Snowflake等)を選ぶと:

高速なSQLクエリが可能。BIツールとの連携も簡単。しかし、構造化データしか扱えない。機械学習には向かない。そして、とにかく高い。

Data Lake(Hadoop等)を選ぶと:

非構造化データも保存可能。機械学習にも使える。コストも安い。しかし、クエリ性能が低い。データ品質の管理が困難。「データ沼」 と呼ばれるほど、混沌としていました。

結果、多くの企業は両方を併用することになります。Data WarehouseとData Lakeを別々に運用し、データを行き来させる。コストは2倍。運用の複雑さも2倍。

Lakehouse——「なぜ両方必要なのか?」への回答

Databricksが提唱したLakehouse(レイクハウス) は、この問いに対する根本的な回答でした。

「Data Warehouseの性能と、Data Lakeの柔軟性を、1つのシステムで実現すればいい」

技術的には、Delta Lakeというストレージレイヤーがこれを可能にしました。

レイヤー役割
Unity Catalogガバナンス・メタデータ管理
Delta Lakeストレージレイヤー(ACID対応、スキーマ管理、タイムトラベル)
Apache Spark計算エンジン
Cloud StorageAWS / Azure / GCP 上のオブジェクトストレージ

Delta Lakeの3つの革新:

  • ACID対応: 銀行システム並みの信頼性をData Lakeに
  • スキーマ管理: 「データ沼」を「データ湖」に変える
  • タイムトラベル: 過去のデータ状態に自由にアクセス

これは単なる技術的な改善ではありません。データアーキテクチャの哲学の転換でした。

ここまで読むと、Lakehouseは技術的なブレイクスルーに見えます。しかし、なぜDatabricksがこのアイデアを実現できたのか? その答えは、創業者Ali Ghodsiの壮絶な人生にあります。


Ali Ghodsi:24時間の亡命から、9.3兆円企業のCEOへ

5歳の少年が見た「空爆」

1979年、イスラム革命がイランを揺るがしていました。その混乱の中、1977年に生まれたAli Ghodsiは幼少期を過ごします。

両親は医師でした。そして、政治的反体制派でした。

1984年、イラン・イラク戦争の最中。テヘランは空爆にさらされていました。

「街全体が暗くなり、イラクの戦闘機がテヘランを爆撃した。隣家が爆撃される光景を目撃した」

— Ali Ghodsi

5歳の少年にとって、それは理解を超えた恐怖でした。

そしてある日、イラン政府から通告が届きます。「24時間以内に国外へ出ろ」。

家族は着の身着のまま、スウェーデンへ亡命しました。

上流階級から下層階級へ——「福祉に頼る生活」

スウェーデンに逃れたGhodsi一家を待っていたのは、過酷な現実でした。

イランで医師だった両親は、スウェーデンで医師免許が認められませんでした。一家は学生寮を転々とし、福祉に頼る生活を強いられます。

"If we were upper class in Iran, we were definitely lower class in Sweden—it was welfare and all that."

「イランでは上流階級だったのに、スウェーデンでは完全に下層階級だった。福祉に頼る生活だった」

— Ali Ghodsi

ストックホルム郊外のBagarmossen(バーガモッセン)で育ったGhodsi。そこには常に「我々と彼ら」という感覚がありました。

しかし、その疎外感が、彼を駆り立てました。

"Being an outsider in Sweden gave me the drive to succeed. Of course, it's a motivator. You feel like you have to prove yourself, and you work much harder."

「スウェーデンで部外者だったことが、成功への原動力になった。もちろん、それはモチベーターだ。自分を証明しなければならないと感じ、人の何倍も努力せざるを得なかった」

— Ali Ghodsi

「分散システム」への執着——難民経験からの学び

Ghodsiはコンピュータサイエンスに没頭しました。KTH Royal Institute of Technology(スウェーデン王立工科大学)で博士号を取得。専門は分散システム——複数のコンピュータを協調させる技術です。

なぜ分散システムだったのか?

"When I was a refugee, I learned that resilience comes from distribution. A single point of failure is dangerous—whether in life or in systems."

「難民だったとき、分散によって回復力が生まれることを学びました。単一障害点は危険です——人生でもシステムでも」

— Ali Ghodsi

24時間で祖国を追われた経験。すべてを失った経験。それが、「分散して冗長性を持つ」という技術哲学に昇華されていたのです。

UCバークレーでの運命的な出会い

2009年、GhodsiはUCバークレーのAMPLabに客員研究員として参加します。

そこで彼は、後にDatabricksを共同創業する6人の研究者と出会いました。中でもMatei Zahariaは、Apache Sparkの主要開発者でした。

Sparkは革命的でした。Hadoopの100倍高速なデータ処理。しかし、企業での導入は進みませんでした。

「なぜ使われないのか?」——Ghodsiは観察しました。

「Berkeleyのヒッピー」と呼ばれて

2009年から2012年まで、AMPLabチームはSparkを企業に売り込みました。結果は、完全な無視。

"From 2009 to 2012, none of the companies we approached paid any heed. As 'Berkeley hippies,' we were just looking for impact, but the lack of adopters created skepticism."

「2009年から2012年まで、私たちがアプローチした企業は誰も関心を示さなかった。『Berkeleyのヒッピー』として、私たちは単なる学術研究と見なされていた」

— Ali Ghodsi

学術界の研究。実用性がない。——企業からの評価は散々でした。

しかし、Ghodsiは諦めませんでした。誰も採用しないなら、自分たちで会社を作るしかない。

「絶望からの起業」——2013年、7人はDatabricksを創業します。

初代CEOからの交代——Ion StoicaからAli Ghodsiへ

創業時のCEOは、UCバークレーのEECS教授Ion Stoicaでした。AMPLabのソフトウェアシステム部門を率いていた人物です。

しかし2016年1月、CEOはAli Ghodsiに交代します。Stoicaは執行会長に退きました。

交代の理由は明確でした。Ghodsiの方が「オペレーション・製品開発・Go-to-Market戦略」に強みがあった。Stoicaは学者として研究に専念したかった可能性もあります。

5歳で亡命した少年が、ついにテック企業のCEOになった瞬間でした。

オープンソースへのコミットメント——「信頼ゼロ」からの教訓

Databricksの戦略で特筆すべきは、オープンソースへの徹底したコミットメントです。

Apache Spark、Delta Lake、MLflow——Databricksの中核技術はすべてオープンソース。競合も使える。なぜ、そんなことをするのか?

"Open source is not charity. It's the best way to build trust. When you give away your technology, customers know they won't be locked in. That trust becomes our competitive advantage."

「オープンソースは慈善事業ではありません。信頼を築く最良の方法です。技術を無償で提供すれば、顧客はロックインされないと分かる。その信頼が競争優位になるのです」

— Ali Ghodsi

難民として「信頼ゼロ」からスタートした経験。自分を証明しなければならないという切迫感。それが、「まず与える」というオープンソース戦略に繋がっていたのです。

創業者の哲学は分かりました。では、Databricksは具体的に何を売っているのか? そして、なぜ1,950億円を投じてAI企業を買収したのか。プロダクトの全貌を見ていきましょう。


プロダクト詳細——「データからAIまで」の統合プラットフォーム

主要プロダクト

プロダクト説明
Delta Lakeオープンソースのストレージレイヤー。**ACID(原子性・一貫性・分離性・持久性)**対応
Unity Catalogデータガバナンス・メタデータ管理
Databricks SQLSQLアナリティクス、BIツール連携
MLflow機械学習ライフサイクル管理
Mosaic AI生成AIモデルの開発・デプロイ(旧MosaicML)

MosaicML買収——「週末までに決めろ」

2023年、DatabricksはMosaicMLを13億ドル(約1,950億円) で買収しました。

しかし、この買収劇の舞台裏は、業界でも稀に見るドラマでした。

偶然の出会い——Cerebral Valleyでの初対面

2023年3月30日、サンフランシスコで「Cerebral Valley AI conference」が開催されていました。

そこで、Ali Ghodsi(Databricks CEO)とNaveen Rao(MosaicML CEO)が初めて対面します。お互いの存在は知っていましたが、直接会ったことはありませんでした。

この出会いが、すべての始まりでした。

「週末までに決めなければならない」

交渉は電光石火で進みました。Ghodsiのディールチーム責任者は、こう助言しました。

「この会社を買いたいなら、今週末までに決めなければならない」

MosaicMLには他からも引き合いが来ていました。迷っている時間はない。

バハマでの署名

5月末、Ghodsiは家族とバハマに休暇で滞在していました。

しかし、休暇のほとんどは弁護士やベンチャーバンカーとの交渉に費やされました。家族を横目に、電話会議が続きます。

そして5月29日、Ghodsiはバハマでタームシートに署名しました。

"It's not often that a founder with no intention of selling, and an acquirer that's not looking to acquire, find themselves in a whirlwind frenzy of dealmaking that results in a $1.3 billion deal."

「売る気のない創業者と、買う気のない買収者が、嵐のような取引交渉の渦に巻き込まれ、13億ドルの買収に至る——そんなことは滅多にない」

Raoの交渉術——「私は好きだが、取締役会は違う」

MosaicML CEO Naveen Raoは、熟練した交渉者でした。

彼はしばしばGhodsiにこう伝えました。「私はDatabricksが大好きだが、他の陣営(取締役会や投資家)はそれほど熱心ではない」

これは交渉の駆け引きでした。

Raoはさらに、FacebookによるInstagramの10億ドル買収やWhatsAppの190億ドル買収を例に挙げました。「変革的M&A」がいかに企業を成長させるか——GhodsiはRaoの説得に心を動かされました。

「同じ船に乗ろう」——株式交換の条件

Raoは最後にこう主張しました。

「株式交換にしてほしい。そうすれば、我々は同じ船に乗ることになる」

MosaicMLのVC投資家は誰も現金化せず、全62人の従業員が残留することが期待されました。

買収は成功。MosaicMLはDatabricks内で独立したグループとして運営され、RaoはCognition買収後もサンフランシスコのオフィスに留まりました。

なぜMosaicMLだったのか?

MosaicMLは、企業が自社専用のLLMを効率的に訓練できるプラットフォームを持っていました。OpenAIやAnthropicのAPIに依存せず、自社データで自社モデルを作れる。

Databricksにとって、これは完璧なピースでした。

  • データ: Databricksが持っている
  • 計算環境: Databricksが持っている
  • LLM訓練技術: MosaicMLが持っていた

3つが揃えば、「データからAIまで」の完全統合プラットフォームが完成します。

Mosaic AI機能:

  • モデルトレーニング: 独自のLLMを効率的に学習
  • モデルサービング: 本番環境へのデプロイ
  • Foundation Models: DBRX等の独自モデル
  • AI/BI Dashboards: 自然言語でのデータ分析

DBRX——Databricksの「自社製LLM」

2024年3月、DatabricksはDBRXをリリースしました。オープンソースのLLMです。

なぜDatabricksがLLMを作るのか?

答えは明確です。顧客に「選択肢」を与えるため。

OpenAIに依存したくない企業がいる。自社データを外部に送りたくない企業がいる。DBRXは、そうした企業のための「もう1つの選択肢」です。

DBRXの性能と日本語対応

DBRXは132BパラメータのMixture of Experts(MoE)モデルで、推論時には36Bパラメータのみがアクティブになります。

ベンチマークDBRXLlama 2 70BGPT-3.5 Turbo
MMLU(知識)73.7%69.8%70.0%
HumanEval(コード)70.1%32.2%48.1%
GSM8K(数学)66.9%54.4%57.1%

日本語対応について:

DBRXは主に英語データで訓練されており、日本語性能は限定的です。Databricks公式のベンチマークでも日本語評価は公開されていません。

  • 日本語での使用: 基本的な日本語タスクには対応可能だが、GPT-4やClaude 3.5と比較すると日本語の流暢さ・正確性で劣る
  • 推奨用途: 英語中心のコード生成、データ分析、技術文書処理
  • 日本語重視の場合: GPT-4、Claude 3.5 Sonnet、または日本語特化モデル(ELYZA、Japanese StableLM等)を推奨

DBRXの強み: オープンソース・自社環境でホスト可能・商用利用可能

DBRXの弱み: 日本語性能はGPT-4/Claudeに劣る、マルチモーダル非対応

ここまでが技術の話。では、実際に導入した企業はどうなったのか? 640台のマシンを64台に削減したComcastの事例から見てみましょう。


導入事例——「データサイロ」から「AI活用」へ

Comcast——計算コストを10分の1に削減

米国最大のケーブルTV会社Comcastは、2,000万世帯の顧客データを抱えていました。

視聴履歴、サポート履歴、契約情報——すべてが別々のシステムに散らばっていました。

課題:

従来のシステムでは、ある処理を実行するのに640台のマシンが必要でした。DevOpsチームは5人のフルタイム従業員を200人のユーザーオンボーディングに割り当てていました。

Databricks(Delta Lake)導入後:

結果は劇的でした。

指標導入前導入後改善率
計算リソース640台64台90%削減
DevOps工数5人0.5人90%削減
開発時間--10-30%短縮

640台のマシンが、64台で済むようになった。計算コストは10分の1。

さらにComcastは、Databricksを活用した「インテリジェント音声コマンド」で視聴者エクスペリエンスを向上させ、エミー賞を受賞しています。

Shell——全世界のエネルギーデータを1つに

Shellは、世界最大級のエネルギー企業です。問題は、データが世界中に散らばっていること。

課題:

石油・ガス施設は世界70カ国以上に点在。各施設が独自のシステムでデータを管理。データを統合しようとすると、数ヶ月かかる。その間に、設備故障が発生する。

「予測保全をしたい」——しかし、データが統合されていなければ、予測モデルは作れない。

Databricks導入後:

Lakehouseアーキテクチャで、全世界のデータを統合。リアルタイムでデータにアクセス可能に。

結果:

  • データサイロの解消: 数ヶ月→数時間でデータ統合
  • 予測保全の実現: 設備故障を事前に予測
  • AI/MLの大規模展開: 統合データで機械学習モデルを訓練

顧客の広がり

Databricksの顧客は、20,000社以上に広がっています(2024年時点)。

  • テック: Microsoft、Salesforce、Adobe
  • 金融: HSBC、ABN AMRO
  • 小売: Walgreens
  • メディア: Comcast
  • 製造: Shell、Rolls-Royce

Fortune 500の60%以上が導入。これが、評価額620億ドルの根拠です。

成功事例ばかりに見えます。しかし、Databricksに死角はないのか? Snowflakeとの「泥沼の論争」を見てみましょう。


競合分析——Snowflakeとの「パフォーマンス論争」

表面的な比較

項目DatabricksSnowflake
アーキテクチャLakehouseData Cloud
強みAI/ML、非構造化データSQLアナリティクス
オープンソース多数(Spark、Delta Lake)限定的
評価額$62B(約9.3兆円)$70B(約10.5兆円、時価総額)
ターゲットデータエンジニア、データサイエンティストデータアナリスト
競合比較競合比較

本質的な違い——「オープンvs.クローズド」

表面的には似て見えます。しかし、哲学が根本的に異なります。

Snowflakeは「クローズド」アプローチ。データをSnowflakeに入れれば、すべてが動く。しかし、一度入れたら出にくい。ベンダーロックインのリスク。

Databricksは「オープン」アプローチ。Apache Spark、Delta Lake——中核技術はオープンソース。いつでも他のプラットフォームに移行可能。顧客にロックインを強いない。

Snowflakeからの批判——「エンタープライズ対応が不十分」

しかし、Snowflakeも黙ってはいません。

Snowflakeは自社サイトで「Snowflake vs. Databricks」という比較ページを公開しています。そこには、「Databricksはエンタープライズ対応が不十分」 という批判が並んでいます。

「本番環境規模では、Databricksは遅くなり、コストも高くなる」

— Snowflake公式サイト

Databricksの反論——「誤りだ」

Databricksも自社ブログで反論しています。

「Snowflakeの価格/パフォーマンス主張は誤り」

— Databricks公式ブログ

両社の「パフォーマンス論争」は、今も続いています。

第三者の評価——リアルワールドではどうか?

興味深いのは、独立アナリストの評価です。

「データが合成的・完全に均一ならDatabricksが有利だが、リアルワールドのデータ・モデリング・クエリではSnowflakeがパフォーマンスとコストの両面で優位」

また、Gartner Peer Insightsでは以下のような評価が出ています:

  • Databricks: 4.7/5(164件のレビュー)
  • Snowflake: 4.6/5(353件のレビュー)

スコアはほぼ互角。しかし、レビューの内容は異なります。

Databricksの肯定的評価:

  • 「非常に強力なプロダクト。開発スピードが速く、顧客ニーズに応える進化を続けている」
  • 「データエンジニアリング、AI/ML、ETLパイプラインに最適」

Databricksの否定的評価:

  • 「プラットフォームが常に変化しているため、昨日のベストプラクティスが今日は古くなる」
  • 「ライセンスコスト、パフォーマンスチューニングの複雑さ、クエリ最適化の問題がある」

両方を使う企業が38%

最も興味深いデータがあります。

Gartnerのデータ・アナリティクス調査によると、38%の企業がDatabricksとSnowflakeの両方を使用しています。

「どちらが優れているか」ではなく、「どちらも必要」 というのが、多くの企業の結論なのかもしれません。

Databricksの弱点

万能ではありません。以下の点で、Snowflakeに劣る場面があります:

  1. SQLアナリストへの敷居: SQLだけで完結したい人には、Snowflakeの方がシンプル
  2. BIツール連携: Tableauなどとの連携は、Snowflakeの方が成熟
  3. 学習コスト: Spark、Python、Delta Lake——学ぶべき技術が多い
  4. 料金の複雑さ: DBU(Databricks Units)の複雑さが批判される。予測不可能なコスト超過が発生しやすい

「データサイエンス重視」ならDatabricks。「SQLアナリティクス重視」ならSnowflake。どちらが「良い」ではなく、用途による。


Databricks料金体系——DBUの計算例

Databricksの料金はDBU(Databricks Unit) という独自単位で計算されます。複雑さが批判されることもありますが、ここで具体例を示します。

DBUとは?

DBU(Databricks Unit)は、処理能力の単位です。1 DBUは、特定のインスタンスタイプで1時間処理を実行した場合の単位コストに相当します。

料金の構成:

総コスト = DBU単価 × DBU消費量 × 使用時間 + クラウドインフラ費用

DBU単価(2024年時点・AWS例)

ワークロードDBU単価(USD/DBU)
Jobs Compute$0.15〜$0.30
All-Purpose Compute$0.40〜$0.55
SQL Compute$0.22〜$0.70
ML Compute$0.60〜$0.90

※クラウド(AWS/Azure/GCP)、リージョン、契約形態により変動

具体的な計算例

ケース1: 小規模データ分析(月100時間)

  • ワークロード: SQL Compute(Serverless)
  • DBU単価: $0.70/DBU
  • インスタンス: 2XS(2 DBU/時間)
  • 使用時間: 100時間/月
Databricks費用: $0.70 × 2 DBU × 100時間 = $140/月
+ AWS S3/EC2費用(別途)

ケース2: 本格的なML開発チーム(月500時間)

  • ワークロード: ML Compute
  • DBU単価: $0.75/DBU
  • インスタンス: Large GPU(20 DBU/時間)
  • 使用時間: 500時間/月
Databricks費用: $0.75 × 20 DBU × 500時間 = $7,500/月
+ AWS EC2 GPU費用(別途・約$5,000〜$10,000/月)

コスト最適化のポイント

  1. オートスケーリング: 使用時のみクラスターを起動
  2. Spot/Preemptible インスタンス: 最大70%のコスト削減
  3. Serverless: 管理負荷軽減、小規模ワークロードに最適
  4. 年間コミットメント: 大幅な割引(要相談)

注意: DBUの単価は頻繁に更新されます。最新の料金はDatabricks Pricing Calculatorで確認してください。


資金調達の歴史——「飛躍」の軌跡

Databricksの成長タイムラインDatabricksの成長タイムライン
ラウンド日付調達額評価額主要投資家
Series A2013年$13.9M(約21億円)-Andreessen Horowitz
Series B2014年$33M(約50億円)-NEA
Series C2017年$140M(約210億円)-Andreessen Horowitz
Series D2019年$250M(約375億円)$2.75B(約4,125億円)Andreessen Horowitz
Series E2020年$400M(約600億円)$6.2B(約9,300億円)Andreessen Horowitz
Series F2021年$1B(約1,500億円)$28B(約4.2兆円)Franklin Templeton
Series G2021年$1.6B(約2,400億円)$38B(約5.7兆円)-
Series H2023年$500M(約750億円)$43B(約6.45兆円)-
Series I2024年$10B(約1.5兆円)$62B(約9.3兆円)Thrive Capital、a16z

総調達額:$4.1B以上(約6,150億円)

※日本円換算は1ドル=150円で計算

注目すべき3つの転換点

2013年 Series A(21億円): Ben Horowitz(Andreessen Horowitzのパートナー)が「Sparkを中心に1,000億ドル企業を作れる」と確信。プロダクトがまだない段階での投資でした。

2021年 Series F/G(3,900億円): AI/ML市場の爆発的成長期。Databricksは「AIのためのデータプラットフォーム」として認知される。

2024年 Series I(1.5兆円): 史上最大級の未上場企業向け資金調達。MosaicML買収後、AI企業としてのポジションが確立。


成長指標——「数字」が語る実力

ARR(年間経常収益)の推移

時期ARR
2020年$400M(約600億円)
2021年$800M(約1,200億円)
2022年$1.5B(約2,250億円)
2023年$2.4B(約3,600億円)
2024年$3.0B(約4,500億円)

4年で約7.5倍。成長率は前年比60%——業界全体が成長鈍化する中、Databricksは加速しています。

AI収益の急成長

2024年、DatabricksはAI関連収益で10億ドル(約1,500億円)のランレートを超えました。

MosaicML買収の効果が、数字に表れています。

顧客の質

  • 顧客数: 20,000社以上
  • Fortune 500導入率: 60%以上
  • 大型契約($1M以上): 数百社

「大企業が実際に払っている」——これが評価額の根拠です。

採用競争率——OpenAI・Anthropic並み

Databricksの人気は、採用市場でも証明されています。

2024-2025年の採用サイクルで、Databricksは大学レベルの職種で世界中から20万件以上の応募を受けました。合格率は1%未満。

MosaicML買収後、Databricksの採用競争率はOpenAIやAnthropicに匹敵するレベルになりました。


今後の展開——IPOへの道

DatabricksアーキテクチャDatabricksアーキテクチャ

Databricks IPO展望:2025年以降の上場可能性

Databricksは未上場企業として世界最大級の評価額を持ち、IPOへの期待が高まっています。しかし、CEOのAli Ghodsiは慎重な姿勢を示しています。

「今年IPOするのは馬鹿げている」——Ghodsi CEOの発言

2024年12月、Ghodsi CEOはBloomberg TVで明言しました。

"It's dumb to IPO this year, so we're definitely going to wait. ... If we were going to go, the earliest would be, let's say mid next year or something like that."

「今年IPOするのは馬鹿げている。だから、絶対に待つ。...もし上場するなら、早くても来年半ば頃だろう」

— Ali Ghodsi, CEO(2024年12月)

理由は「選挙年であり、金利やインフレに関する不確実性が高すぎる」。

代わりに100億ドル調達——Series Iの意味

2024年12月、DatabricksはSeries Iで100億ドル(約1.5兆円) を調達。評価額は620億ドル(約9.3兆円)に達しました。これは未上場テック企業への投資として史上最大級のラウンドです。

項目内容
調達額100億ドル(約1.5兆円)
評価額620億ドル(約9.3兆円)
主要投資家Thrive Capital、Andreessen Horowitz、DST Global、GIC、Insight Partners
新規投資家ICONIQ Growth、MGX、Wellington Management、Ontario Teachers' Pension Plan

Series Iの3つの目的:

  1. 従業員への流動性提供: IPOを待たずに、初期従業員が株式を現金化できるセカンダリー取引を実施
  2. M&A資金の確保: MosaicML(13億ドル)のような大型買収を継続するための資金
  3. IPOへの時間稼ぎ: 市場環境が改善するまでプライベート市場に留まる選択肢

投資家向け情報: Series Iでは、従業員や初期投資家のセカンダリー取引(既存株の売却)も含まれています。これにより、IPO前でも一部の株主は現金化が可能になりました。

IPOへの期待と懸念

期待:

  • 評価額620億ドルでのIPOは、史上最大級のテックIPOになる可能性
  • AI/データ市場の成長により、さらなる評価額上昇の可能性
  • 2025年後半〜2026年の上場が有力視されている

懸念:

  • 2022年以降、テックIPO市場は冷え込んでいる
  • Snowflake株価の低迷(上場時から-50%以上)が示す、市場の厳しさ
  • 金利環境・地政学リスクによる市場の不確実性

日本市場への示唆

日本企業がDatabricksを検討する際のポイント:

  1. AI/ML重視なら検討価値あり——Lakehouseアーキテクチャは、ML基盤として優れている
  2. SQLアナリティクス重視ならSnowflakeも比較——用途に応じた選択が重要
  3. オープンソース志向なら相性良い——ベンダーロックインを避けたい企業向け

まとめ:「24時間で祖国を追われた少年」は何を成し遂げたのか

冒頭の問いに戻りましょう。

1984年、5歳の少年は24時間以内に祖国を追われました。スウェーデンでは福祉に頼る生活。「自分を証明しなければならない」——その切迫感が、彼を駆り立てました。

40年後、彼は評価額620億ドル(約9.3兆円)の企業のCEOになっていました。

Databricksが成し遂げたこと

  1. Lakehouse革命: Data WarehouseとData Lakeの二択を終わらせた
  2. オープンソース戦略: 技術を無償提供し、「信頼」で競争優位を築いた
  3. AI企業への転換: MosaicML買収で「データからAIまで」を統合——バハマでの週末交渉が、1,950億円の買収を成立させた

限界もある

  • SQLアナリストへの敷居は、Snowflakeより高い
  • 学習コストがかかる
  • DBUの複雑さによるコスト予測の難しさ
  • IPO市場の不透明さ

Ali Ghodsiの言葉

"We built Apache Spark believing that everyone should be able to process big data. But to make that a reality, we needed a platform that anyone could use—not just experts. That's the origin of Databricks."

「私たちがApache Sparkを作ったとき、誰もがビッグデータを処理できるようになると確信していました。しかし、それを実現するには、専門家でなくても使えるプラットフォームが必要でした。それがDatabricksの原点です」

— Ali Ghodsi, CEO

24時間で祖国を追われた少年は、「誰もが使えるデータプラットフォーム」 を作りました。

「分散によって回復力が生まれる」——難民として学んだ教訓が、分散システムの哲学になり、9.3兆円企業を築きました。

その旅は、まだ続いています。


関連記事

➡️
  • 【2025年版】AIデータ・アナリティクス革命:Databricks・Snowflake等5社を徹底解説
  • Snowflake徹底解説:時価総額700億ドル、Data Cloudの巨人を完全分析
  • dbt Labs徹底解説:評価額42億ドル、データ変換の標準を確立した企業を完全分析

参考リソース

Ali Ghodsiの人生

  • Ali Ghodsi: Being an outsider in Sweden gave me the drive to succeed
  • Refugee Ali Ghodsi Builds Billion Dollar Empire Brick by Brick

Databricks公式

  • Databricks公式サイト
  • Unity Catalog
  • Customer Story: Comcast
  • Customer Story: Shell

MosaicML買収

  • Behind the scenes of Databricks' $1.3 billion MosaicML deal
  • Exclusive: Databricks wasn't looking to buy, and MosaicML wasn't selling

競合・評価

  • Snowflake vs. Databricks | Snowflake公式
  • Databricks vs Snowflake 2025 | Gartner Peer Insights
  • Databricks vs. Snowflake at $5B ARR: Same Revenue, 2x Valuation Gap

IPO関連

  • 'It's dumb to IPO this year': Databricks CEO explains why he's waiting to go public
  • Databricks IPO: everything you need to know

本記事はネクサフローのAI研究シリーズの一部です。

この記事の著者

中村 知良

中村 知良

代表取締役

早稲田大学卒業後、ソフトバンク株式会社にてAI活用やCEO直下案件のプロジェクトマネージャーに従事。その後、不動産スタートアップPit in株式会社の創業、他スタートアップでの業務改善・データ活用を経験後、2023年10月、株式会社ネクサフローを創業し代表取締役CEO就任。

この記事をシェア

XFacebookはてなLinkedIn

目次

  • この記事でわかること
  • 基本情報
  • Lakehouseとは何か——「両方のいいとこ取り」の革命
  • 企業が抱えていた2つの「データ地獄」
  • Lakehouse——「なぜ両方必要なのか?」への回答
  • Ali Ghodsi:24時間の亡命から、9.3兆円企業のCEOへ
  • 5歳の少年が見た「空爆」
  • 上流階級から下層階級へ——「福祉に頼る生活」
  • 「分散システム」への執着——難民経験からの学び
  • UCバークレーでの運命的な出会い
  • 「Berkeleyのヒッピー」と呼ばれて
  • 初代CEOからの交代——Ion StoicaからAli Ghodsiへ
  • オープンソースへのコミットメント——「信頼ゼロ」からの教訓
  • プロダクト詳細——「データからAIまで」の統合プラットフォーム
  • 主要プロダクト
  • MosaicML買収——「週末までに決めろ」
  • なぜMosaicMLだったのか?
  • DBRX——Databricksの「自社製LLM」
  • 導入事例——「データサイロ」から「AI活用」へ
  • Comcast——計算コストを10分の1に削減
  • Shell——全世界のエネルギーデータを1つに
  • 顧客の広がり
  • 競合分析——Snowflakeとの「パフォーマンス論争」
  • 表面的な比較
  • 本質的な違い——「オープンvs.クローズド」
  • Snowflakeからの批判——「エンタープライズ対応が不十分」
  • Databricksの反論——「誤りだ」
  • 第三者の評価——リアルワールドではどうか?
  • 両方を使う企業が38%
  • Databricksの弱点
  • Databricks料金体系——DBUの計算例
  • DBUとは?
  • DBU単価(2024年時点・AWS例)
  • 具体的な計算例
  • コスト最適化のポイント
  • 資金調達の歴史——「飛躍」の軌跡
  • 注目すべき3つの転換点
  • 成長指標——「数字」が語る実力
  • ARR(年間経常収益)の推移
  • AI収益の急成長
  • 顧客の質
  • 採用競争率——OpenAI・Anthropic並み
  • 今後の展開——IPOへの道
  • Databricks IPO展望:2025年以降の上場可能性
  • 「今年IPOするのは馬鹿げている」——Ghodsi CEOの発言
  • 代わりに100億ドル調達——Series Iの意味
  • IPOへの期待と懸念
  • 日本市場への示唆
  • まとめ:「24時間で祖国を追われた少年」は何を成し遂げたのか
  • Databricksが成し遂げたこと
  • 限界もある
  • Ali Ghodsiの言葉
  • 関連記事
  • 参考リソース
  • Ali Ghodsiの人生
  • Databricks公式
  • MosaicML買収
  • 競合・評価
  • IPO関連

シェア

B!

次に読む

【2026年版】Databricks vs Snowflake徹底比較|データ分析基盤の選び方

【2026年版】Databricks vs Snowflake徹底比較|データ分析基盤の選び方

次に読む

関連記事

【2026年版】Databricks vs Snowflake徹底比較|データ分析基盤の選び方

【2026年版】Databricks vs Snowflake徹底比較|データ分析基盤の選び方

Databricks(評価額9.3兆円)とSnowflake(時価総額10兆円)を徹底比較。Fivetran、dbt Labs、Monte Carloを含む主要5社の機能・料金・ユースケースを解説。38%の企業が両方使う理由とは?データ基盤選定の決定版ガイド。

2026/01/17
データ分析Databricks
Snowflake徹底解説|史上最大IPO・Buffettが投資した理由【時価総額10兆円】

Snowflake徹底解説|史上最大IPO・Buffettが投資した理由【時価総額10兆円】

Snowflake(スノーフレーク)は、ソフトウェア企業史上最大のIPOを達成したData Cloud企業。Warren Buffettが投資、Frank Slootman CEOの経営手腕、Databricksとの競争戦略、Cortex AIの今後まで徹底分析。

2026/01/17
SnowflakeIPO
dbt Labs徹底解説:評価額42億ドル、データ変換の標準を確立した企業を完全分析

dbt Labs徹底解説:評価額42億ドル、データ変換の標準を確立した企業を完全分析

評価額42億ドルに到達したdbt Labsの全貌を徹底解説。SQLベースのデータ変換を標準化し、Analytics Engineeringという職種を生み出した革新と、Fivetranとの統合の意味に迫ります。

2026/01/17
AIData

まずは無料相談・資料請求

AIやDXの導入について、具体的な進め方や費用対効果など、まずはお気軽にご相談ください。貴社の状況に合わせた最適なプランをご提案します。

お問い合わせ

お気軽にご相談ください