データ管理基盤の米データブリックスは成長路線を維持するためにAIスタートアップへの出資や買収を進めている=同社サイトから
日本経済新聞社は、スタートアップ企業やそれに投資するベンチャーキャピタルなどの動向を調査・分析する米CBインサイツ(ニューヨーク)と業務提携しています。同社の発行するスタートアップ企業やテクノロジーに関するリポートを日本語に翻訳し、日経電子版に週2回掲載しています。

データ管理基盤の米データブリックス(Databricks)は人工知能(AI)ブームに乗っている。

生成AIを活用しようとする企業の需要が急増し、同社の2024年1月期の売上高は前年同期比50%以上増の16億ドルに達した。同社は製品の拡充と他社の買収により、成長を維持しようとしている。

23年6月には、AI開発の米モザイクML(MosaicML)を13億ドル(売上高の65倍に相当)の巨費を投じて買収した。モザイクMLの技術者らはデータブリックスが24年3月に公開したオープンソースの大規模言語モデル(LLM)「DBRX」の開発を支援した。

さらに、データブリックスは資金力を武器に、拡大しつつあるAIスタートアップ網に投資している。傘下のベンチャーキャピタル(VC)、データブリックス・ベンチャーズの24年の出資件数は、過去2年の実績を上回る見通しだ。

今回のリポートではCBインサイツのデータを活用し、データブリックスの23年以降の買収、投資、提携から3つの重要戦略をまとめた。この3つの戦略でのデータブリックスとのビジネス関係に基づき、企業を分類した。

・データガバナンス&セキュリティー

・データ変換&アクセス

・生成AI

データブリックスの戦略図

ポイント

1. データブリックスは他社とのネットワークにより、モデル管理能力を高め、AI開発の手薄な分野を補っている。

2. データのガバナンスや変換を手掛ける企業との提携により、データウエアハウスとデータレイクの機能を組み合わせたデータ管理基盤「レイクハウス」アーキテクチャーの有用性を高め、リーチを拡大している。

3. 長い目で見て企業や開発者を獲得できるよう、オープンソースを戦略の柱に据えている。

1. 他社とのネットワークにより、モデル管理能力を高め、AI開発の手薄な分野を補完

生成AI需要が寄与し、データブリックスの23年10〜12月期の顧客の取引額は過去最高に達した。

同社はこの勢いを保つため、様々なモデル管理機能を投入している。社内の研究開発や他社の買収を活用して製品を強化する一方、モデルの妥当性検証やモニタリングなどAIワークフローの手薄な分野を補ってくれる企業との提携や出資も進めている。

同社の生成AIでのビジネス関係の大半は、モデルの開発、デプロイ(本番環境での運用)、モニタリングなどのインフラ分野だ。有名なのはモザイクMLの買収だが、生成AIモデルをモニタリングする米アダプティブML(Adaptive ML)や米フィドラーAI(Fiddler AI)、生成AI利用の前処理として企業のデータのクレンジング(整理や最適化)や構造化を支援する米アンストラクチャード(Unstructured)や米ラミニ(Lamini)など、LLMOps(LLMの運用・改良)企業への出資や提携もしている。

3月には米エヌビディアとの提携を拡大し、エヌビディアのAI向け高性能GPU(画像処理半導体)「H100テンサーコアGPU」を使って生成AIモデルの推論と学習を改善すると発表した。さらに、エヌビディアはデータブリックスのシリーズIラウンドに出資した。

データブリックス・ベンチャーズはAIインフラ以外にも目を向け、データブリックスの事業に関連する企業に戦略投資している。ナレッジ管理の米グリーン(Glean)や、生成AIを使った検索エンジンの米パープレキシティ(Perplexity)などが主な例だ。

2. データのガバナンスや変換を手掛ける企業との提携により、レイクハウスアーキテクチャーの有用性を高め、リーチを拡大

データブリックスはデータレイクハウスに多額の資金を投じ、サービス開始から3年で年間経常収益(ARR)2億5000万ドル以上の製品に育て上げた。今では同社の事業全体の10%以上を占めている。

データブリックスはデータの変換や統合、ガバナンス&セキュリティー、共有&保存を手掛けるスタートアップなど、レイクハウスの機能を補完する企業との提携、買収、投資により、成長を推進し続けている。

例えば、23年5月に買収した米オケラ(Okera)のようなデータガバナンス&セキュリティー企業は、レイクハウスの顧客企業の既存データの保護や機密性の高いワークロードの移行を支援する。同年にはレイクハウスでデータの可観測性とデータ品質管理ツールを提供するため、米モンテカルロ(Monte Carlo)との提携を拡大した。

さらに、様々なタイプのデータを処理するため、データの共有や保存を手掛ける多くの企業と提携している。AI向けのデータ保存システムの構築では米ルビコン(Rubicon、23年に買収)、顧客が必要とするデータセットへのアクセスを拡大するために米フィスカルノート(FiscalNote)、クラウド間でのデータ共有を最適化するために米クラウドフレア(CloudFlare)と組んでいる。

データ統合も推進している。データの複製や取り込みを手掛ける米アルシオン(Arcion)を買収したほか、米ハイタッチ(Hightouch)や英スノープロウ(Snowplow)に出資している。

3. 長い目で見て企業や開発者を獲得できるよう、オープンソースを戦略の柱に

データブリックス・ベンチャーズはオープンプラットフォームとオープンソースを投資の柱に据えている。オープンソースの生成AI開発を手掛ける仏ミストラルAI(Mistral AI)など、データ管理やAI技術スタックのスタートアップに数百万ドルを投じている。

もっとも、データブリックスがオープンソースに関心を抱いたのは最近の話ではない。18年にはオープンソースのMLOps製品「MLフロー」を公開し、22年にはレイクハウスの利用を拡大するため、レイクハウスアーキテクチャー向けの保存フォーマット「デルタレイク」をオープンソース化している。その他の主なオープンソースプロジェクトには「Redash」や「Apache Spark」がある。

最近では、モザイクMLチームが開発し、エヌビディアのAI学習インフラ「DGXクラウド」で学習させたオープンソースのLLM「DBRX」を公開した。学習期間は数カ月で、費用は1000万ドルかかったとしている。

データブリックスは、企業は米オープンAIが開発した様なクローズドソースのモデルから、カスタマイズしやすく可観測性も高いオープンソースモデルに移るとみている。

同社は今後もオープンソースのプロジェクトや機能を既存製品に加えていくだろう。3月にもオープンソースのデータキュレーション基盤、米ライラック(Lilac)を買収したばかりだ。

鄭重声明:本文の著作権は原作者に帰属します。記事の転載は情報の伝達のみを目的としており、投資の助言を構成するものではありません。もし侵害行為があれば、すぐにご連絡ください。修正または削除いたします。ありがとうございます。