年終盤點:2023年炙手可熱的10家大數據初創公司
大數據,大野心
數據已經成為許多企業和組織的一項寶貴資產。他們正在對數據進行分析,以獲取有關市場、客戶和自身運營的洞察。他們正在利用數據來推動數字化轉型計劃并支持新的數據密集型服務。大量的數據也是人工智能和機器學習計劃的重要組成部分。
但整理、管理和分析數據是當今一項重大挑戰。據市場研究機構IDC稱,創建、捕獲、復制和消費的數據總量每年增長20%以上,預計到2027年將達到約291 ZB。
這也是為什么大數據初創公司源源不斷地開發領先技術來幫助企業訪問、收集、管理、移動、轉換、分析、理解、測量、治理、維護和保護數據。
以下來看看2023年備受關注的10家大數據初創公司。
Airbyte
聯合創始人兼首席執行官:Michel Tricot
將數據從運營應用和數據庫轉移到數據倉庫、數據湖和其他分析系統是數據分析中最具挑戰性的步驟之一。
市場上有很多商業數據移動和集成工具,但Airbyte憑借它的開源數據移動/數據集成引擎以及用于設置和運行數據移動操作的連接器,吸引了人們的關注。
今年9月該公司表示,在短短三個月內,Airbyte的用戶社區已經使用Airbyte在今年6月推出的無代碼連接器構建器構建了1500多個數據連接器。10月,該公司宣布推出了矢量數據庫連接器,這種連接器對于把數據源連接到AI應用是至關重要的。
Airbyte成立于2020年,總部位于美國舊金山,在2021年12月進行的B輪融資中獲得1.5億美元。
Astronomer
首席執行官:Andy Byron
Astronomer開發了Astro統一數據編排平臺,用于集中數據流的可見性、控制并簡化數據管道部署。該系統可以幫助企業和組織擴展大規模數據集成、數據分析以及AI和機器學習任務,滿足關鍵的金融服務、零售和電子商務應用的數據需求。
Astro基于開源的Apache Airflow工作流管理技術(最初是由Airbnb開發),用于數據工程管道。
12月6日,Astronomer推出了最新版本的Astro,具有簡化的連接管理功能、新的系統升級實用程序和新的系統部署功能,以降低運營成本。
Astronomer成立于2018年,總部位于辛辛那提和舊金山,并在2022年3月進行的C輪融資中獲得了2.13億美元。Astronomer在2023年初進行了裁員,但根據9月份的報告顯示,今年上半年Astronomer的收入同比增長了206%。
Hex
聯合創始人、首席執行官:Barry McCardel
大數據行業有眾多公司開發了用于管理、集成、轉換、分析和可視化數據的復雜技術,但共享和發布分析任務的結果仍然是一大挑戰。
Hex Technologies開發了Hex平臺,一個用于協作分析和數據科學任務的現代數據工作空間系統。該平臺包括了AI驅動的工具、協作數據筆記本、用于開發具有數據可視化的應用的工具以及數據集成技術——所有這些都使得使用交互式數據應用和故事連接和分析數據以及共享工作成為可能。
Hex總部位于美國舊金山,是由McCardel、首席技術官Caitlin Colgrove和首席架構師Glen Takahashi在2019年創立的,之前他們曾在Palantir共事過。Hex在2022年3月進行的B輪融資中獲得了5200萬美元。
今年10月,Hex推出了Hex 3.0,其中包含新的AI功能、新的計算引擎、新的元數據引擎以及用于將洞察轉化為交互式體驗的App Builder工具。今年早些時候,Hex推出了Hex Magic工具,將大型語言模型的強大功能直接引入Hex工作區。
Momento
聯合創始人、首席執行官:Khawaja Shams
Momento在2022年11月憑借Momento Serverless Cache產品走出隱身模式,該產品可以優化和加速在AWS或者谷歌云上運行的任何數據庫。
緩存通過更快交付常用的或者經常使用的數據來加快數據庫響應。但Momento的創始人認為,當今的緩存技術并不是為當今的現代云堆棧設計的。Momento稱,高度可用的Momento緩存技術每秒可以執行數百萬此處理,并作為后端即服務平臺運行,這意味著用戶無需管理基礎設施。
Momento總部位于美國西雅圖,由首席執行官Khawaja Shams和首席技術官Daniela Miao共同創立,兩人曾在AWS工作,并且是亞馬遜專有NoSQL數據庫服務AWS DynamoDB背后的工程負責人。
MotherDuck
聯合創始人、首席執行官:Jordan Tigani
6月22日,MotherDuck推出了MotherDuck無服務器云分析平臺的第一個版本,該平臺結合了云和嵌入式數據庫技術,可以輕松分析數據,無論數據位于何處。
該平臺是基于MotherDuck的DuckDB開源嵌入式數據庫,通過將進程內數據庫的速度與云的可擴展性相結合,這個云系統可以輕松地分析任何規模的數據。
MotherDuck 認為,近年來數據分析的大部分進步都面向擁有超過 PB 數據的大型企業和組織,而忽略了擁有類似數據量的中小型公司。
MotherDuck總部位于美國西雅圖,是由Google BigQuery創始工程師Jordan Tigani在2022年聯合創立的,現在擔任該公司的首席執行官。今年9月,MotherDuck在B輪融資中獲得了5250萬美元,融資總額達到1億美元。
Onehouse
創始人、首席執行官:Vinoth Chandar
初創公司Onehouse標榜自己是“數據的新基石”,為云原生、完全托管的數據湖站服務打造了基礎。
該公司的服務是基于Apache Hudi的,一個開源事務數據湖項目,可為數據湖帶來數據庫和數據倉庫功能,其目標是充當不同數據存儲庫之間的數據集成層。
Onehouse成立于2021年,總部位于美國加利福尼亞州門洛帕克,在2022年初走出隱身模式。
今年2月,Onehouse在A輪融資中獲得了2500萬美元。Onehouse還推出了新的Onetable技術,讓用戶能夠利用基于Hudi的數據湖屋,同時充分利用Databricks和Snowflake中的原生性能加速功能。
Starburst
聯合創始人、首席執行官:Justin Borgman
數據湖分析平臺開發公司Starburst成立于2017年,是大數據領域較為成熟的初創公司之一。但Starburst憑借其基于公司核心的MPP SQL查詢引擎(基于Trino開源技術構建)繼續加快發展勢頭,實現了對分布于多個數據源的大型數據集的查詢。
Starburst的產品組合包括Starburst Enterprise平臺和Starburst Galaxy完全托管云服務。今年9月,Starburst通過新的云遷移功能(包括Starburst Galaxy中的本地連接)擴展了這兩個功能,隨后在11月推出了在Starburst數據湖上構建交互式應用的新功能,包括用于近實時分析和自動化數據治理的流式攝取。
Starburst總部位于美國波士頓,在2022年2月進行的D輪融資中獲得了2.5億美元,融資總額達到4.14億美元,當時的估值達到33.5億美元。
Telmai
聯合創始人、首席執行官:Mona Rakibe
數據可觀測性是大數據領域最活躍的領域之一,過去五年中涌現了很多初創公司,提供監控數據流的技術以提高數據質量和可靠性。
Telmai成立于2020年,總部位于美國舊金山,是較新的初創公司之一。Telmai以AI驅動的數據可觀測性平臺可以幫助數據團隊使用一系列數據質量指標和KPI來自動監控數據管道過程,并主動實時檢測和調查數據異常。
Telmai在今年9月發布了新版本的軟件,其中包含許多新功能旨在簡化和加速數據可觀測性的采用,包括歷史數據的“時間旅行”回溯性分析、跨三大公有云的私有云選項、以及針對異構數據管道的端到端可觀察性。
Telmai在今年6月獲得了550萬美元的種子資金。
Tessell
聯合創始人、首席執行官:Bala Kuchibhotla
Tessel采用了與傳統云數據庫不同的方法。Tessel的云原生托管數據庫即服務并沒有采用自己底層專有的數據庫引擎,而是支持Oracle、Microsoft SQL Server、Postgres和MySQL數據庫。
Tessel表示,憑借自己運行在Azure或者AWS云平臺上的數據基礎設施和管理平臺這一獨特設計,可以以更高的性能和更低的成本運行重型事務數據庫工作負載。
Tessell總部位于美國加利福尼亞州圣拉蒙,由首席執行官Bala Kuchibhotla和副總裁/工程負責人Kamal Khanuja在2021年創立,兩人此前都曾在Nutanix和Oracle工作。Tessell在2022年11的A輪融資中獲得了來自Lightspeed Venture Partners的3400萬美元。
Vendia
聯合創始人、首席執行官:Tim Wagner
Vendia開發了一個基于區塊鏈技術的數據協作平臺,通過跨公司、云、系統和業務網絡實現實時數據共享和工作流程自動化,幫助組織克服“數據蔓延”。
Vendia(公司名稱源自顯示重疊數據集的“維恩圖”)成立于2020年,總部位于美國舊金山。Vendia在2022年5月的B輪融資中獲得了3000萬美元,融資總額達到5000萬美元。