2016國外10家引人注意的大數據初創公司
大數據技術市場正處于這樣一個階段:Garnter認為是從IT主導的、報告系統轉向業務主導、自助式服務分析的***階段。其結果是出現了很多新業務智能和分析平臺可以滿足企業機構對可訪問性、敏捷性和更深入的分析洞察力的要求。
現在有很多初創公司提供這種下一代系統,他們開發新技術用于收集、管理和分析大數據,不管這些數據是結構化的還是非結構化的、動態的還是靜態的、本地的還是在云中的。
下面就是2016年引起我們注意的10個很酷的大數據初創公司。
Anodot
CEO: David Drai
Anodot在2015年11月走出隱身模式,推出了實時異常檢測和操作智能技術——擁有機器學習專利算法的軟件,可以自動進行業務分析、查明性能問題并尋找商業機會。Anodot的目標是從大量數據中查找異常值,并將這些結果轉化為有價值的業務洞察。
Anodot的技術旨在用于電子商務網站、數字廣告系統和物聯網網絡,以提高運營效率,***限度增加收入。
Anodot位于以色列的Ra'Anana,以及加州的桑尼維爾,在9月的B輪融資中獲得了800萬美元。
Confluent
CEO: Jay Kreps
在大數據管理和分析中,處理實時的流式數據是***的挑戰之一。解決這個問題的其中一項技術就是開源的Apache Kafka通訊代理項目,提供了高吞吐、低延遲的軟件,用于處理實時數據。
Confluent是由Apache Kafka創始開發者創建的,提供了一個圍繞Kafka的完整實時數據平臺,可作為一個容錯的、高度可擴展的通訊系統。該軟件可用于手機來自用戶活動日志、股票行情系統、設備儀表的數據,以及其他廣泛用例中的數據。
今年5月,這家位于加州帕洛阿爾托的公司宣布提供Confluent Platform 3.0,通過融合Kafka Streams把流處理能力添加到應用中,還有在企業機構上下操作Kafka的Confluent Control Center。
Koverse
CEO: Jon Matsuo
Koverse開發了一款“盒中數據湖”的平臺,并稱它可以收集大數據并更快速地運用于生產中,其成本要低于現有的技術和方法。
這家位于西雅圖的公司創建于2012年,最早的1.0版本是在兩年前***公布的。Koverse Platform 2.0是在6月發布的,將Apache Accumulo“分布式鍵值庫”技術和該公司自己的Universal Indexing Engine結合到一起。
聯合創始人Paul Brown(***產品官)和Aaron Cordova(***技術官)曾經是美國國家安全局的數據科學家,在那里他們幫助開發了最早的Accumulo項目,重新架構了國家安全局的數據基礎架構,以更好地處理意外的數據分析情況。
Maana
CEO: Babur Ozden
Maana開發了Maana Knowledge Platform,這個數據搜索和發現軟件是從大量系統或者“孤島”中收集數據,并將其轉變為可以被業務線應用采用的業務洞察。該系統是構建在Apache Spark處理引擎的。
Maana位于加州帕洛阿爾托,創建于2012年,在2015年5月正式發布,定位是收集和分析由物聯網網絡生成的大量數據。9月該公司***公布了其產品的Winter '17版本,Knowledge Applications用于優化像供應鏈和呼叫中心管理這樣的業務流程,Knowledge Assistants用于創建新的分析模型。
Maana在2016年5月進行的B輪融資中獲得2600萬美元,氣走好難過大部分來自該公司的石油和天然氣及行業客戶,包括殼牌、雪佛龍、沙特阿美、英特爾和通用電氣等公司。
Pachyderm
CEO: Joe Doliner
掌握著當前一代大數據技術的初創公司Pachyderm,已經開發出了一種開源分析引擎,采用Docker容器做分布式計算。
這里的重點是提供了一個容器化、模塊化、可擴展的數據分析基礎設施,采用像Docker和Kubernetes這樣的工具作為構建塊。該公司的Pachyderm File System和Pachyderm Pipeline System軟件幫助數據經理和分析師構建機器學習通道和數據ETL(提取、轉換和加載)工作流程。
Pachyderm創建于2014年,位于舊金山,在今年6月的種子輪融資中獲得了200萬美元。
StreamSets
CEO: Girish Pancha
StreamSets是另外一家解決管理動態數據挑戰的公司。更具體地說,StreamSets開發的軟件防止“數據漂移”的潛在問題——數據在源頭的時候可能會遇到這種不可預測的突變情況,并在應用使用這些數據的時候出現問題。
StreamSets的StreamSets Data Collector軟件被用于在任何數據源和任何應用之間構建復雜的數據流。9月,StreamSets***推出了StreamSets Dataflow Performance Manager用于管理數據流操作。
StreamSets位于舊金山,創建于2014年,創始人包括CEO Girish Pancha、前Informatica***產品官、現***技術官Arvind Prabhaker,以及前Cloudera的早期員工、工程負責人。
Striim
President and CEO: Ali Kutay
Striim創建于2012年,創始人包括來自Golden Gate Software、Oracle、Informatica、WebLogic以及其他知名數據管理公司的前高管。
Striim公司位于加州帕洛阿爾托,它的軟件將流數據集成與流操作智能結合到一個系統內,實現持續的查詢/處理和流式分析。11月,Striimfault了新版本軟件,可以配合Google Big Query、Kafka和MapR Technologies使用。
Striim在3月獲得了1000萬美元的額外資金,使其B輪融資的總金額得到了3000萬美元。
Stytch
CEO: Mark Cunningham
Stytch在4月***推出了自己端到端的數據分析平臺,提供系統工具用于自助服務式的數據準備、數據建模、數據發現、報告和儀表板。Stytch得到了Dun & Bradstreet的支持,Stytch系統的主要賣點是它連接到了Dun & Bradstreet龐大業務數據庫。
這家位于溫哥華的公司創建與2015年8月。創始人、***執行官Mark Cunningham從1992年就涉足商業智能領域,當時他的家族企業開始開發Crystal Reports,一款早期的、非常成功的Windows報告工具。
Talena
CEO: Nitin Donde
Talena提供了“永遠在線”的大數據管理軟件,幫助企業保護有價值的數據資產,并基于關鍵業務應用快速迭代。Talena的技術提供了備份和恢復、測試和開發管理、以及跨Hadoop、NoSQL數據庫(例如Cassandra和Couchbase)以及現代數據倉庫(例如HPE Vertica)的歸檔能力。
今年3月Talena發布了針對大數據管理任務的ActiveRx預測分析基礎設施。該軟件解決了如何將機器學習用于預測數據可用性、如何將備份數據轉變為動態數據資產的問題。
Waterline Data
CEO: Alex Gorelik
隨著企業機構將基于Hadoop的數據湖聚合起來用于存儲海量數據,找到如何以***方式利用這些信息就變成一個重大挑戰——更不用說隨之而來令人頭疼的數據治理問題了。
Waterline Data解決了Smart Data Catalog軟件的問題,構建了一個完成的數據湖資產庫,改善了數據發現和數據監管,讓企業更容易從這些資產中獲取價值。
Waterline Data創建于2013年,位于加州山景城,在1月的B輪融資中獲得1600萬美元。