大數據“顯影”:Ayasdi用拓撲數據分析癌癥
大數據蘊含的寶藏就在每個人的腳下,而Ayasdi這樣的大數據創業公司能借你一雙慧眼,從現有的數據中發現新的金礦。
最近,硅谷的創業公司Ayasdi最近剛剛完成了一筆1000萬美元的融資,該公司利用拓撲數據分析的算法,來推動癌癥的研究。
Ayasdi所代表的大數據垂直應用顯然正在成為大數據投資的焦點之一,在IT經理網之前的文章:大數據的下一個熱點在于應用軟件中,我們曾指出:
就長期價值而言, 行業或細分市場的突破性大數據軟件應用要超過目前火熱的大數據基礎設施平臺。
舊數據里的新財富
斯坦福大學的學者Gurjeet Singh, Gunnar Carlsson, 和 Harlan Sexton一直在致力于用拓撲學的方法, 進行數據分析。 拓撲學是一個很古老的數學分支, 從歐拉時代就開始研究,不過最近15年左右, 拓撲學開始和數據分析相結合, 用來發現大數據中的一些隱形的關系。 Gurjeet Singh, Gunnar Carlsson, 和 Harlan Sexton在2008年, 覺得將這一技術進行商用。 于是成了了Ayasdi公司。 (Ayasdi來自印第安語, 意思是“尋找“)。 而Ayasdi的目標, 也是為了幫助用戶從現有數據中進行一些新的發現。
用Ayasdi的創始人 Gunnar Carlsson的話說:
“人們先有數據, 然后根據這些數據提問, 按照不同的問題軌跡進行尋找答案。 而有的問題軌跡是正確的,有的則不一定正確。而Ayasdi的目標, 這是幫助用戶回答他們還沒想到的問題。”
Ayasdi成立以后,就獲得了DARPA(美國國防部高級研究項目組)350萬美元的資助。(編者:DARPA的很多項目都非常具有前瞻性, DAPRA的網絡項目ARPANET就是現在Internet的前身)。 隨后, Ayasdi的綜合了機器學習和拓撲數據分析的技術引起了硅谷投資界的關注。
Ayasdi的技術的一個重要特點就是,不像別的系統需要類似搜索查詢式語句。 Ayasdi可以自動從數據中發現隱藏的模式。
隨著Khosla Ventures和 Floodgate等基金的投資到位, Ayasdi目前30人的技術團隊將擴充, 同時將營銷和銷售也將展開。
Ayasdi的投資人Vinod Khosla 有句名言, 說將來80%的醫生將會被機器代替。 他認為, Ayasdi的“機器智能”技術, 將使我們的探索能力達到過去難以企及的高度。從而幫助解決一些全球性的社會和經濟問題。
讓大數據“顯影”
Ayasdi的一個應用就是在醫學研究領域。 Mount Sinai醫學院基因與多尺度生物學系的主任Eric Schadt就帶領了一個團隊,利用Ayasdi的技術進行一些疾病的遺傳傾向的研究。 這些疾病中包括癌癥。 Eric Schadt希望這種技術能夠幫助找到一些新的發現, 從而可能帶來一些治療上的突破。
事實上, Ayasdi一直在美國各個頂級醫院和藥廠合作。 醫院和制藥公司可以從公開的信息源獲得很多數據, 和他們自己的數據結合起來,進行一些新的研究。
Ayasdi的CEO Gurjeet Singh說:
“數據還是那些數據, 只是我們用了新的技術, 可以從這些數據里自動地得出一些新的發現。”
通過對一個累計采集15年, 被成千科學家研究過的數據集的分析。 Ayasdi的數據分析技術,幫助發現了乳腺癌的14個變種。 Ayasdi的算法發現了某一個基因子組的病人乳腺癌的存活率比較高。如果病人的基因是在這樣的子組里, 可以免受化療之苦。
風險基金Data Collective 的合伙人Matt Ocko是一個專注于大數據領域的投資人,他看到了這個醫學上的突破的新聞后, 決定給Ayasdi投資。 他說:
目前,政府和企業的問題,不在于數據量的缺乏,而是對數據進行發現和直覺能力不足。 Ayasdi的技術, 能夠在短時間內, 提高分析人員面對海量數據的直覺能力,這一點是個突破。
對于醫療行業而言,大數據財富其實就在腳下,甚至在那些被遺棄的數據中,(在本站“Rich Smolan:大數據的人類面孔”一文中提到一個例子,麻省理工學院的計算機科學家和密歇根大學計算機科學家創建了一個全新的計算機模型,可以分析那些被丟棄的心電圖數據,發現被忽視的心臟疾病復發信號,并能大大改進今天的心臟病風險篩查技術。)
Ayasdi獲得風險投資的青睞,從一個側面表明,數據直覺化和數據分析創新才是醫療大數據的發展重點。
原文鏈接:http://www.ctocio.com/ccnews/11043.html