人工智能初創公司創辦過程中的三個關鍵教訓
本文轉載自公眾號“讀芯術”(ID:AI_Discovery)。
我是一家人工智能初創公司的技術聯合創始人,然而我們并未取得成功。Pharma Foresight著眼于醫藥商業智能領域,下面是我們的電梯廣告:
“目前制藥公司的研發回報率低于資本成本,因此制藥公司投資創新藥物的利潤越來越低。決定要進行哪些臨床試驗,獲得批準的可能性是一個至關重要的指標,而這種指標目前正以一種非常主觀且有偏見的方式來計算。我們的AI算法可以更準確地估計這個數字,它節省了時間和金錢,最終造福患者。” |
我們有一個很強大的團隊,并采用精益創業策略進行快速迭代;我們與各種不同的利益相關者進行了接近100次的訪談,以確定早期的產品購買者并驗證了他們對我們產品的需求;僅僅4個月后,我們就與一家大型制藥公司的全球投資組合管理辦公室合作,該公司支付了我們構建模型的費用,我們也保留了所有的知識產權。
然而,盡管遵循了很多初創公司的成功經驗,PharmaForesight還是失敗了。由于時運不濟和判斷失誤,我們最終并沒有成功。
這次失敗讓我更清晰地明確了一個道理:人工智能初創公司與SaaS初創公司采用的策略和方法是有微妙的區別的——但這并沒有得到廣泛認可。這篇文章的目的就是講述我們曾犯的錯誤,避免更多的AI初創公司重蹈覆轍。
首先,什么是人工智能初創公司?
有很多初創公司聲稱他們使用人工智能,但實際上,他們使用的只是外包的人工勞動力或是基本的統計技術。倫敦MMC Ventures的一項研究發現,40%的所謂人工智能初創公司實際上并沒有使用人工智能。
而本文的觀點是,如果沒有相對現代的機器學習技術,人工智能初創公司是不可能存在的。比如,Poly.ai如果沒有深度的學習算法就不可能存在。
這與那些只有部分產品使用了AI的公司形成了鮮明對比。例如,Spotify就在機器學習上投入了大量資金,而且機器學習如今已成為其戰略的核心。但是,Spotify在以一種協調的方式使用機器學習之前就已經存在了。對我來說,它更像是一個SaaS公司。
從這個角度出發,我將向你介紹我在創辦人工智能初創公司中學到的一些經驗。
1. 專有數據是關鍵
圖源:unsplash
在商業情景中,思考人工智能的最佳方式是將其視為一種底層的支持技術,就像20世紀80年代出現的SQL數據庫一樣。SQL創造了價值數十億美元的行業,比如客戶關系管理。同樣,人工智能將創造新的行業,并在大量商業用例中實現改進。
與SQL數據庫一樣,人工智能也依賴于數據。數據遠比算法重要,這一點是公認的。高質量的專有數據對人工智能初創公司來說至關重要。
事后看來,我們的數據策略是錯誤的。最初,我們選擇了更快更容易的方法——在公開的數據上構建工具的第一個版本。清洗和轉換數據為機器學習做好準備,這花費了大量的時間,而當時的我們認為這其中有一定的可靠性。我們還以為,一旦我們獲得了一定的可信度,那么訪問更有趣、更可靠的專有數據集就要容易得多了。
事實證明,這些假設中有許多都是錯誤的。當開始構建模型時,我們找不到任何人來處理這個問題,但當我們完成模型構建時,又出現了許多競爭對手。即使我們的算法更精確,也難以與更成熟的競爭對手區分開來,尤其是似乎大家都使用了相似的數據。
構建模型似乎并沒有讓訪問專有行業的數據集變得更容易(盡管我們當時資金用盡,否則我們無疑可以對此進行更徹底的測試)。對人工智能公司來說,訪問專有數據集絕對是關鍵。
一般來說,有三種獲取專有數據集的方法,而且它們不會相互排斥:
- 通過創建初始產品或服務的方式來收集數據,當用戶與之交互時,該產品或服務會生成數據,這些數據隨后可以用于改進產品或服務。例如Facebook、谷歌、Spotify和其他很多類似的網站都是這樣。
- 通過手動收集一個小型專有數據集的方式來收集數據。這種方式可以用來訓練初始的機器學習模型,此時模型需要表現得足夠好,才能至少滿足一些早期購買者的需求。隨后的合作關系將使數據收集的規模得以擴大,從而可以改進模型等。Hoxton Analytics就是采用這種方法的公司之一。
- 與數據持有者(通常是大公司或公共機構)進行交易。例如,Sensyne Health已經與英國的幾個國民醫療服務聯合體(NHS Trusts)達成了一項交易。
在這三種選擇中,我推薦第三種,原因如下:
- 如果你選擇第一種,說明你并不是一家人工智能初創公司。因為你可以在沒有人工智能的情況下提供服務,所人工智能對于你所能做的事情顯然不是必要的。當然,人工智能可能會極大地改善你的產品或服務,但它必須足夠優秀才能夠收集到大量的用戶數據。
- 如果選擇第二種,還是很有可能創建一個人工智能初創公司的,但是為了能讓成功幾率最大化,初始數據集需要充足的利基市場,或者與現有的解決方案相比,你的方法需要足夠創新。遵循這種方法的風險在于,在發展合作伙伴以收集大量數據之前,你的想法和數據集很容易被競爭對手復制,特別是當你處理一個廣為人知的用例時。
這么看來,創建人工智能初創公司的關鍵途徑就剩下第三種了——與大的數據持有者進行交易,以獲取他們的數據。這就是絕大多數人工智能初創公司都是B2B的原因。
大型機構和公司通常行動遲緩,與他們交易通常需要一定的時間。是否允許另一家公司訪問數據可能存在倫理或商業上的顧慮,這個問題也有待解決。但總的來說,公司會越來越意識到他們所持有數據的價值。
當然,還有一些人工智能初創公司并沒有遵循上述任何一項選擇,而是憑借自身算法的優勢取得了不錯的業績,例如DeepMind(2014年被谷歌以5億美元收購)和MagicPony(2016年被Twitter以1.5億美元收購)。但這條路是很艱難的,在沒有專有數據集的情況下,要保持競爭優勢要困難得多。
2. 為人工智能初創公司籌集資金非常困難
籌集資金是創業過程中最困難的部分之一。這一過程中其實包含很多技巧:講好故事、推銷、商業頭腦、法律等等。為一家人工智能初創公司籌集資金則格外有挑戰性。
圖源:unsplash
我們原本以為,如果創業的想法和團隊足夠強大,并且有足夠的吸引力,那么我們就能夠籌集到資金。然而,我們大錯特錯了。
創業之初時就考慮可能的資金投入至關重要。不同的資助者有不同的目標和限制,從一開始就認識到這些是很重要的。早期創業的兩大出資人是:
- 技術風險投資(VC)——對早期公司的機構投資者。在創業初期,他們主要關注三個方面——強大的團隊、龐大的市場規模和良好的初始吸引力。
巨大的市場規模至關重要。由于風投通常會將大量資金投入風險極高的企業,他們會預計自己的大部分投資都會破產。所以為了投資成功,他們不僅需要看到超過10倍的回報,還需要看到時間周期在5年之內的回報。這意味著如今風投支持的公司通常是專注于顛覆大型行業的SaaS初創公司。
如果你接受了風投,那么創始團隊通常對公司的控制權較小。大多數風投者堅持持有優先股(如果公司以低于他們投資價值的價格出售,那么你可以收回股權)和擺脫創始團隊的能力(盡管這一點很少踐行)。
- 天使投資者——天使投資者的形式和規模各不相同。有的希望與風投一起投資,有的則希望能提供更穩定的資金。天使投資通常意味著你保留對自己的企業擁有更多控制權。在英國,除非你有良好的人脈,或者之前有過成功的創業經歷,否則很難籌集到超過50萬英鎊的天使投資。大多數天使投資者會在10年左右之內退出。
基于上述的限制,為人工智能初創公司尋找投資格外有挑戰性。
首先,人工智能初創公司比起SaaS初創公司通常需要更長的起步時間。人工智能算法依賴于數據,而大的數據持有者通常是大公司,而通過任何方式獲取獲取大公司持有的數據都是很耗時。即使你可以訪問數據,你不僅需要關注業務開發和軟件平臺(和在SaaS初創公司一樣),還需要關注人工智能算法。
考慮到你需要更專業的技能,加之更長的起步時間,這意味著通常需要更多的資金來啟動一家人工智能初創公司,這些資金需要是“穩定資本”。對大多數創始人來說,這就排除了長期天使投資的可能性(除非你人脈非常廣)——因為所需的資金數額實在是太大了。
但當你向風投推銷時,就是在與傳統的SaaS公司競爭。如果一切順利的話,這些SaaS公司可能會獲得更快的回報。SaaS是一種很有吸引力的商業模式,它有定期的經常性收入,而且即使用戶不經常使用該服務,他們也會忘記取消訂閱。
在過去的十年里,SaaS商業模式對風投來說是非常成功,很多風投都陷入了這種思維模式中,但這種思維模式并不適用于很多人工智能初創公司。很多人說對我們說:“有了訂閱收入后再來找我們。”
大多數人工智能初創公司會發現,至少在最初幾年,你很難產生訂閱收入,你需要采用一種完全不同的商業模式。你的提議需要更有說服力,才能籌集更多的資金。
3. 根據用例,可解釋性是關鍵
即使你有專有的數據集和出色的產品,也并不一定意味著你的產品會取得成功。如果你正在創辦一家人工智能初創公司,一定要對人工智能和機器學習有一定的了解。然而,一般人并不熟悉這些話題,他們還可能會懷疑自己的潛力。
簡單來說,你需要令人信服的證據來證明你的模型能順利運行。現場演示可能有效。如果還不足以為信的話,那就嘗試使用具體的、精心挑選的例子,而不是高精確度的數字。這聽起來可能有悖常理,如果你有數學背景的話會更有體會。
能夠解釋模型的預測將增加人們對模型的信任。根據你的用例,能清楚地解釋你模型的每一種預測通常與精確度同樣重要。可解釋性是一個很寬泛的話題,但總的來說,你的解釋要盡可能得讓人容易理解。
經驗法則是,每個個體的預測越重要,其可解釋性就越重要。
圖源:unsplash
人工智能是一項令人驚嘆的賦能技術,毫無疑問,它將在未來幾年對我們的生活產生難以置信的影響。但這并不意味著創立一家人工智能初創公司很容易——其實困難遠非如此。
我逐漸了解到創立人工智能初創公司有許多獨有的困難,有許多方面沒有得到充分的重視。在創立了PharmForesight之后,我堅信亨利·福特(Henry Ford)的名言:“真正的錯誤是我們沒能從錯誤中學到經驗。”
前車之鑒后事之師,我們犯過的上述錯誤,希望各位可以引以為戒。