王小川當場自曝:為什么百川不做Sora;生命科學是下一個互聯網;大模型創業有兩大誤區;AGI5年后就會到來 原創
編輯 | 言征
出品 | 51CTO技術棧(微信號:blog51cto)
王小川不止搞大模型,這次真的要在醫療行業搞出大動靜來了!
12月14日上午,百川智能王小川在與極客公園創始人張鵬進行了一場圓桌對話。對話中,王小川公開透露了進入下半年來,有些低調的百川究竟在做什么事情,更是抖出了很多有關百川智能成立前后的趣事,比如百川的“百”是怎么得來的,以及如何跑步入場贏得投資人信任、拿到融資的,并詳細闡述了在中美博弈的環境下,自己在大模型和業務場景如何做考量的創始人邏輯,信息密度很大。
王小川還自曝自己讀的醫學方面的書籍要比讀的計算機方面的書還要多;明年,百川智能要推出一系列的應用,而且有希望其中某一款能在醫療健康領域引爆巨大的想象空間。
此外,百川智能為什么不做Sora?為什么不做AI搜索?為什么不快速地爭當第一個推出國產版類o1的模型?這些王小川都一一給出了自己的考慮。
這里先摘取一二,供各位先睹為快:
1.去年第一天做的時候,我就想跟我的投資人說,嘿,我們做health,但是我朋友說,大家不會信的。
2.今年百川在轉變團隊,之前提倡團隊的“含模型量”,現在我兌現團隊中的“含醫療量”。
3.這是一個釋放自我的過程。因為我一直在醫療這條賽道,只是大模型的到來能夠讓醫療變得更加地落地。
4.先有的“百”后有的“川”,“百”在“川”之前。應用上一定得要引領這個模型的的進展,否則這個題目解不開了。
5.年我提出了“理想上慢一步、落地上快三步”,即在跟進OpenAI過程中要謹慎,不能揪著他不放,但在應用上要快。
6.醫療行業核心有兩個東西:一個是造人、造醫生,第二就是有更多的數據。
7.生命健康是下一個互聯網。
8.如果給 5 年的時間,我會認為 AGI 就已經到來了。
下面是小編根據現場對話內容做的整理。
1.王小川匯報:下半年都去做啥了?
張鵬:小川總,快來為大家匯報一下下半年的工作。
一方面去年組建通用人工智能的模型和團隊,另一方面,今年尤其下半年以來,我們更多、更密集地去在醫療領域進行布局,不斷釋放醫療的信號,同時轉變團隊,之前提倡團隊的“含模型量”,現在我兌現團隊中的“含醫療量”。在醫療上百川有大量的專業人士的進入。因為醫療領域不是純toC事情,還有諸如監管等問題,因此除了人才進入,我們已經開始就一些產品跟醫院、地方政府等醫療行業的從業人員進行溝很多的溝通交流。
所以,我認為這也是一個更多釋放本心的狀態。以前大家認為王小川是做互聯網、做AI。今天我想告訴大家,我對醫療的興趣可能會從一名愛好者變成大家眼中的專業人士。
張鵬:是不是感受到AGI這件事離得太遠,發展減緩了,所以改做醫療了?
王小川:我認為這句話說反了,2000年研究生畢業時做的研究工作就是基因測序的拼接算法,一直好奇生命背后的數學模型是什么,這是縈繞了我20年的夢想。這也是2021年自己把公司賣給騰訊的時候,就曾經公開說接下來20年自己要做醫療健康和生命科學的原因。
所以說,醫療一直是一個“我認為非常有愿景”的夢想,反而是因為AGI的到來,將把我的愿景拉到了現實,使得生命科學領域的數學方法能走得更近了。
2022年后來我創建了一家生理信號數字化的公司,然而在我2023年創建百川智能中間,其實是有一個接地氣的過程,是AGI來了,使得醫療可以做得更快。
正如黃仁勛之前說的,從今天開始,大家都不要去學計算機了,反而應該去看生物醫藥等行業,而英偉達也把大量的算力放到醫療的支撐上。
Anthropic CEO Dario 在年中左右寫了一篇萬頁文章來描述愿景:先是AGI的到來,隨后才去采取解決生物醫療的問題。有了AGI之后,接下來會在未來5~10年的時間去做實驗來解決未來50~100年的科學問題。所以不管是黃仁勛還是Dario都是把生命科學放到AGI之后,而不是反過來,因為這樣才有可能讓生命科學這件事更加地落地。
另外,大家可能不知道“百川”這個名字是怎么來的,“百”怎么解釋?其實這里的“百”不是“百度”而是“bio(生物)”,一開始我們想的另一個名字是“bio-found”(百放),后來跟投資人對話的時候,給了一個建議:把自己的名字放進來,就成了百川。其實是先有的“百”后有的“川”,“百”在“川”之前。
所以說,這是一個釋放自我的過程。因為我一直在醫療這條賽道,只是大模型的到來能夠讓醫療變得更加地落地。
我將人類的文明會分為三個階段,第一個階段是物理學的世界建模(物理學),對人的活動行為做世界建模(語言認知今天的階段)、生命體建模(融合了客觀世界和主觀世界)。而醫療就是生命體建模領域的一個vertical。
所以說,我只是不小心在互聯網走了一圈,醫療一直是我的夢想,熟悉我的朋友都知道,小川居然還搞中醫,其實我讀醫學的書都要比讀計算機的書要多。所以
我很好奇生命背后的數學模型究竟有哪些東西,從信息時代到智能時代之后,離我的生命科學夢想更近了。
很幸運這個時代,自己沒有錯過,百川智能屬于“跑步入場”的新成立的大模型公司。
2.AGI是不是發展變慢了?
張鵬:AGI發展是不是變慢了,如何看待?
王小川:之前大模型突破了圖靈測試,現在大家覺得還不夠,認為它還需要會做數學題、邏輯思考、甚至不斷的主動自我學習的能力。但其實AGI在我看來,更多還是像人一樣,它能夠在多個職業里面像員工一樣產生工作。
之前曾經有一位投資人說:大模型現在連7位數的乘法都做不好。我當時就懟了一句:你會嗎?
所以說,很大程度上是人們對于大模型的審美的問題,不應該總是把大模型當成“超級計算機”一樣的工具。我們人類都做不到的事情,又怎么能要求AGI會呢?
而在像人的領域里面,大模型取得了非常大的進展。去年,大模型已經成為了一名頂尖的文科生,對語言的理解能力已經相當不錯,寫詩寫文章都很棒,僅僅一年,隨著今年o1的推出,大模型不僅是頂尖的文科生,也成為了極其優秀的理科生,學會了復雜問題的推理能力。從人的角度上看,短短兩年的時間,大模型發展速度非常快,已經做到了文理兼優。
但大模型不是上帝,有了這些能力,他就真能知道宇宙的規律嗎,它就真能成為一名特別好的醫生嗎?也不會的。它必須要從外面世界合作,進行數據信息的學習。
整體看,它已經具備了人們理解世界的知識,以及掌握了大量推理的范式,進化速度非??臁?/p>
另一方面,之前總是酸酸地diss“AGI到來”的Meta大佬Lecun也改口了(一半),認為雖然路不同,但AGI會在未來幾年內實現。
所以說,本身AGI的發展已經非??炝?,2年的時間就完成了人類幾千年的事情。可能是大家對于這件事有了過高的短期期待。
3.百川為什么不快速跟進OpenAI?
張鵬:跟進OpenAI的時候,大家都在快速的跟進OpenAI的發布,爭當第一個國內版,百川是不是有些置身事外?
王小川:首先我認為跟進這件事情,就是要展示自己的力量,不要讓自己掉隊。百川給自己的定位就是要做第一梯隊的大模型,同時在醫療上有突出的超級應用。
另一方面,在跟進過程中容易有兩個誤區:首先,sora和語言模型其實是兩個獨立的賽道。
所以這也就代表著OpenAI現在選擇的ChatGPT、Sora就代表著一定是未來最對的方向。它也需要面對xAI、Anthropic等的競爭,而且尤其對于中國而言,也不一定代表著中國最優的路線,所以一定要在這里面找到自己,不能做一摸一樣的東西。
對于百川而言,我反復強調要以語言模型為中軸,所以我們要更加的專注,去年我提出了“理想上慢一步、落地上快三步”,即在跟進OpenAI過程中要謹慎,不能揪著他不放,但在應用上要快。
那么第二個誤區就是應用上的誤區:超級應用。超級應用是一個繞不開的話題。這方面同樣有字節這樣的大廠基礎儲備操作方面足夠的強悍。因此,這就會給創業公司造成兩方面的擠壓:一方面,技術上也不會超越得了OpenAI,另一方面,應用上也會把自己給擠壓了。所以我們要一定要走出大廠的射程。
4.為什么不做AI搜索?
張鵬:說到這里,我想追問下,為什么不去做AI搜索版本的搜狗輸入法?
王小川:在做搜索方向的時候,我們當時觀察到了兩個趨勢:一個是從搜索類問答,你輸入一半就幫你把下一半內容補充好。 另一個就是推薦。這兩個功能在智慧輸入方面已經具備了,所以說今天的技術一旦到位之后,輸入法就會自然的演變。大家也看到騰訊最近對搜狗輸入法做了智慧升級,只要點一下就能激活這兩塊能力。這個過程有點像蘋果原始版的音箱,一開始很蠢,現在的Siri就變聰明了。
雖然當時我們已經想到了產品形態,但當時技術做不到,因此到現在,我們認為這部分原來的know-how和機會已經不屬于我們,你不太可能再去跟原來有基礎的大廠去就“搜索輸入法+AI”再去pk它。所以說我們不僅要走出自己的射程,還要走出大廠的射程。
AI搜索也是同樣的道理,雖然我們看到OpenAI、Anthropic等都在做AI搜索,但對于中國而言,雖然AI搜索有可能顛覆百度,但依然在自己的射程里面。這里有幾個考慮:從競爭角度考慮,一方面你搞不過大廠,另一方面小型富有激情的創業公司在對需求的敏感度上有著獨特的優勢,如果你每個都跟進,也會把中型公司撕個粉碎。
中型公司一定要走自己的道路,其實有自己的機會。就醫療而言,就是一定要做vertical,一方面小公司不一定做得動,大廠在醫療方面的投入因為非常高的創新要求,已經降低甚至裁掉了,反而我們在這里面有著自己的身位,而且可以去做持續地創新。
此外,我認為醫療還可以倒過來跟AGI一起進步。對比,賺了錢還可以繼續走技術的道路。獨有卡位的vertical。
但倒過來的話呢,我又覺得醫療它還不止是一個 vertical,就像進化論里的進化樹一樣了,有些分枝進化到后面可能就就停住了,也許它長出很好的一個業務來,但他不是跟AGI同期進步的,之前大家提用AI寫廣告文案,這個東西是很酷,很快就可以賺錢,但是這真的可以持續進化嗎,他不需要把 AI最前沿的技術給用進去,而醫療的話呢,就可以往AGI去走,會牽引我們的多模態,比如我們需要做病理的片子的這種識別,還需要足夠好的溝通能力,同理心,或者說長的記憶力,對 transformer足夠長,能把你的這個是這種生命周期的數據給用起來,此外還有反幻覺、復雜推理的能力,都可以去用,
所以對這個來講,使得我們就不會停在一個這個賺了錢或者有業務之后就不追究技術的道路,但是反過來的話呢,我們從從今天這叫智能時代走向我人講生命變數學時代里面可能會越走越廣闊,那是我覺得今天是特別好的。
現在我們叫一個獨有的卡位或者 vertical,但是我相信在3年/5年后,大家會看到它不再是個 vertical,它可能代表更廣闊的一個未來,就像互聯網,當年大學時候是一個 vertical,最開始的時候就是一個小分支一樣,當時我們有招進來一個在IBM實習的同事,有人會驚訝你原來在IBM竟然跑去做網站?就會覺得很詭異。
但結果發現互聯網代表了整個世界,所以我也就會覺得這個對生命健康在以后同樣會帶來更大更廣闊的世界,甚至在以后人類的的生命結構,甚至人機融合方面也會帶來更大的空間。
現在馬斯克也有在講,當機器的在地上跑以后,那在以后,人和人類機器的文明也出現要融合的時候。
5.要不要堅持做預訓練?
張鵬:創業本身是一個從一個山頂到一個谷底,再重新攀爬到另一個山頂的過程。您怎么看國內大模型在預訓練遇到了較大的壓力,還要不要堅持做?怎么理解這種變化?
王小川:預訓練目前是個大問題,這是中美博弈中間的一個關鍵的戰略資源,如果說中國沒有訓練權,那我們中國手里面的底盤就會被別人給抽掉,所以預訓練,中國的一定要自己掌握。
但尷尬的地方,我們在卡的算力的投入又沒有美國大,所以這種情況下,東方不亮的,西方就得亮,在我看來,預訓練我們得做,但是我們這得有很大的一部分資源和精力要放在把一個超級應用打開,在打開的同時提升自身預訓練的能力。所以不能說等預訓練走到頭之后再去想我要為什么樣的業務方向。所謂的場景摩爾定律,我覺得這件事情在中國是不現實的,
嗯,在中國是反過來說對場景要深度的理解,讓場景帶動預訓練。這是百川的定義上的選擇,就超級模型和超級應用如何處理?應用上一定得要引領這個模型的的進展,否則這個題目解不開了。你說做模型,朱嘯虎說這個東西你不賺錢。。
然后你你去賺錢,然后就有人說你沒未來,好像做都會錯。所以就要在現實和理想中間找到一條自己的道路,百川認為自己已經是在打明牌,給大家一條實踐的路徑。
6.如何跟投資人講故事拿錢?
張鵬:在投資人面前遇到兩頭堵的問題,你會怎么做?
王小川:這里我要講一個邏輯,可能大家會誤以為是什么陰謀詭計,但其實沒有的。去年第一天做的時候,我就想跟我的投資人說,嘿,我們做health,這個邁向未來,比大模型更加性感。但是我朋友說,大家不會信的。你又不是個醫生,又不是個院士,你就得講大模型。
當然,我認為大模型是推向未來的路也沒錯,你需要頂尖的大模型才能夠通向未來的醫療健康。所以去年的時候我們的故事是講大模型,但同時我們也三個重要的愿景方向:健康、創造、快樂,其中健康就是作為了其中的一部分。所以去年我們發布百川、百川2、百川3、百川4,基本上是隱藏了我們在醫療上的想法,這種情況下得到了投資人的認可,現在被大家稱為“六小龍”之一,有了這樣一個身位。
那回到今年,我們認為在定位上,希望自己不僅是大模型公司,而且是在醫療上是更加的專注的頭部公司。就今天而言,好像這個故事也會得到新的買單。比如一些投資機構里面,他們會覺得只提大模型的故事,就開始覺得不夠了,一定得有場景落地。你既是頭部的大模型公司,又有場景,甚至場景故事能足夠大,那么大家就會對你認可。
在明年時候,我們規劃會有一些新發布,我認為到時候會至少有一種可能性促成自己具有這么巨大的市場空間的定位。中國的醫療行業講呢,也存在收入不夠高的擔憂,很多人都會問醫療的買單方是誰的問題,今天剛看到一個新聞報道,說中國器材把藥價降得特別低,但好消息是,現在AI賦能是一個鼓勵的方向。大概兩周前發布了一條消息稱AI的服務現在可以包含在醫保部分了。這就撕開了口子,以前的話醫保服務要么給藥,要么給器械,要么給醫生,但現在AI這項不是在器械里面, AI不是在藥里面,而是在醫生服務里面,所以最后一樣的,我們是在造人,這就開始撕開了一個口子。
另外我認為更大的空間,未來可能是在海外。如果是互聯網模式,出海是很難的,你很難指望一個好答復出海,但如果只是一個 AI的醫生,那出海是有機會的,甚至實在不行的,我就去做寵物/動物醫生也行。
我相信對只要對生命負責任,他就該有最后的商業回報。符合第一性原理的東西最后都可以獲得回報,譬如說無人駕駛,很多人說現在監管有多難,有多大的瓶頸,也都有人去做,那我認為造醫生這件事是比無人駕駛只大不小的事。
醫療行業核心有兩個東西:一個是造人、造醫生,第二就是有更多的數據。當你有更多的數據之后,你就對世界有更深的認知,你的AI for Science就是有基礎的。那么現在醫療行業是高度缺乏數據的,缺乏科學實驗數據的行業,因此我有意識中間去做搜集,因此會得到一個對生命更多的理解認知,我認為它最后會獲得商業回報。
7.百川產品上都有哪些進展
張鵬:產品和能力構建方面,有哪些進展?
王小川:我們在跟醫院合作,跟區域衛健委平臺合作。9 月份百川以兒科為切入點和北京兒童醫院達成了合作,行業覺得我們做得對,因為當家長的知道,小孩總是生病,一生病就得往醫院送,自己請假去醫院還可能交叉感染,還有醫療擠兌的問題。
不是嚴重的疑難雜癥的話,兒童生病的問題沒有那么難。我們切入時的要點是,對于 AI 的專業性要求沒到頂尖那么高,從底層往上走,同時又會從痛點切入,因此兒科會變成我們戰略上的卡位。本來打算先拿技術說服大家,最后發現是靠先布局卡位,再來填技術。
我們跟兒童醫院合作之后做一大四小,四個場景模型「居家、社區、醫院、智控」。最近我們做了一些測試,拿了 11 個專業題,在各個在線平臺上找很多醫生去測,互聯網線上都有找醫生的平臺,9.9 元級別的正確性在 30%。再好的話,像 76 元級別的醫生,準確性能夠到接近 70%。
百川的 AI 醫生準確度略高一點,但是比不了更專業的醫生,比如說像北兒醫生,接近 200 元的在線服務,能夠達到 90% 的準確度。百川比頂尖醫生弱,但比市面上大部分平臺做得更強,這是今年的現狀。未來,我們的 AI 醫生需要拿證,通過 CFDA 的認證,還要做個人一致性的評價,甚至要去定級再上崗。現在有小程序試用,到明年會拿出足夠專業性的應用。
一方面做技術,另一方面還有跟監管部門打交道,面臨衛生經濟學者的評價,考察我們是否真的對社會有幫助。在這條路徑上,不像做互聯網那樣無拘無束,推出來引爆市場就夠了,醫療上要通過很多監管責任。一方面做技術,一方面也要服從于循證醫學或者整個監管的體系。
王小川:兩個維度,一個是主任醫生、副主任,另一個維度就是在線平臺不同費用的醫生,在線可以做比較,按照疾病、病種再去劃分,精細化做比較。
今天國家也好,醫療工作者也好,他們非常擁抱訓練醫生或者專科能力的模型。另一方面,醫生也都在好奇模型如何去評價他們,如何定級。
所以會產生很多需要政策解決的新狀況,像醫療器械定型就不能改了,改個元器件需要重新審核,一下子幾個月就過去了。你寫的軟件代碼或者硬件不能變,聽起來很合理,遠期來看不現實。
曾經我做過地圖,需要給測繪部門審核,以前地圖為紙圖服務,一旦定稿之后,上面一點符號都不能變。今天大家用百度地圖,改個路、換個車站,地圖就變了。
所以醫療監管審核體系在 AI 介入后必須產生變化,因為 AI 能力每天都在進步,如果讓它不能動,就會有很多障礙。我們會面臨監管和現實之間的沖突,如何評價你的醫生,能不能上崗,面對變化怎么改,出了事故怎么管,這有大量的功課要去做。
8.AI醫療的發展路徑
張鵬:如何看待AI醫療的發展路徑?
王小川:三個概念:以醫院為中心變成居家為中心。以前大家洗澡都是在大澡堂,現在每家都有自己的浴室,這是愿景的一部分,可能也是在近幾年尋求突破的點。
從醫生為中心,變成患者為中心,如果數字問診背后不是專業大醫生,而是 AI 醫生,大家心理上也能接受。
從疾病為中心,變成健康為中心,每改一步都面臨大家內心的文化挑戰,還有技術難度。有的醫生在醫院知道怎么工作,到家就不會了。
怎么造醫生,而且改變醫生工作的路徑,我們做了一年,適配時發現還得跟院內做配合。你去醫院時,醫生就是開盲盒,有 AI 輔助之后,去醫院之前 AI 會先跟你做很多輔助性提問,甚至把你分配給不同的醫生,醫生也不用開盲盒了,你也找到了對的醫生。從醫院到居家時,中間有很多過程,需要把理想跟現實做更多結合。
9.明年Agent 即將爆發,5年后AGI到來,10年實現生物自由
張鵬:你認為 2025 年、5 年后、10 年后、20 年后,你所投身的大模型和 AGI 領域,接下來對這個世界會帶來怎樣的變化,你能不能在這幾個尺度上能夠簡短給一些結論。
王小川:明年是 Agent 爆發的一年,在具體場景里,AGI、大模型有一些充分的表現,新的物種會產生,明年百川智能也會有各種各樣的醫生產生,也會跟醫院做很多合作。
如果給 5 年的時間,我會認為 AGI 就已經到來了,我自己有個定義,就是能夠造出一個真正的醫生 AGI 就到來了,不僅能夠給藥,還能解決各種復雜的生理問題,還可以做日常陪伴,而且它還很聰明,能了解你的個性,這就是私人醫生。
還有其他物種也會產生,我們開始擁抱 AGI 變成某種職業的人融入社會,硬件方面也開始逐步起步了。人類有新的伙伴。
到未來 20 年的時候,隨著新的物種和人的進入,能夠產生大量科學實驗,通過實驗可以獲得更多數據,我們開始攻克生命問題,人類對自然界的理解到達新的高度,我們因為它們而更了解這個世界,更能找到人類新的定位,這是一個科學大的爆發。同時,機器人開始滿地跑。
張鵬:所以那個時候人的定位到底是什么?
王小川:作為人類文明的重要一部分,我們跟機器文明走在一起了。
張鵬:剛才你也提到生命自由,這是 10 年維度還是 20 年維度?
王小川:10 - 20 年之間就可以做到。不是生命自由,是不被疾病困擾的生物自由。
本文轉載自??51CTO技術棧??,作者:言征
