梁文鋒到底有多低調?你問DeepSeek官網,連自家的產品都整不會“DeepSeek的創始人是誰”這個問題。
事情是這樣的。小編一位朋友所在的公司近日內部接入了DeepSeek。昨天這位朋友突然找到小編反映:DeepSeek怎么回事,效果這么不好用?緊接著就發了這樣兩張截圖——
圖片
圖片
朋友問DeepSeek:DeepSeek的創始人是誰?這對話框彈出來的結果真的讓人驚掉下巴:
第一張截圖中,DeepSeek的答案:這是一個虛構的公司或組織!所以更不用提創始人了!
DeepSeek 是一個虛構的名字,沒有一個真實存在的公司或組織與之相關聯。因此,無法回答關于 DeepSeek 創始人的問題。如果您有任何其他問題或需要幫助,請隨時告訴我!
第二張截圖更絕了!直接來了個“移花積木”+“偷天換日”:
DeepSeek的創始人是李開復(Kai-Fu Lee)。
發現一:DeepSeek 的訓練數據截止日期,2024年還是2021年?
一開始沒覺得這個問題很有意思,畢竟從截圖中沒有展現出實時聯網的畫面就可以出:這位朋友公司接入的DeepSeek版本應該不高,起碼沒有聯網。
據網上可查閱的資料來看,對于DeepSeek R1 訓練數據截止日期到2024年7月,但具體是否真實,都有待于官方的披露。
圖片
不過,另外具另一位朋友聊天表示:DeepSeek在回答某個問題的思考過程中“暴露” DeepSeek R1的知識庫知識截止到2021年9月。
圖片
而大家都知道,DeepSeek這家公司真正成立是在2023年的5-7月。所以如果說“DeepSeek R1的知識庫知識截止到2021年9月”的假設成立的話,也就能解釋為什么DeepSeek會回答出:DeepSeek是一個虛構的公司,甚至可能會煞有其事的生成一個“幻覺答案”:DeepSeek的創始人是李開復。
但如果根據網上主流的答案:2024年7月,沒道理不知道“DeepSeek”這家公司的成立(除非DeepSeek相關的語料沒有進入訓練庫)。
總之,從訓練語料知識庫的新鮮程度上看,DeepSeek如果沒有聯網的話,大概率是難以回答這個問題的。
發現二:即便聯網,DeepSeek官網也不清楚自己的創始人是誰
本來想著,大概率就是一個訓練數據不夠新鮮的問題,但接下來小編就是想單純驗證下猜測,只要讓DeepSeek連上網,這個問題分分鐘解決!
但DeepSeek的回答讓小編懷疑人生了!小編明明看著DeepSeek自己搜搜了15個網頁,其中很多網頁都寫到了創始人梁文鋒的信息,但DeepSeek就跟睜眼瞎一樣——
好的,我需要回答用戶的問題:“DeepSeek的創始人是誰?” 根據提供的搜索結果,我需要仔細查看每個網頁的內容,尋找相關的信息。
首先看網頁1,標題提到深度求索發布DeepSeek-V3,但內容顯示頁面不存在,可能已被刪除或錯誤。所以暫時無法從中獲取信息。
接下來是網頁2,這里詳細描述了DeepSeek的應用表現和技術成就。其中提到DeepSeek來自國產大模型公司深度求索,屬于量化巨頭幻方量化旗下。但這里沒有提到創始人的名字,只是提到公司由幻方量化創立??赡苄枰M一步確認是否有創始人信息。
網頁3是關于香港公司更名的信息,將Deepseek Limited更名為深度求索有限公司,但內容重復,沒有創始人相關的線索。
網頁4是東方材料的聲明,說明他們與深度求索無業務往來,這里也沒有創始人信息。
網頁5的標題是“82后數學天才:DeepSeek創始人如何成功反轉美股命運”,看起來可能包含創始人信息,但點進去后發現內容同樣顯示頁面不存在,無法獲取詳細信息。不過標題中提到創始人是82后的數學天才,可能指的是某位具體人物,但具體名字未被網頁內容顯示,可能原網頁有但現在的緩存內容缺失了。
回到網頁2,其中提到DeepSeek的創始公司是幻方量化,而網頁5的標題暗示創始人可能有數學背景,并且是幻方量化相關的人物。由于幻方量化是一家知名的量化投資公司,其創始人或核心成員可能也是DeepSeek的創始人。但搜索結果中沒有明確給出創始人的姓名。
另外,網頁2提到周鴻祎評論DeepSeek時,指出其創始人非常低調,這可能意味著公開信息較少。但用戶的問題需要明確回答創始人是誰,目前根據現有搜索結果,可能無法直接找到名字,但可以推斷出創始人與幻方量化有關聯,而具體的個人姓名可能未被披露,或者原網頁5的內容可能被刪除,導致無法獲取。
需要確認是否在搜索結果中有其他線索。例如,網頁5的標題提到“82后數學天才”,可能指的是1982年后出生的數學天才,但具體姓名未知??赡茉W頁內容中有更詳細的介紹,但目前無法訪問。因此,根據現有信息,只能得出DeepSeek由幻方量化創立,創始人的具體身份未被明確提及,但可能是一位數學背景的人物,且保持低調,導致公開信息有限。
最后它回答我:根據搜索結果,DeepSeek是中國量化投資巨頭幻方量化創立的公司,其創始團隊并未在公開資料中詳細披露。但給出了一些線索:
公司是2023年7月成立的,創始人是一位“82后數學天才”,并強調其低調作風和技術實力。周鴻祎曾評價:DeepSeek團隊在對抗美國AI技術霸權中具有重要地位。
圖片
起初,小編還心懷幻想,是不是需要給點prompt給到它:聽說這位創始人姓梁,接著猜猜唄。結果等待我則是那句天天見的“服務器繁忙”,我呵呵了。
圖片
但從這一點,可以看出:DeepSeek R1在解決這個問題的思路是沒有問題,搜的網頁相關性也很強,但挺意外的是——這款聊天機器人似乎對于“梁文鋒”這三個字自動屏蔽了,是公司特意要這樣操作的嗎。
圖片
于是,小編繼續想驗證下這個猜測:DeepSeek團隊或許真的希望回避掉自家創始人這個問題。
我問官網:你的創始人是誰?這次R1的回答驗證了我的想法:
它只回答了自己是誰,是哪家公司開發的,但對自己的創始人避而不談。
圖片
也就是說,不難猜測,官網的DeepSeek產品應該是對模型進行了系統提示詞的調教:不能提及自己的創始人梁文鋒。
不止官網,我們發現最早接入DeepSeek的硅基流動×華為云的入口,同樣也對這個問題諱莫如深,直接來個模型請求出錯。
圖片
但如果你問:幻方量化的創始人是誰?各大入口的DeepSeek都能回答準確:梁文鋒。
發現三:秘塔搜索回答還可以(梁文峰),不錯錯別字可是個大問題
在嘗試其它入口的過程中,我還用了下秘塔搜索(聯網+DeepSeek R1版),想著應該能不負我望吧,但翻車了,還是翻車了!
回答:大部分證據都一致指出了創始人是梁文峰!甚至還抖了一個料說他使用化名張強(大家自行查證哈)。
圖片
我就想說,現在的網頁語料怎么回事,都愛以訛傳訛,以錯傳錯嗎?的確小編注意到一些自媒體文章總將梁文鋒打錯成“梁文峰”,現在好了,依賴搜索能力的大模型被污染的語料給污染了,妥妥的語料投毒了!
看來,大模型產品的自我糾錯能力、確保語料的高質量方面還不能松懈,繼續加油呀!
本來也沒啥,還可以容忍,畢竟是人類的鍋,不能苛責大模型產品,所以我引導了下它,“峰”字不對呀!
結果,接下來的答案讓我整個炸掉了~ 秘塔版的DeepSeek回答我:梁文峰的峰字確實存疑,DeepSeek創始人的準確姓名為陳天奇!
圖片
到此,我整個人都不好了,先去喝口熱水緩一緩。
小編回過神來看著秘塔這全篇的答復,不禁陷入了深思。DeepSeek還是很不錯的,這是幻覺,一定是幻覺!嗯。
發現四:豆包、Kimi反而沒啥壓力,答對了
敗給了DeepSeek的低調,敗給了秘塔的幻覺,終于小編決定:還是讓豆包、Kimi來回答“DeepSeek創始人是誰?”這個問題吧。
豆包依靠6個搜索來源就搞定了:當然是梁文鋒無疑了!一并將跟浙大同學徐進一起創業的經歷都說了出來。
圖片
而kimi則搜索了15個網頁,同樣也回答對了。同樣也是描述了梁文鋒的履歷背景和創業經歷。
圖片
寫在最后
本來是一個無意中的聊天,結果讓小編花了幾個小時進行了求證。對于“DeepSeek創始人是誰”,DeepSeek各種花式回答暴露了當下大模型普遍存在的幾個問題:
首先,大模型訓練語料并沒有很好的向后兼容,很多數據還停留在兩年甚至四年之前,已經嚴重落后于我們實際工作生活的需要。
其次,聯網搜索+大模型是一個不錯的應用方向,許多有參考出處的文檔、pdf資料等讓用戶都感到安全感,然而,參考文檔的質量和真實性、權威性依舊是一個沒有很好解決的挑戰,AI搜索賽道,主打高質量知識庫是命脈所在,時刻不能放松。
再者,大模型聊天產品對于自己家的創始人諱莫如深或許是個行業慣例吧,你問文心一言你的創始人是誰,同樣也不會告訴你是誰。這一點背后的原因是什么呢?還蠻期待有知道的讀者進行解答。
最后,不得不說,梁文鋒大佬實在是一位低調的技術大佬,即便有自己姓名的語料都屏蔽掉了!大家一起期待更多的驚喜吧!