DeepSeek的爆火,背后是這些啟發 ...
關注AI大模型技術的朋友們,在歡度春節的這些天,一定有被國產大模型底座DeepSeek的”橫空出圈"霸屏了。
國產化大模型在算力更加“節約”的情況下,研發出了近乎和OpenAI GPT-4o同等“聰明”的大模型底座,極大地激勵了國人對于AI技術研發的信心,同時也給國內外同行們帶來了不少“焦慮”與“反思”。
與其他主流大模型相比,正如DeepSeek的中文名“深度求索”想表達的,它在解決具體回答任務時,不僅關注“端到端”的一問一答結果,更加關注這個答案是怎么得到的。
這個AI模型會像人一樣思考,把任務分解,給出分析框架,然后逐步完善創作類答案的內容細節或計算任務的解體過程。
因為過程合理,所以結果更加make sense,仿佛真的是很深思熟慮給出的結論,而不僅僅是從資料庫里找一些相關的答案隨便拼湊應付個結果。
下面主要從兩個方面來聊聊DeepSeek對我們的影響。
其一是,對于AI技術研發企業或團隊的影響;其二是,對于普通人的影響。我想這兩個問題都是大家非常關心的。
眾所周知,如果想構建一個新的AI模型,主要有三個關鍵的影響變量:算法、算力、數據。DeepSeek之前出現的一些“頂級”大模型,多數對算力有很大資源要求。
這就導致ai大模型底座的研發成本“居高不下”,成為少數“大廠”的專利。同時,ai大模型產業,對gpu等芯片廠商也產生了極強的“供應鏈"依賴。
值得注意的是,算力只是ai成功的因素之一,算法和數據同樣重要。而DeepSeek,就是從算法尋得突破的!
DeepSeek在訓練大模型底座時,巧妙地運用強化學習技術,讓模型本身在解決問題的思維過程上不斷得到提升。
DeepSeek在有限的數據樣本中,得到更多的關于思考方面的啟發,從而讓ai技術回歸本質 —— 對人的思考方式和解決問題的邏輯的模擬,而不僅僅是追求“正確答案”。
DeepSeek的成功讓國內外都為之震驚的是,該模型打破了所謂的Scale Law魔咒,讓人工智能技術研發重新開始關注算法策略的重要性!
與此同時,DeepSeek的模型訓練對于數據質量的要求也是非常高的。其采用了很多高質量的COT(思維鏈)數據。
這類樣本數據不僅記錄了問題輸入和答案輸出,還詳細地描述了每一步的“解題”過程。
這也是ai技術的魅力所在,“暗示”ai廠商不要過度迷戀粗放式的數據投喂,而是關注如何讓機器更好地學挖掘數據的深層次價值。
從另一方面看,隨著ai算法的不斷優化,大模型底座訓練和推理成本同步降低!
這讓更多有技術能力的廠商和研發團隊有機會參與到“百模大戰”,突破算力資源匱乏的技術瓶頸,在未來5-10年將會不斷出現更多“令人振奮”的底層能力創新和應用場景創新!
對于普通人來說,相信不少人都已經試用了DeepSeek的創意作詩、寫文案、實事點評這些熱門功能。發現ai技術的產出確實“文采橫溢”,甚至達到“以假亂真”的效果,很多ai文稿的質量已經超過了大多數普通文字工作者的水平。
與此同時,DeepSeek在寫代碼方面的能力,也幾乎可以替代一般的程序員——只需要把產品需求描述清晰,立刻就能生成可以直接運行的穩定代碼案例。
難得一個ai產品一經發布,同時讓文科生、理科生都同時焦慮了!似乎未來大多數的職業都在逐漸被ai替代。
有人說,ai降低了一個行業的門檻,因為誰都可以用大模型創作;也有人覺得,其實是提高了門檻,因為如果無法證明人比ai強,企業就沒有動力去雇傭所謂“資質平平”的員工。
智能化技術的進步,讓人們開始反思什么才是真正的職場競爭力 —— 是業務經驗、是創新能力,是溝通能力,是情緒價值,而不是循規蹈矩、墨守成規。
幾乎所有標準化的工作,都可以用大模型復現。以前是規章條例、文案模板、技術公式,現在還包括解決問題的方式方法。
當試用DeepSeek時,你會發現在提出一個開放式任務時,它會很快地告訴你如何科學地、有條不紊地對這個任務進行分解,然后逐步給出細節步驟指導。
然而,這是基于大數據提煉總結得到的常規性手段和策略,盡管做到這一點已經超越了80%的行業從業者。這也就是為什么所謂萬金油的咨詢行業,開始面臨市場寒冬 ...
ai對于垂直行業的替代過程仍然是漫長的。因為光有標準化的“解題思路”還不夠,還缺少業務內容 ...
這需要更多的業務數據投喂,以及不同領域專家在具體ai應用場景中通過與機器交互產生的增量信息對模型能力進行矯正。
需要注意的是,在一個動態、多變、復雜的市場環境中,絕大多數業務問題是非標準化、隨機性強、無先驗案例的(少樣本或零樣本) ...
這也就是為什么很多ai工具看起來輸出形式很爽,業務方卻覺得隔靴搔癢 ...
ai很有用,但人不能完全依賴于ai —— 使用ai的人的認知和業務能力,決定ai工具的效果上限。
即便在業務決策過程中能使用類似DeepSeek一類的大模型工具輔助完成,也是需要根據具體情況來適配,加入專家的行業洞察與經驗預判。
這個過程就像炒菜一樣,機器只能搞定前面食材準備的工作,至于最后烹飪的火候、調料配比,也只有“主廚”(人)才能心領神會。
這也是人難以被替代的環節!大模型技術會讓普通人更普通,強者更強 ...
當機器變得越來越像人,那么對于絕大多數普通人來說,只有不斷學習和成長,努力讓自己的能力體系盡可能地與機器產生差異,才能證明自己的職場稀缺性與獨特的社會價值!