編輯 | 言征、伊風
出品 | 51CTO技術棧(微信號:blog51cto)
3月20日,Kimi概念股直接漲停。潑天的流量蜂擁而至,打得猝不及防,一時間難以接駕,以至于一大早9點半開始,Kimi就宕機了。即便月之暗面的技術團隊已經應急進行了5次擴容,依舊對這突如其來的“寵幸”應接不暇。月之暗面發公告稱:這種情況預計會延遲到25日。
圖片
經《科創板日報》記者測試,月之暗面旗下大模型應用Kimi的App和小程序均無法正常使用。此前,月之暗面發布情況說明:從 2024.3.20 9:30:00 開始,觀測到 Kimi的系統流量持續異常增高,流量增加的趨勢遠超對資源的預期規劃。
這導致了從 2024.3.20 10:00:00 開始,有較多的SaaS客戶持續的體驗到 429:engine is overloaded的異常問題,并對此表示深表抱歉。
圖片
“作為一家以技術為導向的公司,我們非常理解一個API的穩定性是能否投入實際生產的最關鍵因素之一,已經有多項應急措施正在實施,包括不限于:從3月20日觀測到流量異常增高后,已經進行了5次擴容工作。推理資源會持續配合流量進行擴容,以盡量承載持續增長的用戶量;設計了一套更有效的SaaS流量優先級策略,以保障付費用戶的調用穩定,預計3月25日之前完成并上線。”
1.真正讓用戶用得爽的大模型對話:開啟“長文本”時代
3月18日,月之暗面宣布了最新的重大技術升級:上下文窗口由20萬字提升10倍到200萬字。200萬字,這是怎樣一種概念?
對于愛閱讀的朋友而言,相當于2~3套《三體》全本,對于學法律的朋友而言,則相當于117部憲法的長度,對于高中生而言,相當于一下70本語言教材。
這些只是數字,更為打動人的是,這么長的窗口才是大家使用生成式AI產品“最舒服”的窗口長度,月之暗面(現在已改名Kimi大模型)已經找到了這個臨界尺寸。
200萬字的無損上下文窗口是符合用戶使用習慣的臨界點。太短的上下文窗口限制很難迎合用戶一次就想搞定解決問題的沖動和習慣。
這樣就可以批量處理涉及諸如比較、總結、概括、篩選等許多頻繁的文字處理工作,這一點是找對了用戶使用場景的痛點。
來源:AIGCLINK
而擁有200萬字以后,體驗就變得非常耳目一新了。Kimi 可以幫HR批量篩選出符合條件人才簡歷,可以幫研究人員快速整理多篇相關論文的創新點等等。
2.Kimi:總結歸納的利器
3月,Kimi Chat改名為Kimi智能助手,同時Moonshot大模型改名為Kimi大模型。“以后只要記住Kimi就夠了!”
打開Kimi官網,你會發現非常多與其他大模型產品的不同之處,其中最為明顯的就是它可以支持上傳多達50個100M以內的文件,這個要比國內外大多數大模型產品都要牛逼。
圖片
Kimi的主要功能是進行基于文本的信息檢索、數據分析、語言翻譯等工作。雖然支持上傳圖片格式的文件,但仍然圍繞著文字提取和總結,并非提供多模態功能。
圖片
3.實測:RAG技術非常友好
Kimi采用的RAG檢索增強生成(Retrieval-Augmented Generation)技術,這一技術能讓Kimi根據用戶提供的prompt進行網頁搜索,獲得更多參考資料以提升生成回答的精確度和內容質量。
圖片
從上面的案例可以看到,擁有RAG能力的Kimi可以幫助用戶降低搜索信息的成本,同時搜索使得Kimi大模型能夠訪問最新的外部數據,保證回答內容的時效性。
由于網頁內容的多樣性和理解復雜語言帶來的困難,Kimi對搜索信息的總結不能排除幻覺出現的可能。但是他提供的資料讓用戶可以方便的追溯到具體的信息源,從而對AI生成內容進行檢查和優化。
4.比ChatGPT好用?
正如AIGCLINK社區測評后對升級后的Kimi所說, 最大的亮點還是超長文本窗口,實測并沒有外界所說的神乎其神,要客觀看待!
圖片
同時,實測視頻中也指出,Kimi在英文翻譯能力不如ChatGPT。
當然, 也有資深的AI研究人士表示,Kimi對于數學題,也并不那么擅長。
圖片
小編也實測了一道奧數題,文心一言答對了,但Kimi似乎有點把自己整懵了。
圖片
然后,推理能力也不太擅長。
圖片
同樣的問題,放在通義千問,得到了正確的回答。
圖片
據悉,有字節的朋友也曬出測評:1萬長度的時候就開始出現幻覺了!
圖片
5.不一樣的Kimi:年輕、技術信仰、最晚考慮商業化
2024年,是大模型公司落地、應用之年,大模型CEO們從開年之后,就一直處于理想與現實的劇烈拉扯之間,中國互聯網素來充斥著商業化的聲音,而這位月之暗面卻非常獨特:AI研究員背景的年輕創始人、頭部國產大模型獨角獸中人數最少的一家(只有80人),沒有選擇對手們認為更穩妥的to B生意,也沒有在在醫療和游戲等細分場景中找機會,而是選擇做且只做了一款to C的對話產品——智能助手Kimi,沒錯,Kimi也是楊植麟的英文名。值得感嘆的是,楊植麟傾向于將他的公司看作是構建一個結合科學、工程和商業的系統。
3月中旬,Kimi迎來了重大升級,上下文窗口已經支持200萬漢字輸入,這一下點燃了用戶對于生成式AI技術的使用熱情。(最新的Geimni 1.5,也只有100萬tokens)
圖片
6.寫在最后:大模型應用落地的兩個條件
月之暗面是AI領域新秀,也是資本的寵兒。之所以能贏得資本熱捧,錨定長文本無損壓縮是其中關鍵因素之一。固然在數學解題和多模態能力暫缺或稍弱,但其長文本處理能力卻的確讓人眼前一亮。
楊植麟曾公開表示,長文本作為公司“登月”的第一步,是新的計算機內存,很本質,個性化并非通過微調實現,上下文定義了個性化過程。楊植麟還認為,大模型“馬拉松剛開始,接下來會有更多差異化”。
銀河證券認為,2024年AI應用元年有兩個條件:1、大模型達到可使用狀態:這點從Kimi用戶好評如潮中可以看出;2、大模型公眾可觸達:目前Kimi已經面向全社會開放使用。Kimi智能助手是AGI進程中的不可忽視的地標之一,或許意味著大模型將正式進入“長文本時代”。
期待未來Kimi給我們帶來的驚喜:“每一次,都集中全力!”