騰訊“混元”AI大模型刷新CLUE分類榜歷史記錄
4月29日,騰訊“混元”AI大模型在CLUE(中文語言理解評測集合)分類榜中取得第一名,分數突破 80.888分,接近人類語言理解能力,刷新該榜單歷史記錄。
這是“混元”AI大模型在斬獲跨模態檢索榜單大滿貫后,取得的又一突破性進展,展現了該模型在自然語言處理上的實力。
隨著國內人工智能技術的不斷發展,NLP(自然語言處理),即如何實現人類和計算機之間的語言交互,成為預訓練模型的核心能力之一。當前,越來越多的企業和組織投入到該領域的研究當中,在各大AI榜單上的競爭也非常激烈。
作為中文最具權威的自然語言理解榜單之一,CLUE包括文本相似度、分類、自然語言理解、閱讀理解等 9項任務, 涵蓋搜索、廣告、推薦等業務場景,對預訓練模型的通用理解能力及知識遷移能力要求都很高。
騰訊“混元”技術團隊模擬“人”的學習習慣,首次提出“課程學習”的訓練方法,有效提升模型性能。具體來說,就是讓模型進行從小到大、從易到難的“漸進式”學習。這種方式不僅使得模型通用性和復用性更好,還能有效縮減訓練成本,讓大模型更快地學會更多的知識。
此次登頂CLUE分類榜榜首,一方面代表了“混元”AI大模型在自然語言理解領域的實力得以驗證,達到業內領先水平;另一方面也預示著混元正在通過技術創新實現更為全面的能力,能夠為行業應用和學術研究帶來更多長期價值。
據了解,“混元”AI大模型同時具備自然語言理解、計算機視覺、多模態內容理解、文案生成、視覺生成等能力。同時,借助騰訊太極機器學習平臺的GPU算力和訓練加速框架,“混元”實現了穩定、高效的模型迭代。
目前,“混元“AI 大模型已經廣泛應用于騰訊微信搜索、騰訊廣告等業務場景,提升了搜索體驗和廣告推薦精準度。未來,隨著研究的進一步完善和業務實踐的不斷深入,“混元”AI大模型將賦能更多業務場景,幫助精準理解用戶需求,更好地服務用戶。