谷歌推出全新模型,將Transformer與NAR相結合
Transformer架構的出現極大推動了大模型的技術創新,誕生出了ChatGPT、Coplit、訊飛星火、文心一言等一系列生成式AI產品。雖然Transformer在自然語言理解任務上表現很好,但在算法推理方面有嚴重的缺陷。例如,當面臨超出訓練數據分布的輸入時,其泛化能力會急劇下降。這主要是因為它們的自回歸性質和掩蔽注意力機制,不符合算法輸出的邏輯順序。而神經算法推理(NAR)在結構化輸入上表現好,能夠處理各種算法任務,并且在面對訓練集...