什么是端到端(end to end)大模型,它和傳統(tǒng)的大模型有什么區(qū)別?其優(yōu)勢與劣勢是什么? 原創(chuàng)
“ 端到端模型,是一個(gè)直接由輸入獲取輸出的過程 ”
最近有一個(gè)很火的關(guān)于人工智能模型的詞——端到端模型。
那么什么是端到端模型?為什么會(huì)提出端到端模型,以及它解決了哪些問題?
今天我們就來一起了解一下這個(gè)端到端模型。
端到端模型
還記得計(jì)算機(jī)組成原理里面,關(guān)于馮諾伊曼計(jì)算機(jī)結(jié)構(gòu)中,組成計(jì)算機(jī)的幾個(gè)模塊嗎?
運(yùn)算器 控制器 存儲(chǔ)器 輸入設(shè)備和輸出設(shè)備,由這五大模塊組成了現(xiàn)有的計(jì)算機(jī)系統(tǒng)。
而對(duì)我們使用者來說,這五大模塊中我們接觸最多的就是輸入設(shè)備與輸出設(shè)備,也就是鼠標(biāo)鍵盤顯示器。
而運(yùn)算器,控制器和存儲(chǔ)器是由計(jì)算機(jī)系統(tǒng)自己處理的,我們不需要知道它們的內(nèi)部運(yùn)行原理,也不需要知道它們是怎么協(xié)調(diào)的。
同樣端到端也是如此,從表象來看我們只需要關(guān)心其輸入與輸出,不需要知道它的內(nèi)部結(jié)構(gòu),也就是說,端到端模型的表象是一個(gè)黑盒。
我們知道,大模型的表現(xiàn)是無法解釋的,它更多的是一種現(xiàn)象,叫做智能涌現(xiàn),現(xiàn)在很多研究機(jī)構(gòu)都在解決大模型的可解釋性,也就是大模型為什么能做到這樣的效果,中間經(jīng)歷了哪些處理。
但如果要實(shí)現(xiàn)一個(gè)端到端的大模型,應(yīng)該怎么實(shí)現(xiàn)呢?任何新技術(shù)的出現(xiàn)都是為了解決存在的問題,那端到端模型解決了什么問題?
其實(shí)用一句話概括端到端,就是讓大模型直接理解問題,然后給出答案或決策。
比如拿語音模型舉例,很多人以為的語音模型就是直接理解語音,但事實(shí)上語音模型并不是直接理解語音;而是由多個(gè)模塊組成的一個(gè)語音模型。
語音在語音模型中的處理過程,需要經(jīng)過語音轉(zhuǎn)文字,然后把文字輸入給大模型,大模型處理完畢返回文字,再有轉(zhuǎn)化系統(tǒng)把文字轉(zhuǎn)換為語音返回給用戶。
這就是現(xiàn)在大模型所存在的問題,中間需要經(jīng)過多個(gè)模塊的協(xié)同處理才能得到想要的結(jié)果??赡苡腥藭?huì)問為什么不讓大模型直接理解語音,還要經(jīng)過中間的轉(zhuǎn)化?
原因就是這樣的實(shí)現(xiàn)方式技術(shù)難度低,容易實(shí)現(xiàn)。
而端到端模型的目的就是省略中間語音轉(zhuǎn)文字,文字轉(zhuǎn)語音的過程;為什么要這么做?
這么做的目的并不是為了炫耀技術(shù),而是有些場景需要強(qiáng)大的實(shí)時(shí)性,無法接受如此長鏈條的處理響應(yīng)時(shí)間。
比如說自動(dòng)駕駛,現(xiàn)今的自動(dòng)駕駛采用的就是多模塊協(xié)作的方式,如路況采集,自動(dòng)化分析,做出決策,執(zhí)行決策等。這樣的自動(dòng)駕駛系統(tǒng)就需要大量的時(shí)間做出響應(yīng)。
而如果采用端到端系統(tǒng),那么端到端系統(tǒng)就可以直接采集路況數(shù)據(jù),然后做出決策,省略中間各種亂七八糟的處理流程,大大提升了系統(tǒng)靈敏度。
從技術(shù)到角度來說,端到端模型實(shí)現(xiàn)難度更大,系統(tǒng)更復(fù)雜,而且可解釋性更差,而且更像一個(gè)黑盒。
可能說到這里,有些人任務(wù)端到端模型能做到的事,普通大模型也可以做到,而且技術(shù)難度更低,成本也更低。
但端到端模型出現(xiàn)的原因并不是為了解決普通的問題,比如回答系統(tǒng);哪怕你普通大模型性能低一點(diǎn),回答慢一點(diǎn)也可以接受。
但在一些領(lǐng)域,如智能駕駛,高端制造,軍事競爭等方面,延遲要在毫秒,甚至是微秒的程度;這時(shí)普通大模型就無法完成任務(wù)了。
端到端模型的主要目的就是為了讓大模型直接接受輸入,減少中間環(huán)節(jié)的處理成本,提升效率。
程序員應(yīng)該比較容易理解端到端,普通大模型就類似于現(xiàn)在的高級(jí)語音,如java,python等;它們的功能強(qiáng)大,但執(zhí)行效率低,原因就是中間有一個(gè)解釋器。
而端到端模型就類似于C語言,直接轉(zhuǎn)換為計(jì)算機(jī)能夠處理的格式,省略了中間解釋的環(huán)節(jié)。
雖然高級(jí)編程語言的作用越發(fā)強(qiáng)大,但永遠(yuǎn)也沒有那個(gè)語言能完全取代C語言和匯編語言。
當(dāng)然,C語言和匯編語言雖然效率高,但遷移性比較低,不同的平臺(tái)需要不同的指令集和開發(fā)庫。端到端模型也是如此,對(duì)訓(xùn)練數(shù)據(jù)質(zhì)量的要求更高,適應(yīng)性也更差。
因此,網(wǎng)上也有人說,所謂的端到端就是直接由輸入得到輸出,大模型可以直接理解輸入數(shù)據(jù),而不需要這樣那樣的轉(zhuǎn)化過程。
本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires
原文鏈接:??https://mp.weixin.qq.com/s/r81EJECLsPvJNznXKWoPlA??
