人工智能:人工智能的四個層次
前面我們分析了人工智能的行業(yè)格局,見《凱哥講人工智能:行業(yè)格局》,了解了人工智能的發(fā)展,帶來了軟件技術(shù)行業(yè)的一次革命,所有的企業(yè)都希望在這一次革***彎道超車,快速建立起自己的相關(guān)的能力。
和眾多企業(yè)CIO和信息化同業(yè)人士溝通,凱哥發(fā)現(xiàn),在人工智能的話題上,普遍存在兩種極端的認(rèn)知:
- ***論者:
這一類認(rèn)知認(rèn)為人工智能是靈丹妙藥,并且是通用的靈丹妙藥,不管什么問題,只要上了AI了,就一定能搞定,搞不定那就是你能力不行。這一類凱哥稱為***論者。
- 無用論者:
這一類認(rèn)知認(rèn)為人工智能是純忽悠,是概念,本質(zhì)上和傳統(tǒng)的數(shù)據(jù)分析,BI沒有太大區(qū)別,所以對人工智能技術(shù)帶著抵觸和抗拒的情緒,一聽到人工智能就覺得不靠譜,肯定是忽悠錢來的。這一類,凱哥稱為忽悠論者。
但是,人工智能在應(yīng)用上到底能發(fā)揮什么作用,靠譜不靠譜,我們應(yīng)該如何去認(rèn)知人工智能技術(shù)對于業(yè)務(wù)的驅(qū)動作用呢?
我們要理解人工智能從本源到應(yīng)用過程,理解它的結(jié)構(gòu),從而客觀的認(rèn)知這個問題。
人工智能應(yīng)用的四個層次
凱哥把人工智能人工智能技術(shù)的應(yīng)用分成四個層次:
從下往上,分別是:
***層,學(xué)術(shù)論文層:
***層是學(xué)術(shù)論文層,就是純理論的數(shù)學(xué)、計(jì)算科學(xué)相關(guān)的算法論文,這是人工智能產(chǎn)業(yè)的基石。這一層就可以比喻成人工智能領(lǐng)域的理論基礎(chǔ),一篇論文可能會給多個領(lǐng)域帶來影響,比如現(xiàn)在非常流行的深度學(xué)習(xí),其中很重要的一篇論文,是Hinton在2015年的論文《Deep Learning》,對于語言識別、物體識別、目標(biāo)檢測以及藥物發(fā)現(xiàn)、基因組合等方向都有促進(jìn)。這一個層次的能力主要在學(xué)術(shù)領(lǐng)域,研究機(jī)構(gòu),比如斯坦福,哈佛等。而大部分的企業(yè)所應(yīng)用的算法,在底層都是類似的,很多經(jīng)典的算法甚至都已經(jīng)存在了20年以上。這些論文是公開的,開放使用的,在這個層次來講,所有的非研究性機(jī)構(gòu)和企業(yè)差異都不大,。
比如,全球***的跟人工智能相關(guān)的***論文大會清單如下:
比如這里面的ACL大會,是自然語言處理領(lǐng)域全球最***的會議,每年都能產(chǎn)生一些很有影響力的論文從而改變和促進(jìn)自然語言處理技術(shù)的發(fā)展。
2018年的ACL大會,在墨爾本舉辦:
我很欣喜的看到,近幾年的國際***學(xué)術(shù)會議的贊助商中,有很多我們中國的企業(yè)了,比如ACL2018的***贊助商里出現(xiàn)了今日頭條這樣的中國企業(yè)。
學(xué)術(shù)算法層有幾個特性:
- 基礎(chǔ)性
學(xué)術(shù)論文層的能力,往往是非?;A(chǔ)的理論,解決的是某一個理論領(lǐng)域的基礎(chǔ)性問題。
- 通用性
這個層次的成果,很多時候能夠在多個細(xì)分領(lǐng)域應(yīng)用,具有一定的通用性。
- 持續(xù)性
程序語言本身會不斷地進(jìn)化,而論文本身則有一定的持續(xù)性。隨著編程語言,工程技術(shù)的發(fā)展,對一篇論文算法的實(shí)現(xiàn)經(jīng)常是持續(xù)優(yōu)化的。
總結(jié)一下,學(xué)術(shù)算法層是人工智能現(xiàn)階段的核心層,目前大部分人工智能所應(yīng)用的算法都是公開通用的,很多經(jīng)典的算法都已經(jīng)存在了十幾年以上。
在人工智能的商業(yè)應(yīng)用行業(yè)里,這一層大家的差異都不是很大,基礎(chǔ)都差不多。
第二層,工程實(shí)現(xiàn)層:
有軟件編程能力的工程師(一般我們叫他們數(shù)據(jù)科學(xué)家)將***層的論文學(xué)術(shù)成果實(shí)現(xiàn)成工程代碼,從而能夠被軟件所調(diào)用。這一層是人工智能的核心能力層,同樣的算法,不同的工程代碼實(shí)現(xiàn)的效果,速度是有差異的,也會影響在軟件中的應(yīng)用。軟件工程能力直接決定了這些算法的優(yōu)化程度。
比如CNN的算法相關(guān)的實(shí)現(xiàn)在GitHub上就有不下15000種,見下圖所示:
***層學(xué)術(shù)算法層,大部分的人工智能從業(yè)公司差距都不大,基本上使用的都是公開的通用的算法。所以第二層,工程實(shí)現(xiàn)層是區(qū)分能力的一個關(guān)鍵分水嶺,如何將算法實(shí)現(xiàn)的***化,效率更高?工程能力很重要。
第三層,平臺服務(wù)層:
當(dāng)業(yè)務(wù)被數(shù)字化后,我們發(fā)現(xiàn),很多原來跨行業(yè)的場景其實(shí)在底層的算法層有很多類似的地方,比如異常檢測的場景,在審計(jì)預(yù)警和預(yù)測檢修這樣兩個跨行業(yè)的應(yīng)用中有很大的趨同性,只是訓(xùn)練和處理的業(yè)務(wù)數(shù)據(jù)本身的差異。為了讓人工智能技術(shù)能夠更快,更高效的被業(yè)務(wù)所使用,就出現(xiàn)了AI as a Service的平臺服務(wù)層。
有公有服務(wù)平臺,比如百度大腦,阿里云,騰訊,同時眾多的大型企業(yè)也在構(gòu)建自己的私有智能服務(wù)平臺。平臺服務(wù)層主要的作用是算法和模型服務(wù)化,更容易的被各種場景所調(diào)用。
第四層,業(yè)務(wù)應(yīng)用層:
所有的技術(shù)都是要為了業(yè)務(wù)去創(chuàng)造價值,人工智能一定要在適當(dāng)?shù)臉I(yè)務(wù)場景中才能發(fā)揮作用。這一層是可以直接由第二層工程實(shí)現(xiàn)層構(gòu)建而來的,并不一定需要經(jīng)過平臺服務(wù)層。
所有的企業(yè)都意識到智能時代的來臨,希望用人工智能技術(shù)賦能自己的業(yè)務(wù),加速數(shù)字化轉(zhuǎn)型工作。
結(jié)合上面的四個層次的總結(jié),我們可以得出幾個關(guān)鍵發(fā)現(xiàn):
- 業(yè)務(wù)場景是人工智能產(chǎn)生價值的最重要的基礎(chǔ)
場景選對了,就成功了一半。智能類項(xiàng)目擁有不確定性,有限投資要定位到合適的業(yè)務(wù)場景,那就是業(yè)務(wù)價值高,投入產(chǎn)出比高,數(shù)據(jù)和技術(shù)成熟的場景。而一點(diǎn)依賴于對企業(yè)戰(zhàn)略的認(rèn)知,業(yè)務(wù)的深刻理解,需要很強(qiáng)的業(yè)務(wù)能力和戰(zhàn)略思考能力。所以在企業(yè)進(jìn)行人工智能投資的時候,我們建議早期啟動一個智能探索的敏捷規(guī)劃項(xiàng)目,識別和定位業(yè)務(wù)場景,進(jìn)行早期成熟度調(diào)研,效果預(yù)言,從而盡可能的保證投資的有效性和價值。
- 工程實(shí)現(xiàn)是將人工智能應(yīng)用到場景的核心能力
選擇對了場景是成功的***步,最終,我們的人工智能的價值是需要通過軟件服務(wù),應(yīng)用的方式提供給用戶的。所以,這就意味著,這個軟件需要具備順暢的流程,用戶體驗(yàn)要好,運(yùn)行速度要快,系統(tǒng)要穩(wěn)定安全,否則一個有缺陷,體驗(yàn)很差的應(yīng)用是不會被用戶所持續(xù)使用的,那么人工智能投資依舊是失敗的。所以工程實(shí)現(xiàn)是將人工智能應(yīng)用到場景產(chǎn)生價值的核心能力,這里就包括業(yè)務(wù)需求分析、用戶體驗(yàn)設(shè)計(jì)、軟件技術(shù)架構(gòu)、開發(fā)測試上線部署,持續(xù)的運(yùn)營和運(yùn)維能力。我們的實(shí)踐統(tǒng)計(jì),一個人工智能的應(yīng)用項(xiàng)目,智能算法部分一般只會占到總工作量的30%以下,大部分的工作都是軟件工程的構(gòu)建。
- 大型企業(yè)需要建設(shè)自己的智能服務(wù)平臺
在目前的階段,數(shù)據(jù)是智能算法的原材料,如果企業(yè)調(diào)用公有智能服務(wù),那就意味著,企業(yè)要將自己的數(shù)據(jù)貢獻(xiàn)給外部服務(wù)商。這個對于部分大型企業(yè)來講是不可接受的。而與此同時,我們會發(fā)現(xiàn)人工智能技術(shù)并不是以前想象的那么的陽春白雪,眾多的開源工具,框架,算法的實(shí)現(xiàn)讓我們更多的是需要去將智能技術(shù)應(yīng)用到場景中,而非去重新開發(fā)一套算法。
比如,我們團(tuán)隊(duì)的工程師,在GitHub上,依托一個開源的人臉識別模型,結(jié)合我們公司的內(nèi)部員工圖片數(shù)據(jù),訓(xùn)練出來的模型也有一定的準(zhǔn)確度,而這個過程,只用了2周的時間。
所以,大型企業(yè)需要建設(shè)自己的智能服務(wù)平臺,將數(shù)據(jù),算法和模型實(shí)現(xiàn)成企業(yè)內(nèi)部的智能引擎,有規(guī)劃,有設(shè)計(jì)的逐步應(yīng)用到各個業(yè)務(wù)場景中,業(yè)務(wù)場景會產(chǎn)生更多的應(yīng)用數(shù)據(jù),從而這些數(shù)據(jù)又能夠增量訓(xùn)練和優(yōu)化算法模型,***真正實(shí)現(xiàn)智慧賦能。
***總結(jié)一下本文的觀點(diǎn):
一、人工智能無用論和神話論都是不客觀的
二、工程能力是人工智能發(fā)揮價值的核心生產(chǎn)力
三、合適的業(yè)務(wù)場景是人工智能發(fā)揮價值的前提條件
四、大型企業(yè)需要構(gòu)建企業(yè)級的私有智能服務(wù)平臺
【本文為51CTO專欄作者“凱哥”的原創(chuàng)稿件,轉(zhuǎn)載請通過作者微信公眾號shikai590獲取授權(quán)】