機(jī)器學(xué)習(xí)的實(shí)現(xiàn)依賴于數(shù)據(jù)
大數(shù)據(jù)、分析、物聯(lián)網(wǎng)、云技術(shù)……最近的幾年里,沒(méi)有這些術(shù)語(yǔ)你就無(wú)法參與到關(guān)于科技的討論和對(duì)話中。它們已經(jīng)成了科技中主要的參與者,影響著商務(wù)的方方面面。變化似乎正在以極快的速度發(fā)生著,并且沒(méi)有減速的跡象。 如今,科技中唯一不變的就是變化本身了。不斷的變化需要不斷的創(chuàng)新,因此就需要引入更多的新技術(shù)。進(jìn)入科技話題的新技術(shù)之一是機(jī)器學(xué)習(xí)。加特納指出機(jī)器學(xué)習(xí)是2016年十大技術(shù)趨勢(shì)之一。毫無(wú)疑問(wèn)這是一個(gè)熱點(diǎn)話題。
一切舊的又是新的
我發(fā)現(xiàn)有趣的是機(jī)器學(xué)習(xí)的基本原理可追溯到70年代和80年代早期的人工智能研究。當(dāng)時(shí)的工作受到計(jì)算機(jī)性能和數(shù)據(jù)利用量的限制。 突破這些約束是近年來(lái)機(jī)器學(xué)習(xí)取得飛躍性進(jìn)展的關(guān)鍵。計(jì)算周期和數(shù)據(jù)利用水平在幾十年前是無(wú)法想象的。
機(jī)器學(xué)習(xí)的目標(biāo)聽起來(lái)很簡(jiǎn)單: 提供系統(tǒng)基于信息上學(xué)習(xí)的能力。盡管它聽起來(lái)簡(jiǎn)單, 這是在挑戰(zhàn)經(jīng)典的軟件工程。大多數(shù)我們所熟悉的“硬編碼”軟件開發(fā)系統(tǒng)的行為都是基于計(jì)劃和預(yù)期的用戶數(shù)據(jù)交互。標(biāo)準(zhǔn)的“if – then – else”模型。
人工智能/機(jī)器學(xué)習(xí)的算法要求更為復(fù)雜。它們需要允許系統(tǒng)形成它自己以輸入為依據(jù)的分析模式。這些模式根據(jù)提供的信息不斷變化。以數(shù)據(jù)和這些模式為依據(jù),行為被決定。正如你從描述中了解到的,這將導(dǎo)致非常不確定的行為。系統(tǒng)將會(huì)根據(jù)提供的信息分析,理解并做出反應(yīng),根據(jù)更多的信息調(diào)整行為,然后提供反饋。分析和行為不斷的改變,隨著時(shí)間過(guò)去被改進(jìn)。想象一下進(jìn)行一個(gè)適合這個(gè)系統(tǒng)的測(cè)試!(即將討論的主題)
你正享受著機(jī)器學(xué)習(xí)帶來(lái)的便利
你有網(wǎng)飛公司的賬戶嗎?亞馬遜呢?每次你登錄時(shí),網(wǎng)飛和亞馬遜都給你提供一個(gè)推薦列表。這兩個(gè)公司都有非常復(fù)雜的,專有的算法。通過(guò)這些算法,就可以分析蘊(yùn)含著你和所有其他成員交易的龐大的信息群。基于這些數(shù)據(jù),他們建立了你的預(yù)期行為模型,并提出了一系列的建議給你。你對(duì)這些建議的反應(yīng)也被反饋到算法中,然后算法會(huì)不斷調(diào)整以適應(yīng)你的行為模式。
那你的智能手機(jī)呢?想一下“先生,今天天氣怎么樣?”這句簡(jiǎn)單語(yǔ)句的復(fù)雜度。首先,軟件為了確定你實(shí)際說(shuō)的話,需要識(shí)別你的語(yǔ)音,口音以及你說(shuō)話的方式。如果這不是很確定,軟件要求確認(rèn),它從你的確認(rèn)中學(xué)習(xí)。每次你使用語(yǔ)音識(shí)別的時(shí)候,你的手機(jī)會(huì)更好的理解你說(shuō)了什么。一旦理解你說(shuō)的話,它會(huì)將自然語(yǔ)言處理成有意義的語(yǔ)言到系統(tǒng)中。這又需要復(fù)雜的算法來(lái)分析語(yǔ)音信息,創(chuàng)建模型,然后在其翻譯結(jié)果上執(zhí)行指令。當(dāng)解析語(yǔ)音的時(shí)候,如果不是很確定,軟件會(huì)立馬提示確認(rèn)。你說(shuō)話方式所用的模型以及你使用語(yǔ)言的上下文會(huì)給予系統(tǒng)反饋。
這都是數(shù)據(jù)在起作用
最近TechCrunch上的一篇文章, ‘創(chuàng)業(yè)公司如何在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域中與企業(yè)競(jìng)爭(zhēng)’ John Melas-Kyriazi 談到數(shù)據(jù):‘’我們投入資源到訓(xùn)練機(jī)器學(xué)習(xí)模型中,它將創(chuàng)造巨大的網(wǎng)絡(luò)效應(yīng)。‘ 我發(fā)現(xiàn)一個(gè)非常恰當(dāng)?shù)谋扔鳌?fù)雜的算法和模型是機(jī)器學(xué)習(xí)的引擎,但是如果沒(méi)有燃料,引擎-數(shù)據(jù)-不會(huì)很好地工作。我的一個(gè)同事,John Williams, ( Collaborative Consulting 的***戰(zhàn)略官)多年來(lái)一直喜歡說(shuō),“這都是數(shù)據(jù)在起作用。”在機(jī)器學(xué)習(xí)的世界里再真實(shí)不過(guò)了。