成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

人工智能時(shí)代的中文和英文,誰(shuí)能成為AI的母語(yǔ)?

人工智能 深度學(xué)習(xí)
人工智能是當(dāng)前很熱門的技術(shù),各國(guó)都在投入資金和人力進(jìn)行研究。誰(shuí)錯(cuò)過(guò)了人工智能,誰(shuí)就丟掉了未來(lái)。

 人工智能是當(dāng)前很熱門的技術(shù),各國(guó)都在投入資金和人力進(jìn)行研究。誰(shuí)錯(cuò)過(guò)了人工智能,誰(shuí)就丟掉了未來(lái)。

 

[[346905]]

 

語(yǔ)言文字在人工智能中占有非常重要的地位,它是人和人工智能交互的工具,人工智能只有準(zhǔn)確理解語(yǔ)言文字才能做出準(zhǔn)確應(yīng)對(duì),才能表現(xiàn)出高智商。今天就談?wù)勚形暮陀⑽氖遣皇莾?yōu)秀的人工智能語(yǔ)言,以及未來(lái)前景。

一、語(yǔ)音識(shí)別

雖然我不想承認(rèn),但英文語(yǔ)音識(shí)別確實(shí)比中文更準(zhǔn)確、高效。

英文由26個(gè)字母構(gòu)成,邏輯結(jié)構(gòu)更簡(jiǎn)單,發(fā)音以字母為基礎(chǔ),音標(biāo)和音標(biāo)區(qū)之間區(qū)分比較明顯,只要說(shuō)的不是很快,AI能比較容易、準(zhǔn)確識(shí)別每一個(gè)字母,加上同音單詞比較少,所以英文的語(yǔ)音識(shí)別效率領(lǐng)先中文許多。

 

中文發(fā)音則要復(fù)雜的多。漢語(yǔ)拼音有23個(gè)聲母,6個(gè)單韻母,18個(gè)復(fù)韻母,還有16個(gè)整體認(rèn)讀音節(jié),整套方案共63個(gè)發(fā)音元素。除此之外,漢語(yǔ)還有四種音調(diào),加上種類繁多的方言,發(fā)音不準(zhǔn)的話,非常影響AI識(shí)別。

 

人工智能時(shí)代的中文和英文,誰(shuí)能成為AI的母語(yǔ)?

 

AI在進(jìn)行中文識(shí)別的時(shí)候,需要先進(jìn)行發(fā)音識(shí)別,再根據(jù)單詞進(jìn)行漢字判斷,識(shí)別效率低于英文,識(shí)別錯(cuò)誤率也高于英文。

語(yǔ)音識(shí)別,英文勝。

二、文字識(shí)別

到文字識(shí)別環(huán)節(jié),我們終于可以揚(yáng)眉吐氣了,中文文字識(shí)別的效率和準(zhǔn)確度比英文更勝一籌。

中文有幾個(gè)特點(diǎn),讓AI識(shí)別更高效:

1、漢字信息密度高,更少的字?jǐn)?shù)可以承載更多的信息,中文文章永遠(yuǎn)比英文短,綜合來(lái)看,中文信息密度比英文高37.5%。

 

2、中文以漢字為單位,可以靈活排列,橫豎都可以,而英文是線性文字,只能橫排,豎排、錯(cuò)亂排列的識(shí)別效率會(huì)驟降!

3、漢字獨(dú)立表意能力強(qiáng)。比如“他去吃早飯”,你看一個(gè)字就能多明白一個(gè)字的意思。而英文“He went to have breakfast”,你即使看到“have”這個(gè)詞,你依然不明大概的意思,只有到“breakfast”你才知道原來(lái)have是吃,went to是去,整句是去吃早飯。英文表意比較依賴“短語(yǔ)”,甚至整句,不看完整句話,你往往不能知道句意。這就給AI識(shí)別造成了難度,因?yàn)锳I跳躍識(shí)別能力較差。

文字識(shí)別,中文勝。

三、同音字詞

中文發(fā)展人工智能比較大的障礙就是同音字詞現(xiàn)象!比如,他姓zhang,到底是“張”還是“章”呢?如果是口語(yǔ)的話,還要補(bǔ)一句弓長(zhǎng)張,或立早章。中文里有多少同音字、同音詞,很難準(zhǔn)確的統(tǒng)計(jì)。同音字詞也是英語(yǔ)使用者攻擊中文表意不清比較大的借口。

 

英語(yǔ)雖然也有同音字,如right正確的、write寫字;meet遇見(jiàn)、meat 肉;hole 洞穴、whole 全部的;pear梨子、pair雙;flower花、flour面粉等,但英語(yǔ)同音字詞數(shù)量遠(yuǎn)比中文同音詞數(shù)量少。英語(yǔ)是通過(guò)造更多單詞的方法,來(lái)減少同音詞現(xiàn)象的。

AI現(xiàn)在不能準(zhǔn)確處理多音字,出錯(cuò)在所難免。難道為了AI準(zhǔn)確,人類只能通過(guò)語(yǔ)言文字改革消滅多音字詞?這工程也太大了,人類也很難適應(yīng)這么大的改革!

同音字詞,英文勝。

四、多義字詞

一詞多義,是每種成熟語(yǔ)言都難免的,世間萬(wàn)事萬(wàn)物這么多,情感這復(fù)雜,如果每個(gè)詞匯只表達(dá)一個(gè)準(zhǔn)確的意思,那幾百萬(wàn)字詞都收不住。無(wú)論是中文還是英文,一個(gè)字詞不會(huì)只表達(dá)一個(gè)意思,通常有很多意思,有時(shí)候區(qū)別還很大!

 

比如“close”,其意思非常多:關(guān)閉、合攏、合上、不開(kāi)放、(使)關(guān)門、關(guān)閉(一段時(shí)間)、結(jié)束、終結(jié)、接近、幾乎(處于某種狀態(tài))、可能(快要做某事)、親密的、密切的、接近、靠近、不遠(yuǎn)地、死胡同、斷頭路、大教堂所屬的周圍場(chǎng)地及建筑物等。

現(xiàn)在人工智通過(guò)上下文識(shí)別詞義的能力還比較弱,遇到多義詞的時(shí)候經(jīng)常出錯(cuò),這也是人工智能發(fā)展的難關(guān)。

多義字詞,中文和英文彼此彼此。

五、整段識(shí)別

 

讓人工智能翻譯一個(gè)短句,一句話,其實(shí)沒(méi)多大意義,實(shí)用價(jià)值也不高,只有具備整段文字識(shí)別,才有實(shí)用價(jià)值。讓我們以中英文互譯來(lái)考察AI對(duì)中文和英文的識(shí)別能力了!

原文如下:

"Things that trend in these two countries are insanely different. For example: knowledge-basedcontent is extremely popular in China, and less so in the U.S. Also, this was wild to me: thosecreators that did the most dance videos in China are users born in the 60s (!!), whereas in theUS, it seems that it's mostly teenagers who are creating the dances," she wrote.

她寫道:“這兩個(gè)國(guó)家的趨勢(shì)截然不同,比如:知識(shí)性內(nèi)容在中國(guó)很流行,但在美國(guó)稍差一些。而且,這一點(diǎn)對(duì)我來(lái)說(shuō)很瘋狂:中國(guó)最喜歡拍舞蹈視頻的是60后(!!),但在美國(guó),好像是年輕人最喜歡拍舞蹈視頻。”

AI將“英文原文”翻譯成中文如下:

“這兩個(gè)國(guó)家的趨勢(shì)截然不同。例如:以知識(shí)為基礎(chǔ)的內(nèi)容在中國(guó)非常受歡迎,而在美國(guó)卻很少。此外,這對(duì)我來(lái)說(shuō)很瘋狂:在中國(guó)制作舞蹈視頻最多的創(chuàng)作者是 她出生于60年代(!!)的用戶,而在美國(guó),似乎是大多數(shù)年輕人在創(chuàng)作舞蹈。”她寫道。

有一句失真比較嚴(yán)重:“在中國(guó)制作舞蹈視頻最多的創(chuàng)作者是 她出生于60年代(!!)的用戶。”

這句話的英文原文是: “those creators that did the most dance videos in China are users born in the 60s ”。這是一句英語(yǔ)長(zhǎng)句,詞序比較復(fù)雜,又夾雜了亂七八糟的介詞,導(dǎo)致人工智能的大腦錯(cuò)亂,沒(méi)能準(zhǔn)確識(shí)別!

 

這個(gè)英文識(shí)別錯(cuò)誤很有典型性,暴露了英文在語(yǔ)法上、詞序上太過(guò)復(fù)雜的弊端。如果是翻譯更復(fù)雜的英語(yǔ)長(zhǎng)句,AI將束手無(wú)策!這也是每個(gè)表音文字的弱點(diǎn)!

AI將“中文原文”翻譯成英文如下:

"The trends in these two countries are quite different. For example, intellectual content is very popular in China, but a bit worse in the United States. Moreover, this is crazy to me: China’s favorite dance video is born in the 60s (! !), but in the United States, it seems that young people like to shoot dance videos the most," she wrote.

中文翻譯非常精準(zhǔn),和原文在表意上幾乎沒(méi)有任何差別,如實(shí)還原了原文的意思!可見(jiàn),在整段話、整篇文章的識(shí)別上,中文比英文更有優(yōu)勢(shì)!

中文是由一個(gè)個(gè)漢字構(gòu)成,長(zhǎng)句很少,語(yǔ)法簡(jiǎn)單,詞序簡(jiǎn)單,在語(yǔ)句結(jié)構(gòu)上比線性的英語(yǔ)簡(jiǎn)單的多,更有利于AI識(shí)別。

六、誰(shuí)才是人工智能的未來(lái)?

 

在人工智能領(lǐng)域,英文勝在口語(yǔ),中文勝在書面語(yǔ),各有所長(zhǎng),誰(shuí)能成為AI的母語(yǔ)還言之過(guò)早。但在比較復(fù)雜的內(nèi)容表達(dá)上,AI對(duì)中文的識(shí)別領(lǐng)先英文,所以我更看好中文的未來(lái)。

責(zé)任編輯:華軒 來(lái)源: 今日頭條
相關(guān)推薦

2019-05-20 09:28:09

物聯(lián)網(wǎng)操作系統(tǒng)IOT

2018-08-17 16:59:41

人工智能AI驅(qū)動(dòng)力

2018-04-12 14:13:00

2016-05-19 14:17:50

谷歌大會(huì)人工智能DNA

2017-08-29 08:55:59

2010-05-04 17:22:18

IT培訓(xùn)

2020-12-01 15:03:44

VMware云計(jì)算IT

2019-10-29 14:32:50

人工智能數(shù)字營(yíng)銷網(wǎng)絡(luò)營(yíng)銷

2019-01-08 11:22:01

華為云

2017-07-24 15:33:51

2018-07-16 16:12:03

2015-07-29 14:40:45

Win10

2018-11-12 10:42:59

2022-04-02 18:05:00

元宇宙VRAR

2018-05-22 09:11:48

大數(shù)據(jù) 人工智能

2010-08-05 10:02:50

美國(guó)云平臺(tái)

2020-11-02 08:31:07

AI

2018-12-14 11:22:21

快遞員快遞柜智能

2017-06-28 15:37:28

2018-07-05 14:52:05

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 久久久高清 | 亚洲精品中文在线 | 色综合99 | 久久久久久久久久久久亚洲 | 丁香色婷婷 | 91免费福利在线 | 欧美阿v | 精品国产一区二区国模嫣然 | 久久亚洲欧美日韩精品专区 | 国产成人叼嘿视频在线观看 | 亚洲精彩视频在线观看 | 国产一区 | 中文字幕欧美一区二区 | 欧美亚洲成人网 | 精品一区二区三区在线视频 | 欧美日韩亚洲系列 | 欧美日产国产成人免费图片 | 毛片站| 国产一区二区精品在线观看 | 国产精品99精品久久免费 | 亚洲视频中文字幕 | 波多野吉衣久久 | 国产精品999 | av大全在线 | 国产成人精品区一区二区不卡 | 成人深夜福利 | 免费观看黄a一级视频 | www视频在线观看 | 国产清纯白嫩初高生在线播放视频 | 激情 一区| 亚洲激情网站 | 久久99久久98精品免观看软件 | 欧美精品久久久久久久久老牛影院 | 亚洲精品www久久久久久广东 | www.亚洲精品 | 欧美成人精品在线 | 日韩一区二区福利视频 | 一二区视频| 久久久久久久国产精品影院 | 欧美成视频在线观看 | 欧美 日韩 中文 |