編輯 | 言征
近日,華為終端BG李小龍發(fā)博展示了Mate70 Pro+的AI照片增強(qiáng)的功能,并熱心詢問大家對(duì)于AI云增強(qiáng)效果是否滿意。
圖片
為了方便大家查看效果,大家可以點(diǎn)擊下面的大圖來查看AI增強(qiáng)效果。
左側(cè)是原圖,右側(cè)是AI增強(qiáng)圖
左側(cè)是原圖,右側(cè)是AI增強(qiáng)圖
不過一位好奇的網(wǎng)友在評(píng)論區(qū)問了一個(gè)讓李小龍非常關(guān)注的問題:小龍總,高倍率看不清楚的字能AI(增強(qiáng))嗎,最好要自然點(diǎn),不能弄成假的。
圖片
李小龍回復(fù):文字用AI增強(qiáng)太容易翻車了,當(dāng)前還屬于業(yè)界難題。
圖片
1.AI云增強(qiáng)是什么
先來回顧科普下這里的華為AI云增強(qiáng)是什么?
這就要首先提一下AI云相機(jī)功能,這項(xiàng)功能是華為在2023年10月推出的,
當(dāng)時(shí)余承東給了一個(gè)形象的例子——
“以前大家在拍集體大合影的時(shí)候,會(huì)發(fā)現(xiàn)很難做到圖像放大后所有人的面貌細(xì)節(jié)都清晰可見。華為Mate60 Pro、 華為MateX5等手機(jī)在拍照上全新推出令人震撼的AI云增強(qiáng)功能,通過云端的億級(jí)參數(shù)大模型算法,捕捉并恢復(fù)隱藏在圖像中的微小細(xì)節(jié),帶來更清晰細(xì)膩的人像體驗(yàn)。
無論是50人的大合影還是單人照,人像膚質(zhì)都更加透亮細(xì)膩,人人都是主角。即使把照片放大,二次裁剪構(gòu)圖,細(xì)節(jié)依然非常清晰。歡迎大家升級(jí)體驗(yàn)!”
圖片
剛過去的2024年,11月底華為發(fā)布了Mate70系列,在影像技術(shù)繼續(xù)甩出了升級(jí)大招:Mate 70系列影像攝影在業(yè)界首次搭載了“紅楓原色攝像傳感器”,讓畫面呈現(xiàn)更加豐富的層次感和真實(shí)感,也帶來了AI云相機(jī)功能的史詩級(jí)增強(qiáng)——長(zhǎng)焦云端大模型。
自然,史上最強(qiáng)Mate旗艦Mate70系列也在AI云增強(qiáng)功能上做了創(chuàng)新,針對(duì)長(zhǎng)焦10x及以上的任意拍攝場(chǎng)景(不在僅限于人物合照),Al 云增強(qiáng)可以智能提升照片清晰度,立顯高清質(zhì)感。
華為官網(wǎng)如是介紹該功能,AI 云增強(qiáng)功能可智能分析用戶拍攝的照片,基于云端的億級(jí)參數(shù)大模型算法,捕捉并恢復(fù)隱藏在圖像中的微小細(xì)節(jié),提升照片清晰度。該功能支持:
- 拍照模式和人像模式下拍攝的人像照片、花卉照片、寵物照片(支持 20X 以下)。
- 微距模式下拍攝的照片:在相機(jī)拍照模式下,近距離拍攝物體自動(dòng)進(jìn)入微距,或在相機(jī)【更多】頁面中選擇超級(jí)微距模式,拍攝 20cm 以內(nèi)物體。
- 支持拍照模式下 10X 及以上任意場(chǎng)景的照片(月亮模式拍攝的照片除外)。
目前 AI 云增強(qiáng)功能支持的手機(jī)設(shè)備情況如下:
- 人像照片:Mate70 系列、Mate X6、Mate XT、Pura 70 系列、 Mate 60 系列、Mate X5、Pocket 2 和 nova 12 Ultra
- 花卉及微距照片:Mate XT、Pura 70 系列和 Mate 70 系列
- 寵物照片、10X 及以上任意場(chǎng)景照片:Mate 70 系列
AI在照片上生成文字為什么這么難?
誠如李小龍所說,目前不要說高倍率模糊文字AI修復(fù),即便讓AI在現(xiàn)成圖片上添加文字,都很難正確做到。
為什么呢?
首先,目前市面上用于圖片生成或照片修復(fù)的AI工具在訓(xùn)練過程中,并未專門針對(duì)語言文字的復(fù)雜性和精確性進(jìn)行深入學(xué)習(xí)。因此,當(dāng)AI圖片工具面對(duì)生成文字的任務(wù)時(shí),它自然不能很好完成任務(wù)。
其次,就是用于AI文字生成的訓(xùn)練數(shù)據(jù)嚴(yán)重不足。在AI訓(xùn)練過程中,并未接觸到足夠的文字樣本的“標(biāo)簽”,由于它的基礎(chǔ)語料中沒有相應(yīng)文字的精確“標(biāo)簽”,或者訓(xùn)練者在訓(xùn)練時(shí)有意避開了包含文字的圖像,以防止生成不恰當(dāng)?shù)膬?nèi)容或侵犯版權(quán),這都會(huì)導(dǎo)致他的基礎(chǔ)數(shù)據(jù)不足。
另外,還有語義理解上的難題。文字的生成涉及到對(duì)自然語言的深入理解,這也是一個(gè)相對(duì)復(fù)雜的問題。
圖片
當(dāng)然李老師所提的則是讓AI修復(fù)高倍率照片中模糊文字的問題,李老師回復(fù):容易翻車,那就說明華為應(yīng)該已經(jīng)在研究這方面的內(nèi)容,期待華為的新成果!
參考鏈接:
https://zhuanlan.zhihu.com/p/10160709558
https://www.zhihu.com/question/628375704/answer/3343109727