成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌開源「AI手勢識別」算法:憑一幀圖像識別21個3D點位

人工智能 算法
谷歌公司的科學家們研究出一種新的計算機視覺方法,用于實現手部感知。該方案能夠在實機實驗中僅憑一幀圖像識別出一只手(或者多只手)上的21個3D點位。只要在手機上就能進行實時追蹤,并且還能同時追蹤多只手,可識別遮擋。

實時手形與動作跟蹤方案,一直是手語識別與手勢控制系統中最為核心的組成部分,同時在部分增加現實體驗中也扮演著重要角色。然而,現有技術往往因為遮擋或者缺乏對比模式等問題的困擾,無法提供理想的可靠性。

面對這一現實挑戰,谷歌公司的科學家們研究出一種新的計算機視覺方法,用于實現手部感知。作為幕后推手,機器學習技術為提供了強大助力。根據介紹,該方案能夠在實機實驗中僅憑一幀圖像識別出一只手(或者多只手)上的21個3D點位。與目前市面的手勢識別技術相比,谷歌的全新技術不需要依賴臺式機來計算,只要在手機上就能進行實時追蹤,并且還能同時追蹤多只手,可識別遮擋。

 

 

 

[[274440]]

 

早在今年6月,谷歌就在2019計算機視覺與模式識別大會上公布了此項技術的預覽版本。2月之后,谷歌于美國時間8月20日正式宣布將該技術集成于引入MediaPipe當中。MediaPipe是一套開源跨平臺框架,用于構建多模應用機器學習流水線,可以處理不同模態(例如視頻與音頻)中的感知數據。該項目的源代碼以及端到端使用場景目前都已經在GitHub上全面公開。

 

 

 

谷歌開源「AI手勢識別」算法:憑一幀圖像識別21個3D點位

 

研究工程師Valentin Bazarevsky和Fan Zhang在博文他們的當中寫道:“感知手部形狀與運動姿態的能力,有望成為改善各類技術表現及平臺用戶體驗的重要助力。我們希望將這種手部感知功能交付至更為廣泛的研究與開發社區處,利用大家的力量共同促進創新用例的出現,刺激新的應用方式并開拓出前所未有的研究途徑。”

據了解,谷歌的這一技術包含三套串聯工作的AI模型:一個手掌探測模型(BlazePalm)用于分析框體并返回手部動作邊框;一個手部標記模型(Landmark),用于查看由手掌探測器定義的裁剪后圖像區域,并返回3D位點;一個手勢識別模型,用于將之前計算得出的位點歸類為一組手勢。

BlazePalm:手部識別絕不像聽起來那么簡單。GlazePalm必須能夠解決手部遮擋這一現實難題。為此,谷歌團隊訓練出一款手掌探測器BlazePalm——注意,是手掌而不是手部。他們認為,對拳頭這類物體進行邊界框描繪,在難度上要比跟蹤手指低得多。具體地,BlazePalm可以識別多種不同手掌大小,具備較大的縮放范圍,還能識別手部遮擋,能通過識別手臂、軀干或個人特征等信息準確定位手部。除此之外,這種方式還有另一大優勢,就是能夠很好地兼容握手等特殊場景,利用忽略其它寬高比條件的方形邊框模擬手掌,從而將所需的3D點數縮減至以往的三分之一到五分之一。據統計,經過訓練之后,BlazePalm識別手掌的準確率可以達到95.7%。

 

 

 

谷歌開源「AI手勢識別」算法:憑一幀圖像識別21個3D點位

 

Landmark:在手掌檢測之后,手部標記模型開始接管,負責在檢測到的手部區域之內建立21個由手到肘的3D定位坐標。在訓練當中,模型要求研究人員手動注釋多達3萬份真實場景下的圖像,并立足多種背景對相應坐標進行渲染和映射,最終創建出高質量的合成手部模型。據統計,在經過訓練后,算法的平均回歸誤差可降低到13.4%。

手勢識別模型:流水線上的最后一步是手勢識別,該模型利用關節旋轉角度來確定每根手指的狀態(如彎曲或伸直),并將手指狀態集合與預定義的手勢映射起來,進而預測基礎的靜態手勢。Bazarevsky和Zhang介紹稱,該模型能夠識別來自多種文化(例如美國、歐洲與中國)的算數手勢,以及握拳、“OK”、“搖滾”、“蜘蛛俠”等常見手勢。

除此之外,這些模型也可以執行對應的單獨任務,例如利用顯卡進行圖像裁剪與渲染,從而節約計算資源;并且,手掌探測模型只有在必要時才運行——因為在大多數時段內,后續視頻幀內的手部位置只憑計算出的手部關鍵點即可推理得出,不再需要手掌探測器的參與。也就是說,只有當推理置信度低于某個閾值時,手部檢測模型才會重新介入。

展望未來,Bazarevsky、Zhang及其團隊還計劃建立更強大且、更穩定的跟蹤擴展技術,同時增加能夠可靠檢測出的手勢數量,并考慮支持即時動態手勢識別。他們總結道:“我們相信,這項技術的發布將為研究及開發者社區帶來助力,幫助他們發現更多新的創意與應用方向。”

責任編輯:龐桂玉 來源: 科技行者
相關推薦

2022-10-20 09:33:35

2024-11-11 07:00:00

Python圖像識別

2025-03-25 08:30:00

OpenCV計算機視覺圖像識別

2019-06-10 00:45:01

谷歌開源圖像識別

2022-09-09 14:42:17

應用開發ETS

2021-09-14 10:11:46

谷歌3D舞蹈生成模型FACT

2019-08-09 08:00:00

圖像識別AI人工智能

2022-09-13 15:19:48

3D網絡

2020-01-07 11:30:50

圖像識別AI人工智能

2022-10-11 23:35:28

神經網絡VGGNetAlexNet

2021-04-09 20:49:44

PythonOCR圖像

2024-06-18 08:16:49

2021-06-24 13:15:35

開源技術 圖像識別

2021-03-08 15:40:46

開源技術 軟件

2023-08-30 13:24:00

AI工具

2025-01-11 23:14:52

2022-10-19 07:42:41

圖像識別神經網絡

2023-11-24 09:26:29

Java圖像

2017-05-02 15:23:23

2025-03-27 09:26:30

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品成人久久久久a级 久久蜜桃av一区二区天堂 | 免费看国产片在线观看 | 日本午夜免费福利视频 | 99只有精品 | 理论片87福利理论电影 | 99久久日韩精品免费热麻豆美女 | 欧美一级片在线观看 | 中文字幕av在线 | 国产成人综合久久 | 羞羞视频在线观看 | 亚洲品质自拍视频网站 | 欧美在线播放一区 | 午夜视频一区 | 麻豆changesxxx国产 | 欧美一区二区三区精品 | 精品成人一区二区 | 久久精品久久久久久 | 免费一级淫片aaa片毛片a级 | 国产精品亚洲一区二区三区在线观看 | 欧美亚洲国产一区二区三区 | 伊人手机在线视频 | 国产一级大片 | 午夜影院毛片 | 看av网| 日韩黄色av| 欧美亚洲一级 | 成人亚洲综合 | 国产色| 91精品一区 | 91麻豆精品国产91久久久久久 | 日本久久网 | 一区二区精品在线 | 精品国产1区2区3区 在线国产视频 | 一区二区三区四区免费在线观看 | 欧美日韩精品免费观看 | 日本久草视频 | 国产成人免费网站 | 97综合在线 | 在线免费观看a级片 | 久久伊人精品 | 亚洲精品区 |