Chrome開始集成圖形識別 API(Shape Detection API)
最近,Chrome團隊嘗試在Chrome中集成了一套與圖形識別相關的API,使得圖形識別這種以前只在原生應用中存在,或者在瀏覽器上,要借助其他難用的外部庫才能實現的功能,現在只要少量代碼即可實現。這些API包括人臉識別,條形碼/二維碼識別和文本識別,基本上覆蓋了當前互聯網應用的大部分場景。
現狀
圖形識別這種對系統資源和設備的計算能力要求頗高的功能,通常只有底層的原生API能駕馭,流行的框架主要是開源的Open CV和各大移動平臺的圖形識別服務:
而Chrome的這些API,當前還處于實驗階段,只集成在Chrome Canary版本中,特別是Android版更新較快。使用前還需要通過把“實驗性網絡平臺功能”chrome://flags/#enable-experimental-web-platform-features設置為Enable來激活。
激活后,在Console控制臺輸入以下JavaScript代碼,就能驗證你的瀏覽器是否支持相應的API了:
- window.FaceDetector
- window.BarcodeDetector
- window.TextDetector
如果支持,就會返回如function FaceDetector() { [native code] }的信息。
Chrome Canary是Chrome的一條與其他項目并行的實驗性分支,是許多前衛激進的特性的試驗場,而且迭代很快,有時甚至是每日一更新,所以不出所料,也不太穩定。和其他Chrome版本一樣,也可以在Chrome Release Channels上下載。
從現在公布的信息來看,以下這些場景可能得以輕松實現:
1、人臉識別:
- 自動框選你家庭聚會照片里的親戚朋友們,然后你就可以給每個人都貼標簽了,不用自己逐個框選。
- 在社交網站上注冊的時候,你上傳了一張照片,瀏覽器可以幫你裁剪好***尺寸。
2、條形碼識別:
- 識別網頁中的條形碼/二維碼,并作相應的動作,比如鏈接跳轉,支付等等。
3、文本識別:
- OCR
- 配合語音接口,朗讀圖片中的文字
除此之外,開發者大可以盡情發揮想象,創造更多***有趣的應用。
社區反映
圖形識別雖然是剛需,但自去年底公布消息以來,可能是由于這些API尚處于實驗階段,尚待打磨,在開發社區內還未形成大范圍的討論,目前能收集到的主要是以下資料供開發者參考。
- API: Accelerated Shape Detection in Images - by Miguel Casas-Sanchez (Google Inc.) | 中文版 by 談浩
- Face detection using Shape Detection API - by Paul Kinlan
不過正因為進化迅速,這套圖形識別API從去年的M57版本發展至今,已經發生了不小的變化,也許在不久的將來,就會合并到穩定版中,真正為廣大開發者所用,構建更多有趣的應用。