成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI虛擬點讀機,手勢識別+OCR+語音TTS

開發 前端 人工智能
TTS?如果是Mac?可以使用系統自帶的,不需要安裝其他程序。如果是Windows?可以使用微軟的edge-tts。edge-tts?效果比大部分tts強太多。

哈嘍,大家好。

最近在研究AIGC方面的內容,好久沒有更新公眾號內容。

今天給大家分享的是用計算機視覺技術做一個虛擬點讀機。

圖片圖片

技術上很簡單,只不過工程實現先有些細節需要注意。

1. 思路

  1. OpenCV讀取視頻流,識別食指坐標
  2. 用兩個食指坐標作為頂點,畫一個矩形框
  3. 截取矩形框,送入OCR模型識別文本
  4. 用語音合成引擎TTS將文本合成語音
  5. 調用音頻播放模塊,播放聲音

2. 細節處理

OpenCV讀取視頻流、mediapipe識別食指坐標,之前的分享的文章都有代碼,這里就不貼了,重點說下需要處理的細節。

細節1. 檢測到兩個食指時,需要設置一個時間間隔,這樣可以給你預留一些時間來調整矩形框

if self.point_start_time is None:
    # 首次同時檢測到左右食指
    self.point_start_time = time.time()
else:
    time_del = time.time() - self.point_start_time
    if time_del > 3:

圖片圖片

細節2. 設置標記,防止重復識別

矩形框一旦確定,如果沒有標記,每一幀都會送入OCR模型識別、然后播放聲音,這樣程序就會卡死。

需要設置標記,保證任何時刻只處理一個矩形框。

if not self.is_processing:
  # 開始識別
  self.is_processing = True
  # ocr識別選定的圖片
  t, b = min(p0_y, p1_y), max(p0_y, p1_y)
  l, r = min(p0_x, p1_x), max(p0_x, p1_x)

  selected_frame = frame[t:b, l:r]
  # ocr識別文字
  text = self.ocr_rec(selected_frame)
  # 文本轉語音
  voice = self.tts.get_speech(text)
  # 播放語音
  self.player.play(voice, False, notallow=lambda: self.stop_play())
  self.pc_time = time.time()

細節3. 多線程處理

播放音頻的時候需要用多線程播放,不然主程序會卡死,知道音頻播放完成才能繼續運行。

如果識別的內容很多,播放時間長,程序就會一直卡著很長時間沒有反應。

3. 其他技術

關于OCR和TTS技術之前的文章都有介紹過。

OCR直接用Paddle框架和預訓練好的模型就行。

TTS如果是Mac可以使用系統自帶的,不需要安裝其他程序。如果是Windows可以使用微軟的edge-tts。edge-tts效果比大部分tts強太多。

也可以用d-id、wav2lip或者sadtalker實現唇形合成,讓靜態圖片朗讀文本內容。

責任編輯:武曉燕 來源: 渡碼
相關推薦

2025-06-27 05:00:00

AI語音詐騙AI語音識別人工智能

2022-10-24 08:40:14

AI虛擬手勢計算

2021-05-06 11:18:23

人工智能語音識別

2021-05-06 11:13:06

人工智能語音識別

2021-12-24 10:34:11

鴻蒙HarmonyOS應用

2014-11-12 10:16:43

人工智能靈云

2022-05-17 12:25:59

物聯網智能建筑樓宇自控

2011-03-01 15:02:54

Qt

2020-09-21 07:00:00

語音識別AI人工智能

2024-12-03 09:59:00

2025-05-19 08:41:00

AI模型開發者

2024-06-20 11:11:07

2023-09-07 10:37:43

OCR項目字符串

2025-04-28 14:10:22

2013-05-07 17:21:09

ELMOS芯片手勢識別

2024-05-31 08:12:19

2024-07-30 11:21:17

TTSAIAgent

2021-04-09 20:49:44

PythonOCR圖像

2023-12-25 19:21:55

ocr人工智能

2020-12-25 09:29:40

人工智能AI深度學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91极品视频| 国产91久久精品一区二区 | 亚洲欧洲成人 | 国产精品福利一区二区三区 | 福利一区二区在线 | 超碰伊人久久 | 伊人久久国产 | 97精品视频在线 | 久日精品 | 一区二区三区高清不卡 | 中文字幕高清av | 日韩欧美三区 | 日韩精品免费看 | 欧美a在线 | 日韩精品久久一区二区三区 | 国产精品18hdxxxⅹ在线 | 国产美女视频黄a视频免费 国产精品福利视频 | 国产精品明星裸体写真集 | 免费色网址 | 91网站在线观看视频 | 午夜久久久久久久久久一区二区 | 欧美激情网站 | 国产一区二区在线播放 | 午夜在线免费观看视频 | 欧美一级三级 | 欧美区精品 | 午夜免费| 黄频免费 | 亚洲人成人一区二区在线观看 | 亚洲人的av| 国产精品性做久久久久久 | 国产人成精品一区二区三 | 日本免费视频在线观看 | 亚洲看片网站 | a级大片免费观看 | 亚洲精品视频网站在线观看 | www.成人免费视频 | 久久精品a级毛片 | 亚洲精久久久 | 国产精品日韩欧美一区二区 | 日本三级网站在线 |