成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

真快!幾分鐘就把視頻語音識別為文本了,不到10行代碼

人工智能
雖然已經(jīng)很簡單了,但是對于程序員來說還是不夠簡潔,畢竟程序員都很“懶”,Whisper 雖說安裝和調(diào)用已經(jīng)很簡單了,但還是需要獨(dú)立安裝 PyTorch 、ffmpeg 甚至 Rust。

大家好,我是風(fēng)箏

將音視頻文件中的音頻轉(zhuǎn)為文字內(nèi)容,這個(gè)需求放到兩年前還不大好實(shí)現(xiàn),但是放到今天,幾分鐘就解決了。

聽說有的公司為了抓取訓(xùn)練數(shù)據(jù),已經(jīng)把抖音、快手這些短視頻平臺上的視頻扒了個(gè)遍,然后將其中的音頻提取成文本,用作大數(shù)據(jù)模型的訓(xùn)練語料。

如果你有將視頻或音頻文件轉(zhuǎn)文字的需要,不妨試一試今天提供的這個(gè)開源方案。比如搜索影視臺詞出現(xiàn)的時(shí)間點(diǎn)。

話不多說,進(jìn)入正題。

Whisper

這個(gè)方案就是 OpenAI 開源的 Whisper,當(dāng)然是用 Python 寫的了,只需要簡單安裝幾個(gè)包,然后幾行代碼一寫,稍等片刻(根據(jù)你的機(jī)器性能和音視頻長度不一),最終的文本內(nèi)容就出來了,就是這么簡單。

GitHub 倉庫地址:https://github.com/openai/whisper

Fast-Whisper

雖然已經(jīng)很簡單了,但是對于程序員來說還是不夠簡潔,畢竟程序員都很“懶”,Whisper 雖說安裝和調(diào)用已經(jīng)很簡單了,但還是需要獨(dú)立安裝 PyTorch 、ffmpeg 甚至 Rust。

于是,就有了更快、更簡潔的 Fast-Whisper。Fast-Whisper 并不是簡單封裝了一下 Whisper,而是是使用 CTranslate2 重新實(shí)現(xiàn) OpenAI 的 Whisper 模型,CTranslate2 是 Transformer 模型的快速推理引擎。

總結(jié)一下,也就是比 Whisper 更快,官方的說法是比 Whisper 快了 4-8 倍。不僅能支持 GPU ,還能支持 CPU,連我這臺破 Mac 也能用。

GitHub 倉庫地址:https://github.com/SYSTRAN/faster-whisper

使用起來就兩步。

  1. 安裝依賴包
pip install faster-whisper
  1. 寫代碼,
from faster_whisper import WhisperModel

model_size = "large-v3"

# Run on GPU with FP16
model = WhisperModel(model_size, device="cuda", compute_type="float16")

# or run on GPU with INT8
# model = WhisperModel(model_size, device="cuda", compute_type="int8_float16")
# or run on CPU with INT8
# model = WhisperModel(model_size, device="cpu", compute_type="int8")

segments, info = model.transcribe("audio.mp3", beam_size=5)

print("Detected language '%s' with probability %f" % (info.language, info.language_probability))

for segment in segments:
    print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))

沒錯(cuò),就是這么簡單。

能做什么呢

正好有個(gè)朋友想做短視頻,發(fā)一些雞湯文學(xué)的視頻,雞湯就來自于一些名家訪談的視頻。但是,他又不想把完整的視頻看一遍,就想用最快的方式把文本內(nèi)容弄下來,然后讀文字,因?yàn)樽x文字要比看一篇視頻快的多,而且還可以搜索。

我就說,連完整的看一篇視頻的虔誠之心都沒有,能經(jīng)營好賬號嗎。

于是我給他做了一個(gè),就是用的 Fast-Whisper。

客戶端

客戶端用 Swift ,只支持 Mac 端。

  1. 選則一個(gè)視頻;
  2. 然后點(diǎn)擊「提取文本」,這時(shí)會調(diào)用 Python 接口,需要等待一段時(shí)間;
  3. 加載解析出的文本以及出現(xiàn)的開始、截止時(shí)間;
  4. 選了一個(gè)開始時(shí)間和一個(gè)結(jié)束事件;
  5. 點(diǎn)擊「導(dǎo)出」按鈕,視頻片段就導(dǎo)出了;

,時(shí)長00:10

服務(wù)端

服務(wù)端當(dāng)然就是 Python ,然后用 Flask 包裝一下,對外放開接口。

from flask import Flask, request, jsonify
from faster_whisper import WhisperModel

app = Flask(__name__)

model_size = "large-v2"
model = WhisperModel(model_size, device="cpu", compute_type="int8")


@app.route('/transcribe', methods=['POST'])
def transcribe():
    # Get the file path from the request
    file_path = request.json.get('filePath')

    # Transcribe the file
    segments, info = model.transcribe(file_path, beam_size=5, initial_prompt="簡體")
    segments_copy = []
    with open('segments.txt', 'w') as file:
        for segment in segments:
            line = "%.2fs|%.2fs|[%.2fs -> %.2fs]|%s" % (
                segment.start, segment.end, segment.start, segment.end, segment.text)
            segments_copy.append(line)
            file.write(line + '\n')

    # Prepare the response
    response_data = {
        "language": info.language,
        "language_probability": info.language_probability,
        "segments": []
    }

    for segment in segments_copy:
        response_data["segments"].append(segment)

    return jsonify(response_data)


if __name__ == '__main__':
    app.run(debug=False)

以上就是個(gè)拋磚引玉的小工具,留著自己用用也足夠了。

責(zé)任編輯:武曉燕 來源: 古時(shí)的風(fēng)箏
相關(guān)推薦

2013-07-02 09:58:38

ClojureClojure教程

2016-09-30 15:13:01

Python代碼

2021-04-02 14:29:04

黑科技人工智能虛擬

2009-12-29 09:01:46

ADSL斷線

2019-07-08 13:51:02

DockerWindows 10Windows

2010-01-06 15:35:06

JSON對象

2010-01-21 09:46:24

C++程序

2010-02-23 14:19:30

Python目錄操作

2024-12-03 15:38:14

2010-03-01 18:13:22

Python程序

2017-08-03 17:30:26

戴爾IoT設(shè)備

2009-11-25 17:22:12

路由器安裝

2010-03-04 10:01:01

Android基本組件

2009-12-21 13:51:54

ADO.NET處理

2024-04-19 09:37:49

Ollama大語言模型開源

2010-01-21 14:51:02

C++函數(shù)指針

2010-01-26 14:53:43

C++

2022-04-06 09:28:04

漏洞SQL注入

2022-04-12 08:46:30

for 循環(huán)遍歷字符串

2010-01-06 13:39:51

擴(kuò)展Jquery的Js
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产1页 | 国产a视频 | 国产三级电影网站 | av中文字幕在线 | 天堂资源 | 91久久久久久久久久久 | 国产日韩欧美 | 欧美精品一区二区三区在线播放 | 精品一区二区三区入口 | 成人午夜 | 婷婷免费在线 | 激情小说综合网 | 精品一区国产 | 国产农村妇女精品一二区 | 欧美一级二级视频 | 国产精品污www一区二区三区 | 亚洲风情在线观看 | 91久久精品国产 | 91精品国产91| 欧美成人一区二免费视频软件 | 四虎永久免费黄色影片 | 日韩成人在线电影 | 91精品国产综合久久婷婷香蕉 | 国产欧美日韩久久久 | 欧美激情a∨在线视频播放 成人免费共享视频 | 欧美久久一区二区 | 91一区二区三区 | 一区免费 | 国产超碰人人爽人人做人人爱 | 国产999精品久久久久久 | 91大神在线资源观看无广告 | 99re视频精品 | 欧洲成人 | 成人在线 | 最新超碰 | 6996成人影院网在线播放 | 夜久久| 成人免费网站视频 | 天天干天天爽 | 亚洲视频在线看 | 免费观看一级特黄欧美大片 |