AI字幕生成神器|語音轉文字|Whisper Transcription

by Dane
424 views

對於影片工作者來說,「上字幕」這件事有太多東西可以抱怨了,耗費大量時間、瑣碎,還有…不上不行啊!

過去試過很多免費、付費「語音轉文字」服務,還有外包請專人協助,但礙於時間性、準確度及成本考量,最終選擇剪映的「識別字幕」功能,以2022年來說能如此準確、免費且快速地識別中文語音,剪映已經算是很強大了。直到近期發現了 Whisper Transcription,才真正想擁抱AI推出的服務。

它支援繁體中文,準確率高達95%,且速度很快!

這款 Whisper Transcription 能如此厲害,使用的技術正是 OpenAI 所推出的 Whisper 自動語音識別(automatic speech recognition, ASR)模型,無論是會議記錄、訪談、錄音、課程、演講、影音資料等音檔,或是 YouTube 連結,都能快速且準確地將音檔轉換成文字,該模型主打的項目有兩項:

  1. 多種語言的語音辨識

  2. 將多種語言文字翻譯成英文

Whisper Transcription

Ref:Dane

步驟二:下載 Whisper 語音模型

下載語音模型後就能開始使用囉!也別猶豫很久,因為模型可以隨時刪除或者進行不同版本的切換。

Multiple Languages

Ref:Dane

步驟三:三種常用語音轉文字功能

最常使用的功能有三個:

  1. 輸入 YouTube 連結

  2. 開啟影片或聲音檔案(支援 MP3、WAV、M4A、MP4 和 MOV 格式)

  3. 使用麥克風即時錄音

Ref:Dane

步驟四:以開啟影片為例

操作方式很簡單,直接點選你要的功能後即開始識別!此次示範的是37分半的影片檔案,識別時間共花了04:19,相當地快,雖然有些地方不太正確,如人名(圖光子涵義 → 荼公子韓奕)、行業專有名詞(尾雕 → 萎凋、減快 → 解塊)不得不人工校正,但總體來說,真的很給力了。

Ref:Dane

步驟五:匯出逐字稿,大功告成!

點選上方的「Export」按鈕即可匯出各種格式的檔案,支援逐字稿、SRT、VTT、CSV、HTML、PDF、DOCX等格式。

Ref:Dane

小總結

有了AI的幫忙,真的省下很多時間!希望此次的分享有幫助到大家!若有任何疑問或想交流的也歡迎留言或私訊我唷!

Leave a Comment