網(wǎng)友評分:
5分
硬字幕提取工具是一款小巧易用的字幕提取軟件,可以幫助用戶快速提取對應(yīng)視頻的字幕內(nèi)容,軟件覆蓋了VideoSubFinder、SubtitleEdit、以及百度訊飛搜狗OCR的一個工具,方便實用。軟件采用AI文字檢測+傳統(tǒng)的數(shù)字圖像處理技術(shù),提取字幕圖片和時間軸信息,然后利用百度訊飛有道OCR通用文字識別云引擎+離線ocr引擎識別出文字,在校對窗校對后生成srt字幕文件,最后還可選調(diào)用第三方工具APP做調(diào)軸補漏等工作,從開始到結(jié)束,整個字幕提取流程一氣呵成,快速準確、識別率高、省時省力。有需要的朋友歡迎下載使用!
支持“雙語字幕”識別、字幕翻譯、動態(tài)字幕等功能
支持字幕保存,導(dǎo)入等功能
支持在線翻譯功能。
1、準備百度OCR服務(wù)APP_ID / API_KEY / SECRET_KEY
百度注冊獲取百度通用文字識別服務(wù)的APP_ID / API_KEY / SECRET_KEY,
一個手機號碼注冊一個賬號(須實名認證)。
每賬號每天免費識別次數(shù)有規(guī)定,如不夠用可多注冊幾個賬號。對于長期需求用戶,建議購買次數(shù)吧,價格不貴,還能支持國家高科技發(fā)展。
注冊步驟很簡單,可自行百度,獲得的APP_ID / API_KEY / SECRET_KEY信息先保存起來下面會用到。
如果您現(xiàn)在沒時間注冊,可以下載本工具支持離線OCR識別的版本,使用里面的離線ocr來識別,本步驟可略過。
2、準備工作流程中最后可能用到的APP2第三方軟件
百度下載安裝Subtitle Edit 作為 APP2
注:APP2 不指定,可以選用戶熟悉的其他軟件,例如SubtitleEdit可換成Aegisub或 ArcTime
如果對提取的字幕不需要精調(diào),只是一般使用,本步驟可略過。
如果是離線OCR版須安裝包內(nèi)的vlc-3.0.12-win64.exe,不然智能截圖不能工作。
3、設(shè)置硬字幕提取工具
打開軟件
點擊‘系統(tǒng)設(shè)置’
填入步驟1獲得的百度OCR服務(wù)APP_ID / API_KEY / SECRET_KEY(如使用離線ocr引擎則不用做此步)
點Browse找到步驟2安裝好的AP2P的入口exe文件(如不需調(diào)軸補漏則不用做此步),然后Save保存設(shè)置。
4、用VideoSubFinder_5.50_x64生成RGBImages
點擊主界面VideoSubF按鍵,將啟動運行VideoSubFinder_5.50_x64(旁邊的‘智能截圖’按鍵是類似于VideoSubFinder的另一個截圖工具,采用AI文字檢測+傳統(tǒng)的數(shù)字圖像處理技術(shù),善于提取復(fù)雜動態(tài)字幕并能做到100%不漏,高級用戶可學(xué)習(xí)第四章之-高級功能)
點擊左上角File -> Open Video(FFMPEG)(如不能打開視頻,可換OPENCV),打開要提取字幕的視頻文件(本例為:倚天屠龍記之魔教教主-中字.mp4)
快速瀏覽全片,查看字幕區(qū)間矩形最大范圍(注意有些視頻是兩層字幕),用兩根豎線兩根橫線設(shè)置字幕截圖區(qū)間(四根線在視頻窗口邊緣不容易發(fā)現(xiàn),試著點擊選中可以移動它)。注意:矩形邊框要比實際字幕稍大,不要為了節(jié)省圖片尺寸而把區(qū)間設(shè)置成緊貼字幕,如果字幕周邊余量太小,會影響后續(xù)百度OCR識別(當然也沒必要設(shè)置得太大)。
點擊Search右邊的Settings,出現(xiàn)設(shè)置界面,我們只關(guān)心左邊這塊能影響Search字幕圖片的參數(shù)。
第一個參數(shù)‘Text Alignment’默認設(shè)置是‘Center’,須點擊設(shè)置成‘Any’。
其他眾多參數(shù)中,有一個參數(shù)至關(guān)重要,就是Use Filter Colors這項,default值是空的,其他參數(shù)可以不設(shè),這個一定要設(shè)置上,特別是非純白字幕,例如黃色!如果不設(shè)置,有大幾率會漏字幕。
我們需要取色字幕文字的骨干顏色(骨干外則是字幕輪廓顏色,不要取偏了),然后將顏色值填入,將有助于VideoSubFinder判斷字幕出現(xiàn)和結(jié)束的時間,生成正確的時間軸信息,并防止丟時間軸。常見字幕顏色可能有白色的、黃色的,或者其他顏色,本例電影的字幕是白色。如果是多色字幕,可以按VSF要求取色多色填入。
具體的參數(shù)設(shè)置,可以參考Docs目錄下的readme_eng.txt,專業(yè)用戶精調(diào)參數(shù)可以提高Search字幕幀的準確率,從而減少丟時間軸(少字幕圖片,致命)和假時間軸(空字幕圖片,影響不大)的情況,不過據(jù)筆者使用經(jīng)驗,如果沒弄明白參數(shù)含義和作用,隨意調(diào)整反而適得其反,普通用戶還不如不調(diào)的好。
在右邊界面先點一下Pixel Color
然后點擊字幕白色文字中心骨干取色,點不準可以多點幾下。
取到了顏色,會顯示出來
本例將Lab: l:245 a:127 b:129 拷貝后雙擊填入Use Filter Coloers,一般做了這步就可以基本保證不會有時間軸丟失的情況,算是完成了Search的設(shè)置。
點擊Search -> Clear Foders 清空RGBImages目錄,
然后點 OCR Search,程序開始掃描視頻文件,生成RGBImages。
幾分鐘后掃描完成,可以關(guān)掉VideoSubFinder_5.50_x64,這時工具將顯示RGBImages目錄下的所有字幕截圖:
初次使用我們可以在文件列表區(qū)按鼠標右鍵菜單,選‘Open folder’打開RGBImages目錄看一下:
這些是剛才VideoSubFinder_5.50_x64 Search生成的1000多個字幕切片圖片文件,說明這個電影有1000多條字幕呢。文件名前段為時間軸信息。
可以打開文件看看,是RGB原色字幕截圖切片,很適合AI訓(xùn)練過的OCR引擎做識別。
5、清理空字幕圖片
我們可以在‘刪合窗’中清除RGBImages目錄中的空字幕圖片。
由于VideoSubFinder 的Search算法還沒做到100%準確,所以會誤生成少量無字幕空圖片(假時間軸),有時還會把廣告也截圖下來,我們在‘刪合窗’中用鼠標滾輪快速翻頁瀏覽RGBImages目錄,把發(fā)現(xiàn)的空字幕、廣告水印圖片打上刪除標記,標記完最后統(tǒng)一刪除,讓后續(xù)百度OCR識別不用浪費每月有限額度,同時在校對階段不用再頻繁做刪除工作。
一頁可以顯示20~300張圖片(默認90張),瀏覽、標記、刪除非常方便。
翻頁:點擊<<<、>>>按鍵,或鍵盤PgUp/PgDn鍵、↑/↓鍵,或?qū)?a href="http://m.virtualinsta360.com/zhuanti/68.html" target="_blank" class="keylink">鼠標指針停留在圖片區(qū),滾動鼠標滾輪,可以翻頁。
標記:鼠標左鍵點擊可以標記選中圖片,再次點擊可以去選中。Shift+鼠標左鍵可以連續(xù)多選、連續(xù)去選(可跨頁)。
刪除:直到最后一頁標記完成,點<<面板上的‘全刪合’按鍵會彈出刪除提示,確認后將刪除所有標記過的空圖片。
更多方便的功能(例如合并重復(fù)字幕)可以看“第四節(jié)之 視頻截圖、刪合窗(刪除合并)”
如下圖一處為廣告,可以選中標記它:
如下圖幾處為空字幕圖片,可以選中標記它:
一直標記到最后一頁:
然后點‘全刪’,
確認后將會把剛才標記過的所有空字幕、廣告水印圖片刪除掉(如果發(fā)現(xiàn)不能刪除,多半是系統(tǒng)權(quán)限問題,請不要將本工具安裝在C盤或桌面):
清理完空字幕圖片后,點擊面板上的‘去OCR’按鍵,將切換到OCR校對窗。
6、運行百度OCR識別
百度高精度每月免費識別額度較低,如不采用疊圖技術(shù) --- 將多張字幕圖片合成一張大圖來識別以節(jié)省額度,每月只能識別較少字幕圖片,因此,如果用戶沒有購買額度,應(yīng)該在面板上勾選‘疊圖’。
如果沒有注冊百度,而是采用離線識別引擎可選tr并去掉勾選疊圖。
點擊主界面的OCR按鍵,程序?qū)⑦B接百度OCR服務(wù)器,對RGBImages目錄中的所有字幕圖片從頭到尾按順序做識別,只需等待完成即可。
OCR識別完成了! (細心的用戶可能會留意到:在識別過程中有少量圖片會有自動標注‘X’,這是因為程序在OCR識別過程中會自動標注空字幕圖片,因為上個手動刪空步驟遺留了少量空字幕圖片,所以呢,如果你額度充足,是可以不用做手動刪空步驟的)
這時在RGBImages目錄下已經(jīng)為每個.jpeg文件生成了一個同名的 .txt字幕文件,以及檢測框坐標文件_boundingbox.txt,初次使用可以看一下。
7、校對字幕
如果希望在SubtitleEdit等字幕軟件中做校對,可以略過這個步驟,直接到下個步驟
校對窗顯示一頁1~4列、1~10行(默認1列6行)圖文。用戶可根據(jù)需要在系統(tǒng)設(shè)置里設(shè)置。
編輯:可以用輸入法進行常規(guī)的輸入、刪除、鼠標左鍵/右鍵插入空格、回車等操作。
查找替換:除了支持簡單的批量替換,還支持* ?通配符、反斜杠轉(zhuǎn)義等擴展找替換、正則表達式匹配替換等。
翻頁自動保存:點擊<<<、>>>按鍵,或鍵盤PgUp/PgDn鍵,或?qū)⑹髽酥羔樛A粼趫D片區(qū),滾動鼠標滾輪、或↑/↓鍵,都可以進行翻頁。翻頁將自動保存校對修改過的文字。
選中標記:ctrl+鼠標左鍵 可以標記刪除圖片,shift+鼠標左鍵 可以標記合并圖片,再次點擊可以去選中。
刪除合并:如果有選中的圖片,這時<<按鍵盤<Delete>按鍵會彈出刪除合并提示,OK確認或<Enter>將執(zhí)行刪除、合并。
刪除合并范圍:當前頁+后1頁=2頁內(nèi),后向跨頁合并是可能的。
校對完成后,按面板上的‘生成SRT’按鍵,將在RGBImages目錄下生成123.srt文件:
可以大概瀏覽一下,然后關(guān)掉。
生成SRT文件后,如時間軸不需要再調(diào)整、字幕不需要比對原視頻做補漏(要求不高),則至此字幕提取工作完成。
更多方便的功能(例如‘精準對齊’,‘鼠標左右鍵自定義功能’,‘字體選擇’,‘字號調(diào)整’,‘每行字號單獨調(diào)整’)可以看“用戶手冊之第四章之 校對窗”
生成SRT文件后,如需調(diào)整時間軸、比對原視頻做補漏,點擊面板上的‘SubtitleE’按鍵,將打開SubtitleEdit工具編輯123.srt字幕文件。
8、用SubtitleEdit編輯字幕文件
之所以前面在校對窗做過校對,這里又用到APP2來做編輯,是因為有些用戶(例如字幕組)對字幕要求高,還需要做調(diào)軸、補漏等進一步校對工作。
在波形圖窗口里,“點擊以添加波形”,打開視頻文件,本例是‘倚天屠龍記之魔教教主-中字.mp4’,將生成波形數(shù)據(jù):
在波形圖窗口,勾選‘選擇當前播放時刻的字幕’,設(shè)定播放速度,例如200%,然后開始播放視頻,字幕會同步顯示在播放窗口,可隨時暫停播放,進行字幕校對、補漏、調(diào)軸。
該刪除的刪除,該修正的修正,該替換的替換,改補漏的補漏、該調(diào)軸的調(diào)軸,注重細節(jié)的用戶還是認真過一遍吧。
完成字幕校對后,點擊“文件->另存為” 保存校對好的字幕文件,SubtitleEdit會自動將123.srt重命名為跟視頻文件同名的srt文件“倚天屠龍記之魔教教主-中字.srt”,并保存在視頻文件所在目錄下,方便大多數(shù)播放軟件播放視頻文件時自動加載同名字幕文件。
至此,整個硬字幕提取流程就走完了。
標簽: 字幕提取
關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們
Copyright ? 2005-2025 m.virtualinsta360.com.All rights reserved.
浙ICP備2024132706號-1 浙公網(wǎng)安備33038102330474號