指示
写给小白:
解压压缩文件,双击打开,就可以使用。下面的使用方法都是针对高手的,新手看这个就可以了。
写信给老板:
原视频:选择mp4/avi/mov/mkv/mpeg视频,可以选择多个视频;
输出视频目录:若不选择,则默认目录为_video_out,并在该目录下的srt文件夹中建立原语言和目标语言两个字幕文件。
选择翻译:Google|百度|腾讯|Azure|Gemini|DeepL|DeepLX翻译频道
网络代理地址:如果你所在地区无法直接访问谷歌,需要在软件界面设置代理,比如网络代理合并dll文件到软件,如果使用v2ray,则填写:10809,如果冲突则填写:7890,如果修改了默认端口或者使用了其他代理软件,则继续填写
原始视频语言:选择需要翻译的视频的语言
翻译目标语言:选择要翻译成的语言
选择配音:选择翻译的目标语言后,您可以在配音选项中选择配音角色;
硬字幕:表示显示全部字幕,如果希望网页播放时有字幕,请选择硬字幕嵌入。
软字幕:播放器支持隐藏字幕管理,可以显示或隐藏字幕。这样在网页上播放时就不会显示字幕了。有些国产播放器可能不支持。需要将生成的视频同名的srt文件和视频放在同一个目录下才可以显示。
语音识别模型:选择base/small/medium/large-v3,识别效果越来越好,但识别速度越来越慢,需要的内存越来越大,base模型是内置的,其他模型请单独下载,解压后放在当前软件目录/models目录下,如果GPU显存小于4G,不要使用large-v3
全识别/预分割:全识别是直接把整个语音文件送去模型处理,分割可能更准确,但也会出30秒的单字幕,适合有明显静默的音频;预分割是把音频切分成10秒一段,分别送去模型处理。
配音速度:填写-90~+90之间的数字。不同语言的同一句话需要的时间不同,因此配音后音频、视频和字幕可能不同步。您可以在这里调整速度。负数代表减慢速度,正数代表加速播放。
音视频对齐:“自动加速配音”和“自动减慢视频速度”
经过翻译之后,不同语言的发音时长是不一样的,比如中文3秒,翻译成英文可能就是5秒,导致时长和视频不一致。
2 种解决方案:
portant;">
两者中只能选择一个
静音分段:输入 100 到 2000 之间的数字,代表毫秒。默认值为 500,表示将语音分段为静音段大于或等于 500ms 的间隔。
CUDA加速:确认你的电脑显卡是NVIDIA卡,并且已经配置了CUDA环境和驱动,开启此项可以大大提高速度。具体配置方法见下文CUDA加速支持。
TTS:可以选择角色从edgeTTS和openai TTS模型中合成语音,对于openai需要使用官方接口或者打开tts-1模型的第三方接口。
点击开始按钮,底部显示当前进度和日志,右侧文本框显示字幕
字幕解析完成后会暂停,等待修改字幕,若无操作,60秒后自动进入下一步。也可以在右侧字幕区域编辑字幕,然后手动点击继续合成
目标文件夹内与视频同名的子目录中会生成两种语言的字幕srt文件、原声及配音wav文件,以供进一步处理
设置台词角色:可以设置字幕中每句台词的发音角色。首先在左侧选择TTS类型和角色,然后点击字幕区右下角的“设置台词角色”。在每个角色名称后的文字中填写需要用该角色配音的内容的台词编号。
常见问题
使用谷歌翻译合并dll文件到软件,错误消息
要使用国内Google官方接口,需要挂一些东西
使用了全局代理,但是好像没有经过代理
需要在软件界面“网络代理”中设置具体的代理地址,例如:7890
提示FFmepg不存在
首先检查软件根目录下是否存在ffmpeg.exe和ffprobe.exe文件,若不存在则解压ffmpeg.7z并将这两个文件放在软件根目录下。
在 Windows 上启用了 CUDA,但出现错误消息
A:首先查看详细安装方法,确保正确安装了cuda相关工具,如果还是报错,点击下载cuBLAS,解压后将里面的dll文件复制到C:/Windows/System32
B:如果你确定和A无关,那么请检查视频是否是H264编码的mp4,部分高清视频是H265编码的,不支持,可以尝试在“视频工具箱”中将其转换为H264视频。
C:GPU下视频硬件编解码对数据正确性要求严格,容错率几乎为零,任何错误都会导致失败,加之显卡型号、驱动版本、CUDA版本、ffmpeg版本的差异,容易出现兼容性错误。目前已增加fallback功能,GPU失败后会自动使用CPU软件编解码。失败时会在logs目录下的logs中记录错误信息。
该模型不存在
0.985版本之后需要重新安装模型,models目录下是各个模型的文件夹,而不是pt文件。如果使用base模型,请确保models/models–Systran–faster-whisper-base文件夹存在。如果要使用small模型,请确保models/models–Systran–faster-whisper-small文件夹存在,如果不存在,需要下载format文件夹并复制到models。如果使用medium模型,请确保models/models–Systran–faster-whisper-medium文件夹存在,如果不存在,需要下载format文件夹并复制到models。如果使用large-v3模型,请确保models/models–Systran–faster-whisper-large-v3文件夹存在,如果不存在,需要下载该文件夹并复制到models。
目录不存在或权限不正确。
右键单击 sp.exe 并以管理员权限打开它
出现错误消息,但没有提供详细的错误信息。
打开logs目录,找到最新的日志文件,滚动到最下面就可以查看错误信息。
Large-v3 模型非常慢
如果你没有N卡GPU,或者没有配置好CUDA环境,或者你的显存小于4G,请不要使用该模型,否则会非常慢、卡顿
缺少 cublasxx.dll 文件
有时您可能会遇到“cublasxx.dll不存在”的错误。在这种情况下,您需要下载cuBLAS,然后将dll文件复制到系统目录中。
点击下载cuBLAS,解压并将里面的dll文件复制到C:/Windows/System32
缺少背景音乐
仅识别保存人声,即配音后的音频中不存在原有的背景音乐,如需保留请使用人声-背景音乐分离项目提取背景音,然后与配音文件合并。
如何使用自定义声音
暂不支持该功能,如有需要,可以先识别字幕,然后使用另一个声音克隆项目,输入字幕srt文件,选择自定义音调合成音频文件,再生成新视频。
LCD 上无法显示字幕和语音
经过翻译之后,不同语言的发音时长是不一样的,比如中文3秒,翻译成英文可能就是5秒,导致时长和视频不一致。
2 种解决方案:
portant;">1. 强制配音加速播放,以便缩短配音时长和视频对齐
portant;">2. 强制视频慢速播放,以便延长视频时长和配音对齐。
两者中只能选择一个
字幕不显示或乱码
使用软合成字幕:字幕以单独文件形式嵌入视频,可再次提取。如果播放器支持,可在播放器字幕管理中启用或禁用字幕。
注意,很多国产播放器必须将srt字幕文件与视频放在同一个目录下同名才能加载软字幕,而且可能需要将srt文件转为GBK编码,否则会显示乱码。
如何切换软件界面语言/中文或英文
如果软件目录下没有set.ini文件,先创建,然后把下面的代码粘贴进去,在lang=后面填入语言代码,zh代表中文,en代表中文,然后重启软件