堪称神器的软件 篇十八:AI字幕神器Buzz,GUI版本的whisper
之前介绍过whisper——基于AI的语音识别工具,可以从视频和音频提取字幕和文本,而Buzz是whisper的GUI版。
相对而言Buzz对新手友好很多,安装简单,有GUI界面,下载模型的速度也还可以。
接下来介绍Buzz的安装,在此之前一样要安装 ffmpeg ,复制 ffmpeg 的 bin 文件夹路径。然后进入“高级系统设置”选择“环境变量”,选择“Path”点击新建,然后把 ffmpeg 的 bin 文件夹路径添加进去。
然后去Buzz开源地址下载安装包,下载并安装:
打开Buzz的界面非常简单,话筒图标是直接调用录音软件录音转换字幕。+按钮则是选择语音或视频文件进行转换。
软件选项也很简单选择对应的语言和选择的模型进行转换即可,初次使用需要从网上下载模型到本地。如果有好一点显卡可以尝试大模型。如果仅仅是转换英文tiny小模型就够用了。
转换速度取决于你使用的模型和硬件情况,效果和whisper一致。
其实视频、音频转文字还有一个简单解决方案。现在的剪辑工具比如剪映、必剪这些剪辑软件都带语音识别字幕功能。识别准确率不输whisper(汉语准确率更高),速度甚至更胜whisper,也算一个不错解决方案。
就介绍到这里!
作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~
值友2973794869
校验提示文案
我早餐吃饺子
校验提示文案
宝总在上海也买不起房
校验提示文案
宝总在上海也买不起房
校验提示文案
我早餐吃饺子
校验提示文案
值友2973794869
校验提示文案