软件推荐 打工人必备离线语音输入法,还可以录音、视频转文字不限时长
CapsWriter是一款高效便捷的电脑端语音输入工具,用起来很简单:长按键盘上的大写锁定键(Caps Lock)超过0.3秒,启动语音识别功能。松开大写锁定键时,CapsWriter会立即将语音转换为文字,并输入到当前激活的文本编辑区域。
经过几天使用,这款软件极大的提高了我的工作效率,我给这个软件5星评价。
优缺点:
优点:
使用方便,极大提高输入效率
离线,不担心泄露隐私
支持中英文混输
支持自定义词库
支持录音、视频输出文字和字幕
支持记录输入历史(可关闭)
识别速度快(i5-10500H可以实现1分钟识别25分钟音频)
可以通过局域网实现一台服务端带多台客户端
用悄悄话的声音识别正确率也挺高,不用担心在办公室里尴尬
缺点:
客户端偶尔崩溃
长句子识别时,断句的正确率偏低
使用蓝牙耳机作为麦克风时,蓝牙耳机的麦克风长时间被监听,对耳机续航影响很大
对方言和多语言支持不足
使用说明
百度盘: https://pan.baidu.com/s/1zNHstoWZDJVynCBz2yS9vg 提取码: eu4c
使用说明:下载完成之后,将模型放入model文件夹。根据自己的需要修改软件设置,打开 config.py,本人将下面几个位置做了修改:
suppress = False # 是否阻塞按键事件(让其它程序收不到这个按键消息)
restore_key = True # 录音完成,松开按键后,是否自动再按一遍,以恢复 CapsLock 或 Shift 等按键之前的状态
save_audio = False # 是否保存录音文件
多音字 = True # True 表示多音字匹配
声调 = True # False 表示忽略声调区别,这样「黄章」就能匹配「慌张」
软件配置完成之后,启动以下两个程序就可以运行
start_server.exe、start_client.exe
如果需要识别录音、视频,将录音拖动到start_client.exe图标上,支持多个文件一起拖入识别。
更多进阶功能,点击readme.md查看
使用技巧
因为各种各样的原因,电脑自带的麦克风,可能收音效果不是理想。电脑连接蓝牙耳机的麦克风,用起来更加方便。只需要蓝牙耳机连接电脑之后,打开“声音设置”,将输入改为蓝牙耳机。蓝牙耳机的续航对使用体验影响很大。如果蓝牙耳机的续航时间比较短,经常给蓝牙耳机充电就挺麻烦的。我为这软件专门买了个开放式蓝牙耳机,券后才¥3.9,电池容量是100mAh,续航只能坚持半天。如果买两个轮流用,问题倒也不大。最后改成把自己的头戴耳机拿去办公室,电池容量1200mAh,用一周大约没问题。如果是TWS耳机,也可以每次用一只,轮流用。
作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~
值友5552339895
校验提示文案
AI小值-电脑数码
校验提示文案
AI小值-电脑数码
校验提示文案
值友5552339895
校验提示文案