给行业树一个新标杆:科大讯飞智能录音笔SR502
录音笔的发展,从最初的功能单一化逐渐演变到「办公神器」。科大讯飞的发展史,也在一定程度上代表了录音笔的发展史。早期的录音笔仅能录制声音,后续还需要大量整理的工作。科大讯飞也根据市场需求,陆续推出了具有文字转写、更清晰收音、更智能整理的智能录音笔。
每次科大讯飞的产品升级,也带动了一次又一次的行业革新。
我也是录音笔的长期用户,很多商务或者办公人士,其实都是离不开录音笔的。但痛点在于文字转写准确度不高、收音距离不够远、整理录音文件很麻烦等等。
所以2022年了,既然要买录音笔,何不一步到位买个好点的呢?
而科大讯飞推出的智能录音笔SR502,可以说又给业界树立了一个全新的标杆。
高精度的转文字准确率、远距离收音、支持离线转文字、区分多人讲话、多语种的转写与翻译等特性,也是新时代录音笔应该具备的,更是我们日常选购要首先考虑的。
外观与设计
▼ 很喜欢包装上的这句话「智能转写,落字有声」。
新时代的录音笔,就是需要厂商为其赋予高度的智能化与精准的转写效率。
▼ 因为是支持插入sim卡联网的,所以除了常规的充电器和数据线外,还附送了卡针。
▼ 录音笔加屏幕不新鲜,但是科大讯飞给SR502设计了一块3.5英寸的大尺寸触屏。除了观看更清楚外,日常操作交互也更方便了。
再好的算法,也要有完备的硬件作为支撑。
▼ 顶部2颗10毫米的定向麦克风+6颗全向麦克风,在多种复杂场景下依然可以做到更佳的人声拾音,并大幅增加拾音距离,最远拾音距离达到了15米。
框架和麦克风都是金属材质,整体设计很有质感,也符合自身的产品定位。
▼ 背面是一颗800万像素的摄像头,可以用来OCR识别或者拍照。别小看这颗摄像头,它可以实现智能提取PPT、EXCEL、图内文字信息等,相比一般录音笔属于降维打击了。
▼ 和6.7英寸的iPhone 14 Pro Max对比一下,SR502的体积小巧了很多。日常随身携带,也不会成为累赘。
▼ 侧面分别是一键录音、音量按键、电源开关和SIM卡槽。
收音效果怎么样
虽然SR502功能非常多,但作为录音笔,我们还是先来测试一下基础的收音效果。
首先是一米和五米的录音效果,
(插入视频1)
▼ 1米距离收音很清楚,即使加大到5米,除了能感到声音距离的增加外,人声依然非常清晰。
1米 / 5米收音测试
鉴于SR502的性能太强,下面直接上地狱难度吧,和iPhone 14 Pro Max对比一下在嘈杂环境下的收音表现。
▼ 在非常嘈杂的闹市区,iPhone 14 Pro Max的人声和背景声都混在了一起,很难听清楚。而SR502通过2+6麦克风的组合与智能降噪,大幅降低了背景噪音,人声拾音依然非常清晰,优势非常明显。
要知道iPhone的收音在手机里应该是最好的了,但遇到专业设备还是差了很远。
嘈杂环境对比
实时转写转译
科大讯飞SR502内置了六种模式,分别是会议、演讲、采访、通用、备忘和音乐模式。
我觉得就日常使用来讲,无论是什么行业都可以非常好的满足需求了。
▼ 目前用户都是有10G的云空间附送,可以做到云端的多端同步备份。比如你可以实现手机、电脑端的互通,非常方便。
▼ 当然你也可以在电脑手机端的App读取,或者微信扫码直接下载。
▼ 在设置里,你可以打开录音转文字、离线转写/在线转写。
实时转写
做好录音不难,但难点在于实时的转写与转译,这对智能算法要求非常高。
在这个领域,科大讯飞就是目前的业界第一,没有争议的那种。
▼ 在录音的同时,SR502会实时转写出文字。
▼ 支持多语言多语种,甚至还有12种方言转写支持。
▼ 放个视频来看一下转写速度,从发声人单词结束到屏幕显示文字,只需不到一秒。
实时转写
▼ 打开手机或电脑端的App,你就直接可以看到音频文件和刚转写的文字内容了。准确率非常高,几乎没有什么错词。
在录音笔云盘中可以免费下载转写好的文字和录的音频文件。
这里我模拟了一段会议室的白噪音,包括风声、写字声、雨声等,自己录了一段声音供大家参考。
▼ SR502距离我大概2米左右,演讲模式收音。我发音并没有可以加大声量,但SR502仍然做到了非常清晰的人声拾音。
白噪音演讲收音测试
▼ 再来看下转写情况,几乎完美。
离线转写
▼ 如果有隐私和保密性需求,那么也可以开启离线转写。不必上传云端,直接机内就能完成,这也是对机器性能与算法要求很高的功能。
▼ 可以看到开启离线转写后,自动上传功能显示已经关闭。
▼ 我把离线转写上传到了电脑端,方便大家查看转写准确度。整体没什么问题,除了「清华」两个字勿转成了计划,自行修改一下即可。
边录边译
▼ 此外还支持边录边译,这也依然是科大讯飞的强项所在。
▼ 同样也支持多种语言翻译。
▼ 视频中可以看到翻译的速度很快,且错误率也非常低。
边录边译
智能整理与编辑
以往录音笔的一大痛点就是录音文件的整理,现在SR502直接内置了文件整理功能。
分类
▼ 你可以自由的选择分类名称以及领域,在每次录音完毕可以直接归纳进去。
智能语义分段
▼ 转写的文字直接是分好段落的,这也是SR502的功能:智能语义分段。它会根据录制的内容语义,自行判断分析并把文字自动分段。相比一般的录音笔,一片密密麻麻的文字,智能分段无疑要方便了太多。
、
智能区分发言人
▼ 在多人交谈时,还可以智能的实时区分发言人。
▼ 并且能自动过滤掉语气词、叹词和非人声噪音等。
为了验证这个功能到底如何,我做了一个小测试。
▼ 左侧的iPad Pro、中间的Studio Display、右侧的手机加上我自己,三台设备加我自己,一共是三个声音、五段对话模拟多人会议场景。
中间和右侧是声音1,左侧iPad Pro是声音2,我自己是声音3。
结果出来之后我吓了一跳,现在都这么智能的嘛?!
▼ 可以看到智能区分出了1、2、3三个声音,1和2的两段发言也正确识别了,并且都智能分段标了出来。
▼ 当然了,如果你想更极致一些的话,可以录入多人的声纹,这样转写的内容还可直接显示已录入声纹对应的昵称,整体对话内容更加清晰直观。
OCR识别
因为自带800万像素的摄像头,所以SR502是支持OCR识别转写的。
▼ 分别打印了一张表格、一张文字,来测试一下效果如何。
▼ 拍照自动识别后,文字很快就自动生成好了。
▼ 在电脑端读取出来看一下,没有一个错误,非常强大。
▼ 下载到电脑上,文件夹内是一张拍摄的图片和生成的文字TXT。
▼ 而给表格拍照后,可以看到机内已经自动生成了完整的表格图片。
如果说文字识别是科大讯飞基操的话,那表格识别又震惊了我一下。
▼ 直接生成了一个表格文件,且非常完美。仅通过一张照片就能识别并重新画出完整无误的表格,实在是太强了。
总结
最近一段时间用下来,我只能用「比强更强」来形容科大讯飞的SR502了,我觉得也算给行业树立一个2000元档的新标杆了。
在智能录音笔领域,科大讯飞的AI算法与优化,赋予了录音笔更强的产品力。
无论是在线/离线转写、实时翻译的准确率,还是智能编辑智能整理、OCR识别,综合来看表现都非常出色。
而基础的硬件设备,比如2+6的麦克风组合和清晰的人声拾音,反而变成了科大讯飞出色算法上的锦上添花了。
双十一期间,SR05仅需2000元左右即可到手,感兴趣的一定不要错过。
巴伐利亚南大王
校验提示文案
glb1031
校验提示文案
larphil
校验提示文案
qianseyue
校验提示文案
弗老大
校验提示文案
真真梦
校验提示文案
流浪的小菊花
校验提示文案
识食务者
校验提示文案
Geek研究僧
校验提示文案
沈少Neo
校验提示文案
tang251
校验提示文案
吖棒棒糖
校验提示文案
校清新Ron
校验提示文案
jerryneu
校验提示文案
有舍就得
校验提示文案
风风1234
校验提示文案
互相迁就
校验提示文案
值友9992438395
校验提示文案
游过人间几许
校验提示文案
鱼子酱先生
校验提示文案
鱼子酱先生
校验提示文案
游过人间几许
校验提示文案
值友9992438395
校验提示文案
互相迁就
校验提示文案
风风1234
校验提示文案
有舍就得
校验提示文案
jerryneu
校验提示文案
值友8829765358
校验提示文案
8160阿莲
校验提示文案
跫音丶
校验提示文案
ysysysys
校验提示文案
陈叔_
校验提示文案
值友9219382960
校验提示文案
raining1210
校验提示文案
zeckham
校验提示文案
Pran59
校验提示文案
孙小悦
校验提示文案
pack_huang
校验提示文案
手冲美少女
校验提示文案
忘记了回忆
校验提示文案