能提高工作效率,但识别率有待提高——捷宇 高拍仪 扫描仪 开箱简评
大家应该对全能扫描王这款OCR软件并不陌生,但说实话,有时候因为排版、字体等原因,识别率不是很高,导入到电脑后,还得做比较多的校对和修改,非常占用时间和精力。
高拍仪,大家应该也都在银行见过,用来扫描证件什么的,相对于手机APP,操作更加简单,有助于提高工作效率。这回618,对比了几款产品后,入手了这款捷宇高拍仪,至于为何选择这款,理由很简单,618当天京东自营中这款是最便宜的(499元)带1000万像素镜头的高拍仪,像素越高越清晰,理论上对文字的识别率也越高。用券后459入手。
先上一溜开箱:
包装为硬纸板盒子,大小和笔记本包装差不多,侧面功能简介可以看到,除了OCR文字识别外,还可以当做一个简易的实物投影展示台。
包装内容物也比较简单,除了高拍仪外,一根数据电源线,一份说明书保修卡驱动光盘安装螺丝,还有一个塑料文稿台。
机身本体,毫无设计感可言,完全就是一件工具,京东上还有一歀漂亮的圆柱形款式,不过同规格价格却高出不少
镜头翻开后锁定为90°角,打开关闭时会有咔得一声,还算比较有质感
翻开后除了一颗1000万像素的摄像头外,排列着由6排12颗LED组成的补光灯
而侧面不起眼的一个齿状调节滚轮,则是用来调节补光灯亮度,除此之外,机身没有任何开关或可供操作的按键旋钮。
机身主体后方是用来连接电脑的接口
底部中间则是用来与文稿台相固定的螺丝孔
装好后的样子,连接线连接到电脑即可,不过因为电脑没有光驱,问客服要了一个驱动下载链接,安装好后,高拍仪的补光灯和**的电源指示灯便点亮,原本以为既然没有电源键,那补光灯的开关一定是通过侧边的齿状滚轮关闭,然而将其调节到最小发现补光灯仍然会发出微弱的光,并不能完全关闭,如下图:
也就是说将这台高拍仪连接电脑后,不管机器工作与否,只要电脑开机,补光灯就会跟着亮起并且无法通过按键关闭。
这张为将补光灯开到最大亮度后,照射出的纸张效果,相机设置在 F2.8 IOS400 快门1/40,对比下图Led台灯调到6500K色温的照射效果,相同光圈感光度下快门为1/500,可见高拍仪的补光灯不仅色温偏冷而且亮度也不高,除此之外,目测还有明显的频闪,所以只可用来当做机器工作时的补光,在黑暗环境下,建议室内开灯操作,不宜将其当做主光源用来长时间查看文案
功能简介:
软件界面设计也一如机身升级一样,追求的是实用和高效,镜头视框右侧是操作按键,顶部则是设置和调节选项
图片参数设置,除了调节拍摄图片各参数外,还可以设置条码/二维码识别、添加水印等功能。
视频参数设置,可对拍摄视频做各种图像质量、大小参数调整,如下三图,拍摄视频帧率最高为20 FPS。
图片格式则是设置图片输出格式、OCR识别输出格式,比如设置为WORD格式,那识别后将图片中的文字生成WORD文档并自动使用WORD软件打开。支持转化为WORD/EXCEL/TXT三种格式。
制作PDF则可以将图片自动生成PDF并排序、并可设置摄像头像素。
操作及识别效果:
将文档平整、整齐放置文案台,即可对其进行拍照、录像、文字识别等操作
先使用摄像头在默认模式下拍一张地图,看下摄像头素质,(拍照时有加入台灯光源,下同)
可以看到,照片左侧还是有一部分机身的阴影投落在地图上,放大150%,由于印刷质量和字体太小,照片文字比较模糊
文字拍摄效果:
默认设置下拍摄书本封面效果
拍摄499 kindle上设置为小2号的文字效果,将屏幕摆到正中间的话会有反光现象
从以上四组样张可以看到,对于正常大小的文字来说,无论是纸张上还是电纸书上的,文字效果还是清晰可辨的,但是像地图上的极细小文字,就有些力不从心了。
使用文字识别对封面进行扫描识别多次,并以wodr打开:
第一次识别,封面以图片呈现,白色护封上的文字则被识别生成为可编辑的文字,并有部分文字被排到第二页上。
第二次识别,护封上的红色文字和底部“他将骗局写到了极致。——直木奖评语”以图片呈现,并出现与黑色可编辑文字叠加现象,部分黑色文字依然被排到第二页上
第三次识别,将书本换了个角度放置,扫描结果是封面图片不见了,剩下的护封全以文字呈现,并依然出现第二页
通过以上三次对封面上的文字进行识别,可以发现这款捷宇高拍仪对这种被扫描对象上带图形、纹理,多种大小、字体、颜色的文字识别处理不是非常完美,并且每次导出文件都不相同,尽管有概率可以准确识别并生成文字,但操作和后期编辑还是非常麻烦。
使用扫描功能对kindle上的文字进行扫描识别(小2号字体)
第一次识别结果:
上方可见识别结果左侧将kindle的保护壳也当做扫描对象以图片的方式展现,右侧屏幕内内容则是可编辑文字,但由于499版本kindle的屏幕分辨率不高,设置字体也较小,识别效果不太理想,出现很多需要修改的错误。
第二次识别结果:
第二次识别将保护壳去除,仅识别屏幕中的文字,但识别率依然不理想,出现很多乱码和错误。
将kindle文字设置为小3号,再次识别:
此次识别结果仅为文字,这里直接放大,可以看到识别率稍有提高,但还是存在很多识别错误的英文字母和文字
继续将kindle字体再次加大为从小至大第4号,这基本已比大多杂志书籍上的常见字体大小还要大一号
然而如上两图,识别结果依然有保护壳图片,且被识别文字还是有出现少量英文字母和错误。
这里我就想,是不是因为没有将拍摄幅面大小设置到仅为屏幕内,屏幕以外的图像信息影响到了屏幕内文字的识别呢?于是将将拍摄幅面设置为屏幕大小,
选框在保护套上魔性地跳起了舞 ,尝试多次皆是如此,遂使用自定义选边
识别结果:
除了两个“里”被识别成了“M”和一个在文本中另添加的字体不一的生僻字“犭更”(可能字库中就没有这个字)被识别成了“%”,其它文字也有不少错误。识别结果不尽理想。
如果在工作时每次识别后都要玩一次大家来找茬,无疑给工作效率上会带来很大的影响,也容易出现人工校对后的错误纰漏。不过我觉得以上这些识别错误,和499 kindle本身的屏幕分辨率还有偏灰暗的屏幕颜色有很大关系,普通纸质书籍或杂志上的文字要比它清晰很多,纸张也要白皙,对比度更高。于是就换了本纸质读者杂志再次实验。
因为纸质更加白皙,调整好曝光度后,直接选取文字开始识别,图中的文字大小等同kindle上3号字体大小。拍摄选框内的文字内容图片:
只看了两段,就发现有不少错误,接连识别多次,均出现不少文字错误、缺失、乱码。
怀疑是杂志文字密度过大导致识别率降低,不甘心,再次用嫌疑人x的献身中的一页文字进行识别,字体大小与杂志相同,不过排版要疏很多,识别过程中用手压平页面,防止纸张出现变形造成识别率下降:
选框内照片
识别结果:
经过这几次尝试,可以看到,这款扫描仪对于大段文字的识别转换的准确率,还不是很高,每次识别都会出现多多少少的错误,在全局识别时,有概率会将非白底黑字的扫描对象、大小字体颜色不一的文字,转化为不可编辑的图片。
文字识别错误概率与扫描对象中的文字字体、大小、排版密度有很大关系。小号文字,排版密度大,识别率会有所下降。
不过比起手机端的很多ocr文字识别app,作为将图片文字转换为可编辑文字的工具,识别率还是有一定的提升的,而且可以直接将识别结果用多种文档格式导入到电脑中并打开,提高了工作效率。但还是需费一定时间去检查校正。当然,除了文字识别之外,一些日常如证件、文件拍摄并以图片格式转出或制作成PDF,对于这款捷宇高拍仪的1000万像素摄像头,是绰绰有余的。
简单说下这款捷宇高拍仪的优缺点:
优点:1,1000万中相对实惠的价格 2,比较清晰的拍照效果 3,功能比较丰富,文字识别后可使用多重格式导出,可直接制作PDF
缺点:1,补光灯偏冷偏暗,有频闪 2,机身没有电源开关,连接电脑后在电脑开机时补光灯只能常亮 3,文字识别率有待提高。
被迫换昵称
校验提示文案
买买大乐透
校验提示文案
让三尺
校验提示文案
岳麓山炮王
校验提示文案
四四cs
校验提示文案
盗帽暗燃
校验提示文案
买买大乐透
校验提示文案
盗帽暗燃
校验提示文案
四四cs
校验提示文案
被迫换昵称
校验提示文案
让三尺
校验提示文案
岳麓山炮王
校验提示文案