OCR选择与使用 扫描仪故障解决实例

时间:2021-05-24

下面首先是一个用户的EMAIL来信:
  
  技术员你好:
  我刚买了一台Microtek 4180,不过它扫描图像所占的内存太大(300DPI所扫的文件有500K)有没有办法使所占的内存少一点。还有的是当我用扫描仪面版的OCR键时扫出来的文字不是很好(假如用有英文和中文混合的文章就会只翻译到中文或英文的其中之一,我想问一下,有没有办法同时显出来)还有的是尚书七号是不是最新的OCR,有没有专业版的?我觉的它的认字能差了一点。
  致礼 客户
  我们回答如下:
  一、扫描结果的存盘,彩色和灰度方式,可以采用JPG格式存盘,300DPI,A4灰度或者彩色,确实在500KB左右,如果您这里还需要更小容量的文件存盘,可以采用如下措施:
  1 我们现在的驱动SW5提供带JPG压缩功能的TIF格式扫描,就是在存盘的时候,有选项可以选择,如下:

  出现如下窗口,请选择JPEG的压缩格式,其值根据情况,可以调小到20左右。

  然后选择保存,扫描仪开始扫描,其文件大小将往下减少。注意,当您扫描图片的时候,建议恢复到不压缩状态,这样的文件质量比较好。
  如果做文字扫描,还需要文件容量更小,可以考虑将驱动的色彩管理部分取消掉,这样扫描的结果文件容量更小。到“高级控制面板”的主窗口,其“属性”菜单下有一个“色彩匹配设置”, 将其选中部分全部取消,就可以得到更小的扫描文件。

  二、扫描仪现在提供的面板识别中文OCR功能,其版本与功能是低于我们随机赠送的尚书七号OCR的。
  对于你提出尚书OCR识别率不高的问题,我们认为请您注意以下几点:
  1. 扫描文档的时候,请选择300DPI的分辨率。
  2. 采用彩色RGB或者灰度方式进行工作。
  3. 扫描完的图象,请在尚书7号内,“编辑”菜单下,进行“自动倾斜校正”以将图象中的文字,保持水平状态。
  4. 然后,在“识别”选项中,选择“自动版面分析”,注意,对于表格部分,自动版面分析的结果其栏目的属性往往是“图象”,请将其属性改为“表格”,然后就可以开始“识别”了。识别结果可以保存为文本、WORD的RTF等格式。

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章