立即下载

扫描件识别的步骤是什么?ocr识别不准的原因有哪些?

2023-02-01

1523

      在工作中,我们经常会识别很多的扫描件,有的小伙伴在识别的时候发现结果不准确,今天小编就给大家介绍一下扫描件识别的步骤是什么?ocr识别不准的原因有哪些?大家可以了解一下。
 

      扫描件识别的步骤是什么?


      1、如果想对扫描件图片进行识别,我们就需要借助相关OCR文字识别工具来实现。
      2、通过百度搜索下载福昕全能王并安装运行,从打开的程序主界面中,通过视图查看以选择相应的图片文件进入扫描过程。
      3、当成功打开相应 的图片文件后,我们就可以在工具栏界面中,点击‘页面解析“按钮,此时就自动针对文字区域进行识别。
      4、对于自动识别后的文字区域,我们还可以对其进行更近一步的编辑操作。右击对应的文字区域选择“删除”项即可删除区域。
      5、同时我们还可以利用鼠标针对想要进行识别的区域进行框选,之后点击“识别”按钮,即可针对相关文字区域进行识别。
      6、针对识别后的文字内容,我们还可以更近一步的进行编辑操作。在此可以直接对相关文字区域内容进行编辑。也可以将文字内容导出到Word文档中进行操作。
扫描件识别
 

      ocr识别不准的原因有哪些?


      1:是否是常规字体,手写体和特殊艺术字体,OCR很难有准确的识别率。
      2:是否有大量特殊符号,行业特殊符号OCR也无法保证识别准确率。
      3:注意扫描文件或者图片的背景与文字前景的对比度,对比度是影响识别率和准确率的核心参数。可用工具去除背景中的杂色,杂点,噪点。
      4:扫描文件或者图片的亮度,调整到合适的亮度,可以有效提高识别率和准确率。
      5:设置合适的分辨率。
      6:如果原图像或者扫描件歪斜,请校正。
      7:选择正确的识别区域。
      8:在扫描文档时,设置合适的扫描参数,或者在拍摄时,摆正文字区域,切忌歪斜。
福昕全能王
 

      ocr文字识别是什么?


      OCR是英文optical character recognition的缩写,意思是:文字识别
      OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
      OCR文字识别很重要的一个技术参数,就是识别率。就拿身份证识别来举例子,就会涉及到两个问题。身份证识别出来的最终目的是要有格式,供直接录入系统,姓名项、地址项、身份证号项都黏在一起,就没办法使用了;
      目前身份证识别率能达到98%以上,如果拿通用OCR文字识别来识别,识别率达不到如此高识别率,需要专门针对身份证进行校正优化。所以OCR文字识别根据特殊识别内容,形成了多个产品出来。
      以上就是小编给大家介绍的扫描件识别的步骤是什么?ocr识别不准的原因有哪些?大家可以了解一下,在识别的时候,一定要选择清晰的图片。

上一篇: 扫描件转换文字的步骤是什么?如何扫描图片?

下一篇: 手机拍照扫描成文字可以做到吗?手机拍照扫描成文字准确度高吗?

推荐阅读:

安装福昕扫描王