Tesseract OCR的置信值
Confidence value of Tesseract OCR
我有一些有关Tesseract OCR置信值的问题,可以通过在C API中调用AllWordConfidences()
函数来获得。
-
什么是置信值(由Tesseract API返回(和 Tesseract如何计算该值?(例如,基于什么因素(?
-
我是否有可能更改Tesseract的准确性水平?
有人可以帮我解决这些问题吗?谢谢。
我在其他OCR软件(特别是在ANPR软件中(中使用了类似的指标。如果我没记错的话,总体上有两个置信因素。一个是0-> 100%的置信因子,另一个是0-> x值,用作各种级联置信因子的聚合。
该值是任意的,因此我建议使用0-> 100%的值。另请注意,每个字符都应具有置信因子。
这些指标是通过评估清晰的轮廓线/边缘,字符中检测到的形状与预期形状的近距离以及决定选择一个字符与另一个角色的距离的近距离计算得出的。即OCR在" P"answers" B"之间选择比" Q"answers" O"更轻松。
"改善"这些指标的唯一方法是训练检测器!因此,准备拥有大量有效数据。您还需要使用Tesseract培训工具耐心 - 我发现它们是75%的噩梦。
祝你好运!
相关文章:
- 与 tesseract::TessBaseApi() 相关的 Tesseract-OCR 出错(预期的类型说明符)
- Tesseract OCR的置信值
- Build Tesseract OCR with Qt 5.8
- OCR用于使用Tesseract用于iOS的方程
- 致命错误:strtok_r.h:没有这样的文件或目录(在mingw中编译tesseract-ocr-3.01时)
- 重置 Tesseract-OCR 变量
- Tesseract OCR QT errors
- python tesseract在没有OCR的情况下获得行数
- Android Tesseract OCR with NDK (c++)
- Profiling tesseract-ocr with GNU gprof
- 如何将Tesseract OCR库集成到C++程序中
- Tesseract OCR的高级使用
- OpenCV 3.1 + tesseract 3.04的OCR(文本识别)结果根据识别的顺序而变化
- 在tesseract C++API中禁用字典辅助OCR
- 如何在CMakeLists.txt中集成tesseract-ocr库
- 错误LNK2019无法解析外部符号Tesseract OCR c++ Using VS 2015
- Tesseract-ocr, baseapi.h致命错误:platform.h文件未找到
- Tesseract OCR无法加载语言
- 如何在Windows 10上使用Visual Studio 2015 x64配置和构建Tesseract OCR c++
- 如何使用tesseract在文档中OCR多列