Tessact OCR是否使用神经网络作为默认的训练机制
Does Tessaract OCR uses neural networks as their default training mechanism
我需要知道的是,Tessact OCR是使用神经网络作为默认的训练机制,还是我们必须明确编程才能使用神经网络?。
如果我对这个"训练"的概念想错了,我很抱歉。但我需要知道的是,Tessact是否已经使用了NN,或者如果没有,我如何使用带有Tessact OCR的NN来提高识别精度?。
如果有人能给我推荐一些好的资源/推荐/尝试和开始的方式,那也将是一个很大的帮助。
我目前所知道的基本机器学习监督训练概念,以及在Tessact OCR中执行基本图像OCR操作。
Tessact默认使用自适应分类器。请阅读以下内容:
https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf
似乎有一个名为"立方体模式"的选项,它将切换到使用NN作为学习系统,而不是自适应分类器(https://code.google.com/p/tesseract-ocr-extradocs/wiki/Cube)。有关自适应分类器的更多信息:
http://www.cs.indiana.edu/~rawlins/website/adaptivity/information-helper.html
此外,与之密切相关的还有一个学习分类器系统:
http://en.wikipedia.org/wiki/Learning_classifier_system
此外,您对"培训"的术语非常接近。训练是指你如何教模式识别系统或学习系统对某些输入集应该做出什么反应。然后,当遇到未知数据时,它使用相似性来对新数据进行分类。在我看来,机器学习是现存最酷的领域之一(可能有偏见,但不管怎样!)继续学习!你是元学习者:学习如何教机器学习!酷东西!
是的,从tesseract 4.0开始,它提供了一个新的基于lstm的ocr引擎:https://tesseract-ocr.github.io/tessdoc/NeuralNetsInTesseract4.00
- 如何创建一个CMake变量,除非显式重写,否则使用默认值
- 如何使用默认参数等选择模板专业化
- 具有默认模板参数的多态类的模板推导失败
- 为什么在没有显式默认构造函数的情况下,将另一个结构封装在联合中作为成员的结构不能编译
- 当函数模板参数是具有默认参数的类模板时,函数模板参数的推导如何执行
- 初始化具有非默认构造函数的std::数组项的更好方法
- 何时提供默认参数作为模板参数
- 是默认情况下分配给char数组常量的值
- 具有默认值的引用获取函数
- 具有默认模板类型的默认构造函数的类型推导
- 当给定默认值时,为什么此模板参数推导失败
- 修改 VS Code 中的默认C++代码段
- 声明默认的模板化函数
- 将const引用参数初始化为默认参数会导致悬空引用吗
- 如何使用非默认构造函数实例化模板化类
- 如何修复带有 clang 的参数'args'缺少默认参数的问题?
- 从具有默认值的部分指定模板类继承时发生SWIG错误,具有不带默认值的正向声明
- 为什么大多数 pair 实现默认不使用压缩(空基优化)?
- Tessact OCR是否使用神经网络作为默认的训练机制
- 为什么 C++ 中没有默认的多态克隆运算符机制?