非英语语言中的文本识别
Text recognition in non-english language
我已经用印地语实现了一个文本检测算法,它运行得很好,并对文本区域进行了本地化。现在我正在寻找将文本区域转换为数字格式,可以由谷歌翻译API使用。关于如何将其转换为数字格式,有什么帮助吗?(我研究了SVM、ANN等)
我会研究OCR。
Tesseract OCR引擎(开源)拥有包括印地语在内的多种语言的语言数据,因此这可能是一个很好的起点。它也可以集成到OpenCV中。
如果你只想使用OpenCV,那么其中一种机器学习方法(KNN、SVM)可能是最好的,你需要自己训练它来识别字符。
很少的链接:
https://code.google.com/p/tesseract-ocr/(Tesseract)
https://opencv-code.com/tutorials/how-to-read-the-digits-from-a-scratchcard/(OpenCV+Tesseract)
http://blog.damiles.com/2008/11/basic-ocr-in-opencv/(仅限OpenCV-KNN)
https://opencv-code.com/tutorials/how-to-integrate-tesseract-ocr-and-opencv/(集成Tesseract和OpenCV)
相关文章:
- 文本文件中的单词链表
- 从命令行c++发送文本文件名
- 在C++程序中输入的文本文件将不起作用,除非文本被复制和粘贴
- 2D数组来自文本输入,中间有空格
- 提升 ASIO 无法识别计时器对象
- 如何将内容数组写入文本文件?
- 从udp接收帧对于人脸识别来说太慢
- 无法通过空白将文本文件行分隔为矢量
- 我正在使用嵌套的while循环来解析具有多行的文本文件,但由于某种原因,它只通过第一行,我不知道为什么
- C++将文本文件中的数据读取到结构数组中
- C++宏:如何在可识别的字符串文本之前捕获所有内容
- 在我的类中无法识别用户定义的文本运算符
- 为什么此代码只能识别文本文件中的第一行?输入任何大于 1 的数字都会返回"Atomic Number Not Found"
- 非英语语言中的文本识别
- 我需要使用opencvsharp识别图像中的文本
- 带有PHP的OpenCV-识别文本
- OpenCV 3.1 + tesseract 3.04的OCR(文本识别)结果根据识别的顺序而变化
- 在c++中读文件函数如何识别文本文件的结束
- libstdc++ 无法识别标准库文本
- 有没有办法在阅读文本时使用右移来识别'n'