识别图像上字符的起始和结束XY向量

Identifying start and end XY vector of characters on image

本文关键字:结束 XY 向量 图像 字符 识别      更新时间:2023-10-16

我正在尝试回忆一些关于字母的信息,以便用神经网络开始某种OCR。我还没有真正把所有的东西连接在一起,然而,我现在遇到的问题是如何区分字符和分离它们。比如http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJ(没有什么花哨的,只是普通字体)

我认为更好的方法是做大量的for循环来获得顶部,最低的x和y,考虑到每个字符和数字都有黑色像素彼此连接(尽管I是一个例外)。

有什么库或算法可以帮助我解决这个问题吗?我正在使用img进行图像处理。

这个真的很难吗?

听起来你正在寻找一个连接的组件标签器。其思想是扫描图像中相互连接的像素组,并返回一个对象集合(通常称为"blob"),其中每个对象包含该blob中的像素列表。

我不建议你自己写。OpenCV有一个内置的,工作得很好,基于

F.Chang、C.-J.Chen andC.-J。Lu,"基于轮廓跟踪技术的线性时间分量标记算法",计算机视觉与图像理解,vol. 93, no. 5。2,第206-220页,2004.

很可能有一个更好的解决方案,专门用于查找字母。

您检查过OpenCV项目了吗?这里有一个使用它做数字OCR的教程