剧情奥秘致力为广大影视爱好者提供电视剧电影未完剧情揭秘
你好,请登录

OCR文字识别用的是什么算法?优质

310次浏览| 2022-06-29 19:01:22 更新
来源:互联网
2个回答
满意答案

一般OCR套路是这样的

1.先检测和提取Text region.

2.接着利用radon hough变换 等方法 进行文本校正。

3.通过投影直方图分割出单行的文本的图片。

最后是对单行的OCR

对单行的OCR主要由两种思想

第一种是需要分割字符的。

分割字符的方法也比较多,用的最多的是基于投影直方图极值点作为候选分割点并使用分类器+beam search 搜索最佳分割点。

搜索到分割点之后对于单个字符,传统的就是特征工程+分类器。 一般流程是 灰度 -> 二值化->矫正图像 -> 提取特征(方法多种多样例如pca lbp 等等) ->分类器(分类器大致有SVM ANN KNN等等 )。

现在的 CNN(卷积神经网络)可以很大程度上免去特征工程。

第二种是无需分割字符的

还有一点就是端到端(end to end)的识别,但前提是你需要大量的标注好的数据集。 这种方法可以不分割图像直接以连续的输出字符序列。

对于短长度的可以使用mutli-label classification 。比如像车牌,验证码。 这里我试过一个车牌的多标签分类。 车牌识别中的不分割字符的端到端(End-to-End)识别

google做街景门牌号识别就是用的这种方法。

文字识别近两年没有太大进展,有两种方法,一种是CNN+RNN+CTC,白翔老师团队的CRNN写的比较清楚,还有一种是CNN+RNN基于Attention的方法。

最近比较火的方向是文字检测和识别放到一个网络里joint train,沈春华老师团队2017 ICCV的Towards End-to-end Text Spotting with Convolutional Recurrent Neural Networks这篇文章已经在水平文字上把检测识别end to end做的比较work,感觉这可能是未来一两年的一个热点。

收到310个赞
最新文章
OCR文字识别用的是什么算法?
OCR文字识别用的是什么算法?
追剧小科普06-29
王者荣耀小饭堂
王者荣耀小饭堂
310
关于六次甲基四胺命名有哪些问题?
关于六次甲基四胺命名有哪些问题?
追剧小科普06-29
国民娱乐团
国民娱乐团
706
如何不怕尸体?
如何不怕尸体?
追剧小科普06-29
影视新体验
影视新体验
671
如何有效地教会父母使用手机?
如何有效地教会父母使用手机?
追剧小科普06-29
英雄老助手
英雄老助手
271
正在上课却停电了,刚放学学校就来电了是什么样的体验?
正在上课却停电了,刚放学学校就来电了是什么样的体验?
追剧小科普06-29
电竞大咖说
电竞大咖说
881
男人不回微信代表什么?
男人不回微信代表什么?
追剧小科普06-29
电竞BB机
电竞BB机
720
你游泳时印象最深的经历是什么?
你游泳时印象最深的经历是什么?
追剧小科普06-29
琼瑶君
琼瑶君
563
如果你的公婆不帮带孩子,也不给钱,你有意见吗?
如果你的公婆不帮带孩子,也不给钱,你有意见吗?
追剧小科普06-29
游戏新一
游戏新一
269
什么行业的可持续性发展更强?
什么行业的可持续性发展更强?
追剧小科普06-29
撸圈小跟班
撸圈小跟班
631
忍不住说说穿貂皮,你们怎么看?
忍不住说说穿貂皮,你们怎么看?
追剧小科普06-29
最爱酷电影
最爱酷电影
675

最爱酷电影

还没有个性签名哟
作者
关于我们 | 版权声明 | 免责声明 | 联系我们
免责声明:所有文字、图片、视频、音频等资料均来自互联网,不代表本站赞同其观点,内容仅代表作者本人意见,若因此产生任何纠纷作者本人负责,本站亦不为其版权负责! 如有问题,请联系我们
CopyRight©1999-2013 WWW.YI2.NET All Right Reserved 湘ICP备16020439号-1