OCR

ocr方法概述

文本识别方法概述

Posted by Nova on 2020-05-02

文字识别也是目前CV的主要研究方向之一。

文字识别一般分为两步。一检测定位文字在图像中的区域,然后提取区域的序列特征,在此基础上进行专门的字符识别。

但是随着CV发展,也出现很多端到端的End2End OCR。

文字检测(Text Detection)

GT与detection box. IoU 对识别结果的影响。

目前已经有很多文字检测方法,包括:
EAST/CTPN/SegLink/PixelLink/TextBoxes/TextBoxes++/TextSnake/MSR/…。 这里主要介绍CTPN 方法。

文字识别(Text Recognition)

识别水平文本行,一般用CRNN或Seq2Seq两种方法

  • CRNN:CNN+RNN+CTC
  • CNN+Seq2Seq+Attention

对于特定的弯曲文本行识别,早在CVPR2016就已经有了相关paper:
Robust Scene Text Recognition with Automatic Rectification. CVPR2016.

文字识别方法整理