OCR

ocr方法概述

文本识别方法概述

Posted by Nova on 2020-05-02

文字识别也是目前CV的主要研究方向之一。

文字识别一般分为两步。一检测定位文字在图像中的区域，然后提取区域的序列特征，在此基础上进行专门的字符识别。

但是随着CV发展，也出现很多端到端的End2End OCR。

文字检测（Text Detection）

GT与detection box. IoU 对识别结果的影响。

目前已经有很多文字检测方法，包括：
EAST/CTPN/SegLink/PixelLink/TextBoxes/TextBoxes++/TextSnake/MSR/…。这里主要介绍CTPN 方法。

文字识别（Text Recognition）

识别水平文本行，一般用CRNN或Seq2Seq两种方法

CRNN：CNN+RNN+CTC
CNN+Seq2Seq+Attention

对于特定的弯曲文本行识别，早在CVPR2016就已经有了相关paper：
Robust Scene Text Recognition with Automatic Rectification. CVPR2016.

文字识别方法整理