基本信息

论文名称：Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spotting

发行年份：2020

会议名称：ECCV (European Conference on Computer Vision)

应用场景：场景文本识别

主要内容：与Mask TextSpotter v2相比，v3采用了SPN(Segmentation Proposal Network, 分割候选网络)替代Region Proposal Network (RPN, 区域生成网络)，来生成候选多边形，提高了文本区域的检测效果。在此基础上计算ROI特征，沿用v2使用Fast R-CNN算法来识别文本。

优势：

该模型是端到端(End-to-End)的模型；
识别有旋转、纵横比较大、任意形状的场景文本效果较好；
系列论文引用次数可观。v3：64，v1&v2：446。