Mask TextSpotter v3论文地址:https://arxiv.org/abs/2007.09482
GitHub仓库:https://github.com/MhLiao/MaskTextSpotterV3

了解更多Mask TextSpotter:
v1论文地址:https://arxiv.org/abs/1807.02242
v2论文地址:https://arxiv.org/abs/1908.08207

基本信息

论文名称:Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spotting

发行年份:2020

会议名称:ECCV (European Conference on Computer Vision)

应用场景:场景文本识别

主要内容:与Mask TextSpotter v2相比,v3采用了SPN(Segmentation Proposal Network, 分割候选网络)替代Region Proposal Network (RPN, 区域生成网络),来生成候选多边形,提高了文本区域的检测效果。在此基础上计算ROI特征,沿用v2使用Fast R-CNN算法来识别文本。

优势:

  1. 该模型是端到端(End-to-End)的模型;
  2. 识别有旋转、纵横比较大、任意形状的场景文本效果较好;
  3. 系列论文引用次数可观。v3:64,v1&v2:446。