OCR论文阅读笔记之Mask TextSpotter v3
Mask TextSpotter v3论文地址:https://arxiv.org/abs/2007.09482
GitHub仓库:https://github.com/MhLiao/MaskTextSpotterV3
了解更多Mask TextSpotter:
v1论文地址:https://arxiv.org/abs/1807.02242
v2论文地址:https://arxiv.org/abs/1908.08207
基本信息
论文名称:Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spotting
发行年份:2020
会议名称:ECCV (European Conference on Computer Vision)
应用场景:场景文本识别
主要内容:与Mask TextSpotter v2相比,v3采用了SPN(Segmentation Proposal Network, 分割候选网络)替代Region Proposal Network (RPN, 区域生成网络),来生成候选多边形,提高了文本区域的检测效果。在此基础上计算ROI特征,沿用v2使用Fast R-CNN算法来识别文本。
优势:
- 该模型是端到端(End-to-End)的模型;
- 识别有旋转、纵横比较大、任意形状的场景文本效果较好;
- 系列论文引用次数可观。v3:64,v1&v2:446。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 RandIdea!