研究中心中文船名智能检测与识别论文被智能交通领域顶级期刊IEEE TITS录用

发布者：叶李智子发布时间：2022-08-02浏览次数：817

(Dekang Liu, Jiuwen Cao*, Tianlei Wang, Huahua Wu, Jianzhong Wang, Jiangmin Tian and Fangyong Xu, SLPR: A Deep Learning based Chinese Ship License Plate Recognition Framework, IEEE Transactions on Intelligent Transportation Systems, 2022, paper Accepted)

用于船舶身份识别的船名自动识别（Ship License Plate Recognition, SLPR）对水路航运管理具有重要意义。但过去很少有人关注该领域。船名检测、识别，本质上是一种文字识别。文字识别领域一直以来都是模式识别和计算机视觉的主要研究方向。广泛应用于文档电子化、自然场景理解以及网络图像视频识别。应用上，车牌识别、交通标志牌识别、街景商店名牌识别等的研究深入影响了智能交通系统、自动驾驶等的建设进程。船名检测、识别，可以理解为文字识别算法在内河航运场景上的一种应用型研究或称之为特定场景下的文字识别算法研究。基于此研究路线，研究中心与浙江嘉兴广电集团合作，采集、整理、标注，创建了自然场景船名识别数据集。开发了一种由基于四边形的船名文本行检测算法（QSLPD）和基于透视变换较正的文字识别模型（RTRNet）所组成的级联中文船名检测、识别框架。相关论文“SLPR: A Deep Learning based Chinese Ship License Plate Recognition Framework”近期被智能交通领域TOP期刊IEEE Transactions on Intelligent Transportation Systems录用。

所提QSLPD算法能有效处理1) 船名目标的位置、尺度、长宽比、视角、字体、字号、字间距等方面的显著多变性；2) 小尺度船名文本行近邻粘连问题。同时，为改善传统船名检测算法轴对齐矩形框位置表征形式，QSLPD由于采用更密切贴合船名文本行真实边界的四边形边界框，由此极大程度上减少了后续文字识别模型输出数据中的背景噪声，为船舶身份识别结果正确提供保障。具体地，在QSLPD算法中，船名文字检测基于被所提出的变感受野特征增强策略（可变形卷积与膨胀卷积金字塔的混合使用）以及三个任务特定输出头改进的金字塔特征融合架构实现。探索了一种结合Dice系数与类平衡交叉熵的混合损失，由此改进基线模型对小尺度船名文本行紧邻粘连问题的适应能力。在RTRNet中，首先基于QSLPD预测的文本行顶点信息以透视变换方程同时实现感兴趣区域提取和不规则文本行较正，而后以常用的文字识别模型CRNN算法被采用作为船名文字识别器输出船名文本内容。在收集的船名检测、识别数据集上进行了广泛的消融、对比实验证明了所提级联SLPR框架的可靠性，证明了所提QSLPD算法在船名文字检测任务上的先进性。同时，结合船名识别任务中预测边界框需更紧密贴合文本行真实边界的先验需求，引入IoU和TIoU两项评价指标用于模型性能验证。所提QSLPD方法在IoU和TIoU度量下分别可以达到87.78%和76.59%的F-Measure，级联模型最高可取得67.34%的船名文字实例识别准确率。

论文第一作者为2020级硕士研究生刘德康（硕博连读），通讯作者为指导老师曹九稳教授，研究获得了国家自然科学基金、浙江省自然科学基金、国家重点研发、浙江省高校基本科研业务专项、之江实验室开放课题等项目资助。

中文船名级联检测、识别框架整体架构图：

QSLPD船名文字检测算法结构图：

QSLPD算法改进消融及与对比算法鲁棒性分析图：

QSLPD及对比算法检测结果与级联框架文字识别准确率：

QSLPD及对比算法船名文字检测结果展示：