北京科技大学计算机与通信工程学院-殷绪成团队荣获2015年国际文档分析与识别大会竞赛四项冠军

学院新闻

殷绪成团队荣获2015年国际文档分析与识别大会竞赛四项冠军

来源：日期：2015-09-06 点击量：

8月26日，第十三届国际文档分析与识别大会（International Conference on Document Analysis and Recognition, ICDAR 2015）在法国南锡市闭幕，国际文档分析与识别技术竞赛结果揭晓，我院殷绪成教授团队（包括杨春、裴唯一、田澍、左泽雨、郑宇航、候杰波、高启、邢纵横等成员），获得本届大赛最受关注的“鲁棒阅读竞赛”（Robust Reading Competition）中“自然场景文本端到端识别”、“网络图片文本端到端识别”、“视频文本检测提取”等四项冠军。本届国际文档分析与识别技术竞赛包括十一个竞赛单元，吸引了来自中国、美国、德国、法国、英国、日本、韩国、印度等几十个国家一百多支模式识别、文档分析与识别、计算机视觉等领域高水平参赛队伍，殷绪成教授团队是本届赛事夺冠的唯一中国团队。

2015年国际文档分析与识别大会“鲁棒阅读竞赛”，以当前及将来的产业应用和技术发展为导向，重点关注端到端文本识别（End-to-End Text Recognition）和视频文本智能提取等技术的评测。在本次竞赛中，近30支竞赛队伍由来自中国、美国、法国、韩国、印度等模式识别、文档分析与识别、计算机视觉领域顶级研究机构组成；国内则包括了北京科技大学、中国科学院自动化研究所、南京大学、华中科技大学等数家著名科研单位。经过激烈的竞争，我院殷绪成教授团队荣获了“自然场景文本端到端识别（通用类）”（Focused End-to-End Text Recognition (Generic)）、“网络图片文本端到端识别（通用类）”（Born-Digital End-to-End Text Recognition (Generic)）、“网络图片文本端到端识别（限制类）”（Born-Digital End-to-End Text Recognition (Weak)）、“视频文本检测提取”（Video Text Detection）等四项冠军。特别的，在“自然场景文本端到端识别（通用类）”、“网络图片文本端到端识别（通用类）”和“视频文本检测提取”等三项竞赛任务中，殷绪成教授团队优势明显，其评测成绩比竞争团队分别高出了12.12%、35.03%和16.53%。

自然场景/网络图片/复杂视频文本识别是利用人工智能技术，使计算机、智能手机等能够像人一样认识自然界和互联网图片视频中普遍存在的文字，在数字移动服务、信息检索、数字与智慧城市、网络内容监控与社会公共安全、大数据等方向和行业中具有重要的应用价值。近年来，该领域一直都是国内外学术界和工业界关注的重点方向；目前，世界上几乎所有的互联网和IT巨头都进行相关的技术研究，包括了阿里巴巴、腾讯、百度、华为、中兴、科大讯飞、汉王、Google、Microsoft、Amazon、Samsung、Adobe等。我院殷绪成教授团队在自然场景/网络图片/复杂视频文本识别技术领域进行了长期的探索与研究，取得了世界领先的创新技术和应用成果，已经与Samsung、科大讯飞等多家国内外著名企业进行了卓有成效的技术研究和创新应用合作。

国际文档分析与识别大会“鲁棒阅读竞赛”从2003年开始设立以来，一直都是评价和检验自然场景/网络图片/复杂视频文本自动提取与智能识别最新技术研究进展的最重要国际赛事及标准，在国际模式识别、文档分析与识别等领域具有重要的影响力。上一次（2013年）的国际文档分析与识别大会“鲁棒阅读竞赛”，以图像文本检测/提取/识别等基础技术为重点，来自中国、美国、俄罗斯、韩国、新加坡等国际知名研究团队组成的20余支竞赛队伍参加了比赛。殷绪成教授团队获得了“自然场景文本检测”、“网络图片文本检测”、“网络图片文本提取”等三项冠军，引起了国内外同行的深度关注，科技日报、中国科学报、新华网、人民网等媒体对该创新技术和竞赛获奖进行了广泛报道。

国际文档分析与识别大会（ICDAR）是国际模式识别协会（International Association of Pattern Recognition, IAPR）举办的文档分析与识别、模式识别领域世界上最重要的国际学术会议之一，每两年举办一次，从1991年第一届开始，到今年已成功举办十三届。