北京科技大学计算机与通信工程学院-殷绪成

当前位置：首页>师资队伍

教师详情

个人信息

殷绪成

Yin XuCheng

系      所：

|计算机科学与技术系|

职      称：

教授博士生导师

职      务：

院长

办公地点：

机电信息楼1002

办公电话：

010-62332873

电子邮箱：

xuchengyin@ustb.edu.cn

本科课程：

离散数学人工智能与互联网大数据技术前沿研讨

研究生课程：

机器学习人工智能前沿技术

科研方向：

模式识别与文字识别计算机视觉人工智能芯片工业智能与工业软件

学术与社会兼职：

中国图象图形学学会文档图像分析与识别专委会副主任/秘书长中国自动化学会模式识别与机器智能专委会委员中国人工智能学会模式识别专委会委员中国计算机学会计算机视觉专委会委员
简   历

殷绪成，教授、博导，模式识别与人工智能专家，国家杰出青年科学基金项目获得者、科技创新2030——“新一代人工智能”重大项目首席科学家，北京科技大学计算机与通信工程学院院长、模式识别与人工智能技术创新实验室主任，中国图象图形学学会文档图像分析与识别专委会副主任/秘书长、中国自动化学会模式识别与机器智能专委会委员、中国计算机学会计算机视觉专委会委员、中国人工智能学会模式识别专委会委员。主要研究领域包括模式识别、文字识别、计算机视觉、人工智能芯片、工业智能与工业软件技术及应用，在中国计算机学会推荐国际期刊和会议上发表论文一百多篇，连续四届荣获国际文档分析与识别大会技术竞赛共15项冠军，获2019年度北京市科技进步一等奖（第一完成人）、2018年度教育部科技进步二等奖（第一完成人）、2005年度北京市科技进步一等奖（主要成员）。

1995.09 - 2002.06 北京科技大学计算机系    学士、硕士
2003.09 - 2006.07 中国科学院自动化研究所    博士
2006.08 - 2008.06 富士通研究开发中心信息技术部      研究员
2008.07 - 今，于北京科技大学计算机系从事教学和科研工作（副教授、教授）
2013.01 – 2014.01 Center for Intelligent Information Retrieval, School of Computer Science, University of Massachusetts Amherst, USA, Visiting Associate Professor
2014.07 – 2014.08 Computer Vision Lab, School of Computer Science, University of Massachusetts Amherst, USA, Visiting Professor
2016.07 – 2016.09 BioNLP Lab, Department of Quantitative Health Sciences, University of Massachusetts Medical School, USA, Visiting Professor
代表性论文

[J1] Xu-Cheng Yin (殷绪成)*, Xuwang Yin, Kaizhu Huang, and Hong-Wei Hao, “Robust text detection in natural scene images”, IEEE Trans. Pattern Analysis and Machine Intelligence (T-PAMI), vol. 36, no. 5, pp. 970-983, 2014. (2022 Impact Factor: 24.314)
[J2] Xu-Cheng Yin (殷绪成)*, Wei-Yi Pei, Jun Zhang, and Hong-Wei Hao, “Multi-orientation scene text detection with adaptive clustering”, IEEE Trans. Pattern Analysis and Machine Intelligence (T-PAMI), vol. 37, no. 9, pp. 1930-1937, 2015. (2022 Impact Factor: 24.314)
[J3] Shu Tian, Xu-Cheng Yin* (殷绪成), Ya Su, and Hong-Wei Hao, “A unified framework for tracking based text detection and recognition from web videos,” IEEE Trans. Pattern Analysis and Machine Intelligence (T-PAMI), vol. 40, no. 3, pp. 542-554, 2018. (2022 Impact Factor: 24.314)
[J4] Shi-Xue Zhang, Xiaobin Zhu, Lei Chen, Jie-Bo Hou, and Xu-Cheng Yin, “Arbitrary shape text detection via segmentation with probability maps,” IEEE Trans. Pattern Analysis and Machine Intelligence (T-PAMI), vol. 45, no. 3, pp. 2736-2750, 2023. (2022 Impact Factor: 24.314)
[J5] Xu-Cheng Yin (殷绪成)*, Ze-Yu Zuo, Shu Tian, and Cheng-Lin Liu, “Text detection, tracking and recognition in video: A comprehensive survey,” IEEE Trans. Image Processing (T-IP), vol. 25, no. 6, pp. 2752-2773, 2016. (2022 Impact Factor: 11.041) (2021年北京地区广受关注学术成果优秀论文/图像图形领域)
[J6] Chun Yang, Xu-Cheng Yin* (殷绪成), Wei-Yi Pei, Shu Tian, Ze-Yu Zuo, Chao Zhu and Junchi Yan, “Tracking based multi-orientation scene text detection: A unified framework with dynamic programming,” IEEE Trans. Image Processing (T-IP), vol. 26, no. 7, pp. 3235-3248, 2017. (2022 Impact Factor: 11.041)
[J7] Jie-Bo Hou, Xiaobin Zhu, Chang Liu, Kekai Sheng, Long-Huang Wu, Hongfa Wang, and Xu-Cheng Yin* (殷绪成), “HAM: Hidden anchor mechanism for scene text detection,” IEEE Trans. Image Processing (T-IP), vol. 29, pp. 7904-7916, 2020. (2022 Impact Factor: 11.041)
[J8] Song-Lu Chen, Chun Yang, Jia-Wei Ma, Feng Chen, and Xu-Cheng Yin* (殷绪成), “Simultaneous end-to-end vehicle and license plate detection with multi-branch attention neural network,” IEEE Trans. Intelligent Transportation Systems (T-ITS), vol. 21, no. 9, pp. 3686-3695, 2020. (2022 Impact Factor: 9.551) (2020年北京地区广受关注学术成果优秀论文/物联网领域)
[J9] Jie-Bo Hou, Xiaobin Zhu*, Chang Liu, Chun Yang, Long-Huang Wu, Hongfa Wang, and Xu-Cheng Yin* (殷绪成), “Detecting text in scene and traffic guide panels with attention anchor mechanism,” IEEE Trans. Intelligent Transportation Systems (T-ITS), vol. 22, no. 11, pp. 6890-6899, 2021. (2022 Impact Factor: 9.551)
[J10] Ye He, Chao Zhu*, and Xu-Cheng Yin* (殷绪成), “Occluded pedestrian detection via distribution-based mutual-supervised feature learning,” IEEE Trans. Intelligent Transportation Systems (T-ITS), vol. 23, no. 8, pp. 10514-10529, 2022. (2022 Impact Factor: 9.551)

[C1] Zanxia Jin, Mike Zheng Shou, Fang Zhou, Satoshi Tsutsui, Jingyan Jin, and Xu-Cheng Yin (殷绪成), “From token to word: OCR token evolution via contrastive learning and semantic matching for Text-VQA,” Proceedings of the 30th ACM International Conference on Multimedia (ACM Multimedia), 2022. (CCF A)
[C2] Hongyu Gao, Chao Zhu, Mengyin Liu, Weibo Gu, Hongfa Wang, Wei Liu, and Xu-Cheng Yin (殷绪成), “CAliC: Accurate and efficient image-text retrieval via contrastive alignment and visual contexts modeling,” Proceedings of the 30th ACM International Conference on Multimedia (ACM Multimedia), 2022. (CCF A)
[C3] Kangneng Zhou, Xiaobin Zhu, Daiheng Gao, Kai Lee, Xinjie Li, and Xu-Cheng Yin (殷绪成), “SD-GAN: Semantic decomposition for face image synthesis with discrete attribute,” Proceedings of the 30th ACM International Conference on Multimedia (ACM Multimedia), 2022. (CCF A)
[C4] Chang Liu, Chun Yang, and Xu-Cheng Yin* (殷绪成), “Open-set text recognition via character-context decoupling,” Proceedings of 2020 IEEE/CVF International Conference on Computer Vision and Pattern Recognition (CVPR), 2022. (CCF A)
[C5] Zhiyu Fang, Xiaobin Zhu*, Chun Yang, Zheng Han, Jingyan Qin, and Xu-Cheng Yin (殷绪成), “Learning aligned cross-model representation for generalized zero-shot classification,” Proceedings of 36th AAAI Conference on Artificial Intelligent (AAAI), 2022. (CCF A)
[C6] Shi-Xue Zhang, Xiaobin Zhu*, Chun Yang, Hongfa Wang, and Xu-Cheng Yin* (殷绪成), “Adaptive boundary proposal network for arbitrary shape text detection,” Proceedings of 2020 IEEE/CVF International Conference on Computer Vision (ICCV), 2021. (CCF A)
[C7] Mengyin Liu, Chao Zhu*, Jun Wang, and Xu-Cheng Yin* (殷绪成), “Adaptive pattern-parameter matching for robust pedestrian detection,” Proceedings of 35th AAAI Conference on Artificial Intelligent (AAAI), 2021. (CCF A)
[C8] Shi-Xue Zhang, Xiaobin Zhu, Jie-Bo Hou, Chang Liu, Chun Yang, Hongfa Wang, and Xu-Cheng Yin* (殷绪成), “Deep relational reasoning graph network for arbitrary shape text detection,” Proceedings of 2020 IEEE/CVF International Conference on Computer Vision and Pattern Recognition (CVPR), 2020. (CCF A)
[C9] Bowen Yang, Chun Yang, Qi Liu, and Xu-Cheng Yin* (殷绪成), “Joint rotation-invariance face detection and alignment with angle-sensitivity cascaded networks,” Proceedings of the 27th ACM International Conference on Multimedia (ACM Multimedia), 2019. (CCF A)
[C10] Bo-Wen Zhang, Xu-Cheng Yin* (殷绪成), Fang Zhou, and Jianlin Jin, “Building your own reading list anytime via embedding relevance, quality, timeliness and diversity,” Proceedings of the 36th International ACM SIGIR Conference on Research and Development in Information Retrieval (ACM SIGIR), 2017. (CCF A)
科研业绩

纵向项目：
(1)“钢铁智能制造过程中数据认知与生产决策技术及应用”（2023-2026，科技创新2030——新一代人工智能重大项目，负责人）
(2) “大规模网络图像的文本识别方法与关键技术研究”（2022-2026，国家杰出青年科学基金项目，负责人）
(3) “多语言场景文本检测与识别关键技术研究”（2021-2024，国家自然科学基金面上项目，负责人）
横向项目：
(1)“网络图片文字识别与广告视频内容理解研究”（2016~2021, 腾讯科技合作项目，负责人）
(2)“面向AI芯片的人工智能技术”（2018-2023，亿智电子合作项目，负责人）
(3)“教育行业复杂英文文档分析与识别技术”（2014~2016，科大讯飞合作项目，负责人）
获得奖励/专利

2019年度北京市科技进步一等奖（第一完成人），“网络图像视频大数据的智能识别关键技术及应用”；
2018年度教育部科技进步二等奖（第一完成人），“大规模网络图像的文本识别技术及应用”;
连续四届（2013/2015/2017/2019年）荣获国际文档分析与识别大会技术竞赛“场景文本检测”、“场景文本识别”、“网络图片文本检测”、“网络图片文本识别”等15项冠军；
连续四年（2015/2016/2017/2018年）荣获国际生物信息文本语义检索与问答技术挑战平台BioASQ Challenge多项第一名；
2005年度北京市科技进步一等奖（主要成员），“汉王OCR技术及应用”;
2006年度富士通研究开发中心优秀发明奖;
2006年富士通研究所社长奖，2007年富士通研究所社长奖。