报告摘要:随着多媒体和网络技术的迅猛发展,海量的图像、视频、文本等多媒体数据快速增长,多源异构且相互关联,使得数据表征、信息检索、知识发现和语义推理面临跨模态、跨数据源等挑战。如何借鉴人脑的跨媒体特性,跨越视觉、听觉、语言等不同的感官信息认知外部世界,对于提高计算机的感知认知能力和智能水平至关重要。本报告将对“人工智能2.0”中跨媒体智能的任务和目标进行介绍,然后重点介绍我们的相关研究进展。
讲者简介:彭宇新,北京大学二级教授,博士生导师,中国人工智能产业创新联盟专家委员会主任委员,中国工程院“人工智能2.0”规划专家委员会专家,中国图象图形学学会理事兼副秘书长。主要研究方向是:跨媒体分析与推理、图像视频理解与检索、计算机视觉。2006年入选教育部新世纪优秀人才支持计划和北京市科技新星计划,2016年获北京市科学技术奖一等奖(排名第一)。主持了863、国家自然科学基金等20多个项目,发表论文100多篇,包括IEEE Trans和CCF A类论文50多篇。7次参加由美国国家标准技术局NIST举办的国际评测TRECVID视频样例搜索比赛,均获第一名。主持研发的多模态互联网内容分析与识别系统已经应用于公安部、工信部、国家广播电视总局等单位。IJCAI 2015、AAAI 2016/2019、ICIP 2017、ICPR 2018、ICME 2019等领域主席或高级程序委员。