报告人简介:http://3dimage.ee.tsinghua.edu.cn
马惠敏 清华大学电子工程系副教授,博士生导师,三维图像认知与仿真实验室负责人,中国图象图形学学会副理事长兼秘书长,北京市“三八红旗奖章”获得者。
从事三维图像认知交叉学科研究,将图像理解与认知心理结合,提出了三维图像认知新理论,建立了适应复杂环境的人工智能视觉导航新方法和新技术。作为负责人承担了国家自然科学基金、专项重点基金项目、国家重点研发计划子课题、国际国内企业合作项目20余项。近几年作为通讯作者发表论文70余篇,包括PAMI、TIP、TITS、PR等高水平SCI期刊和CVPR、ICCV、NIPS等机器视觉顶级国际会议论文二十余篇,并实现了从基础理论、核心技术到产业的全链条的突破性进展,获得吴文俊人工智能科学技术创新奖一等奖,教育部技术发明奖二等奖、日内瓦国际发明展银奖。
报告简介:
如何使以数据驱动的机器学习实现对不确定的复杂场景图像的准确认知迄今仍缺乏很好的理论支撑。本报告针对数据驱动的机器学习在不确定的复杂场景图像识别中的困难,引入认知心理学,提出了Thinking in 3D的思想,建模物体三维几何认知规律、挖掘图像客观属性。通过建立自顶向下的认知先验数学模型,创新性地将其引入基于自底向上的数据驱动的机器学习中,提出了多模态、多视角、多任务3D场景图像深度学习认知方法3DOP、Mono3D、MV3D,MOCF用于复杂驾驶场景中三维物体检测,发表在TPAMI、TITS、NIPS、CVPR上,在国际权威自动驾驶数据集KITTI上评测获得第一名。