摘要:
比较多的学习任务与方法假设数据是独立同分布的或者基本上是独立同分布的,实际的数据与问题一般可能都是非独立同分布的。讲者就现有的算法与理论在实际中应用可能遇到的问题、非独立同分布性与表现形式、非独立同分布学习问题进行探讨,并结合数据科学、大数据分析以及企业数据分析应用中比较普遍的学习问题:表示学习、统计学习、度量学习、聚类、异常检测、推荐系统、行为分析、深度学习等提出一些思考并汇报一些初步结果等,供大家一起探讨与批评指正。
主讲人介绍:
操龙兵,中科院自动化所模式识别与智能系统博士、悉尼科技大学计算科学博士,悉尼科技大学工程与信息技术学院教授。主要研究兴趣包括非独立同分布学习(Non-IID Learning)、行为信息学(Behavior Informatics)、决策知识发现(Actionable Knowledge Discovery),以及数据挖掘、机器学习、人工智能与智能系统等领域中一些普遍关注的问题。在上述方向发表专著3部、论文300余篇。他比较早地在国际上推动数据科学与分析学的产、学、研工作,在2007年成立澳洲第一个数据科学与知识发现实验室;2011创立世界上第一个分析学(Analytics)研究硕士学位与博士学位;2011所创立的先进分析研究所是澳洲政府发布的关于大数据策略与更好的大数据实践等白皮书中唯一一个被特别介绍的机构;2015年在Springer创立International Journal of Data Science and Analytics。他是KDD2015等多个大会主席或程序委员会主席。在大数据分析应用方面,得到诸多政府、大型企业、国际知名运营商的合作支持,项目涉及金融与资本市场监管与投资,金融危机与跨市场研究,财政、社保、医保、税务、统计、审计、知识产权等政府业务,电商与零售分析,银行反洗钱、网银与支票风控,寿险与车险风控,航空常旅客管理,电信经营分析决策,教育与学习行为分析与管理,以及交通与出版等多个行业。他的团队所从事的大数据分析项目在相关媒体、政府与经合组织等报告中被提及,涉及相关政府与企业亿元计的直接经济效益。
该讲座是前沿讲座,欢迎全校师生踊跃参加。
计算机学院
校学术委员会
智能通信软件与多媒体北京市重点实验室
111引智基地