CCDM 2018 多媒体计算

多媒体计算论坛


选题概述

论坛讨论跨媒体智能分析与视觉理解等内容。具体探讨了如何进行人工智能驱动的视觉计算,如何进行跨媒体的关联性挖掘、标注、搜索以及如何将深度学习更好的应用在视觉分析和理解任务中等问题。

论坛建议人

聂礼强教授,山东大学,计算机科学与技术学院

聂礼强教授分别于2009和2013年从西安交通大学和新加坡国立大学获本科和博士学位。之后以研究员的身份在新加坡国立大学工作三年半。2016年入选“齐鲁青年学者”和国家“青年千人”,全职加入山东大学担任教授、博导、精英班和泰山学堂教授小组组长。2018年担任山东省人工智能研究院院长。


建议讲者

崔鹏教授,清华大学计算机系

报告题目Marrying Causality and Association with Visual Learning

报告摘要Compared with machines, people are far better learners as they are capable of learning models from very limited samples of a new category and make accurate predictions and reasoning accordingly. The strong learning ability of human are attributed to the key elements of causality and association in the human learning process. To learn from human learning process is a promising way to develop new effective learning methods. In this talk, several basic problems in human-like visual learning will be discussed, including the bottle-neck of modern visual learning methods, the notion of causality and association in visual learning, and some of our preliminary trails and experiences on marrying causality and association with visual learning.

讲者简介:崔鹏教授研究兴趣聚焦于社会感知的多媒体计算,社会动力学建模以及大规模网络表征学习。近5年在数据挖掘及多媒体领域顶级会议发表论文60余篇,获得国际会议和期刊论文奖7项,包括多媒体领域IEEE旗舰会议ICME最佳论文奖,数据挖掘领域IEEE旗舰会议ICDM最佳学生论文奖等,并先后两次入选KDD最佳论文专刊。担任IEEE TKDE、ACM TOMM、IEEE TBD等国际期刊编委。2015年获得ACM中国新星奖,2015年入选中国科协首届青年人才托举计划,并于2016年当选中国科协全国委员会委员。

 

龙明盛教授,清华大学软件学院

报告题目:Predictive Learning for Video Prediction

报告摘要:Spatiotemporal predictive learning is to make machines learn the physics by observing real events in videos. It is very intriguing and worth exploring that how to leverage this learning paradigm to benefit practical applications, such as precipitation forecasting, traffic flows prediction and physical interactions simulation. There is a dilemma in spatiotemporal modeling: the increasingly deep-in-time networks have been designed for complex video dynamics, while also introducing more difficulties in gradients propagation. Therefore, how to maintain a steady flow of derivatives in a deep-in-time predictive network is a path worth exploring. In this talk, I will introduce several recent advances made in predicative learning, “the next frontier in AI”.

讲者简介:龙明盛教授分别于2008和2014年从清华大学获学士和博士学位,之后以访问研究员身份在加州大学伯克利分校工作一年。现任清华大学软件学院助理教授,博士生导师,大数据系统软件国家工程实验室机器学习组组长。研究领域涵盖了机器学习算法、系统和应用,特别是深度学习、迁移学习、预测学习和嵌入学习,及其在图像视频识别、预测、检索任务中的应用。以第一作者或通讯作者在ICML/NIPS/CVPR/ICCV/KDD等CCF-A类会议和期刊上发表论文30余篇,其中在ICML ’15发表的深度迁移学习论文已被引用400次,长期担任上述会议的程序委员会委员。主持国家重点研发计划课题、国家自然科学基金课题等国家级项目3项。


鲁继文教授,清华大学自动化系

报告题目深度学习与视觉理解

报告摘要:报告将介绍本课题组近年来所提出的面向视觉内容理解的深度学习系列方法,主要包括深度度量学习、深度哈希学习、深度强化学习等,以及它们在人脸和属性识别、行人跟踪与识别、跨模态匹配与识别、图像和视频检索等多个视觉分析与理解任务中的应用。

讲者简介:鲁继文教授国家青年千人计划入选者。主要研究方向为计算机视觉和机器学习,具体研究内容包括深度学习、人脸识别、视频分析和场景理解。在IEEE汇刊上发表论文55篇(其中PAMI论文9篇),ICCV/CVPR/ECCV/NIPS论文32篇,ESI热点论文和高被引论文9篇,SCI他引1400余次,谷歌学术引用5000余次,出版论著2部。曾任或现任IEEE Transactions on Circuits and Systems for Video Technology和Pattern Recognition等6个SCI国际期刊编委。主持国家重点研发计划课题、国家自然科学基金面上项目等国家级项目3项。


杨阳教授,电子科技大学计算机科学与工程学院

报告题目:跨媒体智能分析与处理

报告摘要:多媒体将文本、图像、语音、视频等数据形式紧密混合一体,已经成为大数据的普遍表达方式。而跨媒体理解通过对语言、视觉、和听觉的语义贯通,是实现智能行为的基础,在机器人、无人机、安防、交通、教育、互联网等领域有重大应用价值。在这里,我们将对跨媒体理解的最新科研成果,展开一系列讨论,包括跨媒体的关联性挖掘、标注、搜索等。

讲者简介:澳大利亚昆士兰大学博士、新加坡国立大学博士后。研究领域包括多媒体检索、社交媒体分析和机器学习。在计算机领域知名期刊和会议上发表论文百余篇。目前主持国家自然基金面上项目1项、参与重点项目1项。多次任职国际SCI期刊(客座)编委。曾获ACM Multimedia 2017最佳论文奖、ACM Multimedia 2013最佳学生论文、ACM SIGIR最佳论文Honorable Mention、IEEE ICME World's FIRST 10K Best Paper Award、WISE最佳论文等学术奖项。2014年获电子科技大学校百人计划;2016年获中组部青年千人计划、四川省千人计划支持。


桑基韬教授,北京交通大学计算机科学系

报告题目:深度学习解释性研究

报告摘要:随着深度学习的研究深入和应用拓展,学术界从探索深度学习“能”做什么,发展到思考深度学习“不能”做什么。此次报告首先介绍深度学习“不能”做什么,以及与深度学习解释性三个层次的关联;然后介绍深度学习解释性的研究现状和讲者的一些思考,探讨从三个层次改善深度学习解释性的可能思路。

讲者简介:博士,教授,博导,北京交通大学计算机科学系副主任。东南大学学士、中科院自动化研究所博士。2012-2017年在模式识别国家重点实验室工作,2017年入选北京交通大学“卓越百人”计划。曾获中科院院长特别奖、中科院优秀博士论文、ACM中国新星奖等。主要研究方向为多媒体计算、社会媒体分析与应用等。已出版英文专著一部,发表国际会议获奖论文7篇(CCF-A类2篇)、第一作者IEEE/ACM汇刊10余篇。担任国际多媒体会议ACM Multimedia和国际模式识别会议ICPR领域主席,曾担任国际会议PCM2015(CCF-C)和ICIMCS2015(SIGMM China旗舰会议)程序委员会主席。作为第二完成人获北京市科学技术奖1项(自然科学类)。