CCDM 2018 聚类分析

聚类分析论坛

选题概述

聚类分析是数据挖掘、机器学习、模式识别等研究领域的重要工具之一,也是这些领域近十多年来研究的热点。但聚类分析是一个病态问题,即使关于“类”统一且普遍接受的定义尚不存在,这一方面致使聚类分析的理论基础仍很薄弱,另一方面导致文献中的聚类算法众多,而众多的聚类算法又使用户处于尴尬的境地:难以选择适合自己聚类问题的算法。此外,社会生活中越来越普遍的大数据又给聚类分析带来新的挑战,即如何进行快速有效的聚类分析。因此,我们建议选择“聚类分析”作为CCDM2018的学术专题论坛之一,以推动国内学者在聚类分析方向的研究。

论坛发起人

于剑,北京交通大学,教授,中国计算机学会会士,CCF人工智能与模式识别专委会任秘书长,中国人工智能学会理事,中国人工智能学会机器学习专委会副主任,数字出版技术国家重点实验室学术委员,交通数据分析与挖掘北京市重点实验室主任,主持多项国家自然科学基金重点与面上项目。主要研究兴趣是机器学习和数据挖掘等。

建议讲者

张宪超教授,大连理工大学

报告题目:多任务聚类和多视角聚类

报告摘要:多任务聚类通过在任务之间迁移相关知识来提高所有任务的聚类性能。利用真实类标签的监督多任务学习方法已经研究得比较成熟,而不利用真实类标签的多任务聚类方法还有很多问题亟待研究。多任务聚类要处理的数据分为三种类型:同域数据、多域数据。多域数据又分为任务完全相关和任务部分相关,其中部分相关任务多任务聚类具有很大的挑战性。多视角聚类融合多个视角的信息,能获得比单视角聚类更好的效果。大多数多视角聚类针对完全对应的情况,仅利用一致性或差异性进行视角间信息的交互。然而,大量应用中的数据实例和簇类别往往是部 分对应的,目前少量工作研究数据实例部分对应的情况,而数据实例和簇类别均部分对应的情况还没有深入研究。本报告从问题的提出、已有主流算法和当前面临的挑战等方面,分别讨论多任务聚类、多视角聚类和多任务多视角聚类。

报告人简介:张宪超,大连理工大学教授,博士生导师,国防科学技术发展研究院副院长,数据科学与智能决策研究中心副主任。研究方向为人工智能与数据科学,主持国家自然科学基金7项、国防12.5重点预研1项、国家863项目子课题1项、教育部重大科技项目1项、教育部—中国移动科技基金1项、教育部博士点基金1项以及企事业单位委托项目多项,由科学出版社出版《数据聚类》专著1部、《深度学习》专著1部。发表论文100余篇。获教育部高等学校科学技术奖(自然科学)二等奖,辽宁省科学技术奖(自然科学)二等奖。入选教育部新世纪优秀人才支持计划、辽宁省百千万人才工程、大连市后备领军人才。 

 

聂飞平教授,西北工业大学

报告题目:结构化大图学习及其高效聚类算法

报告摘要:大数据聚类的主要挑战之一在于如何以极低的成本处理海量数据,同时提高聚类效果。很多大规模聚类方法基于稀疏采样的思想,聚类效果好坏主要取决于模型能否高效学习代表点和原始数据的关系。在结构化图学习的基础上,我们提出了一种基于结构化二部图学习的快速聚类方法。通过在原始数据和代表点间迭代地学习一个稀疏结构化二部图,可以直接得到聚类结果,有效避免了传统方法中随机初始化对最终聚类结果造成的影响。该方法复杂度很低,并且显著提高了大数据聚类的质量。

报告人简介:聂飞平,西北工业大学教授、博士生导师,2015年入选中组部青年千人计划并全职回国工作。主要研究兴趣为机器学习中的理论分析和方法设计,并将所设计的方法成功应用于图像分割与标注、多媒体信息理解与检索、生物信息学等多个领域的实际问题中。已在PAMI、IJCV、Bioinformatics、ICML、NIPS、SIGKDD等国际期刊和会议上发表系列学术论文,其中CCF A类论文150余篇,IEEE/ACM Transactions汇刊论文80余篇。论文已被引用万余次,H指数为52。常年担任相关领域的审稿人或资深委员,以及多个国际一流SCI期刊的编委。

 

于剑教授,北京交通大学

报告题目聚类理论与算法选讲

报告摘要聚类分析在数据挖掘中扮演极其重要的作用。 根据不同的理论和任务,文献中已经提出了众多的聚类算法。 聚类算法能否公理化一直存在争论, 特别是2002年Kleinberg的文章对于这个问题给出了否定的回答。本次报告将讨论一个可行的聚类分析公理化体系,并据此提出了三条聚类算法设计原则,分析了现在常见的聚类算法以及聚类有效性研究等。

报告人简介于剑,北京交通大学,教授,中国计算机学会会士,CCF人工智能与模式识别专委会任秘书长,中国人工智能学会理事,中国人工智能学会机器学习专委会副主任,数字出版技术国家重点实验室学术委员,交通数据分析与挖掘北京市重点实验室主任,主持多项国家自然科学基金重点与面上项目。主要研究兴趣是机器学习和数据挖掘等。

 

侯建教授,渤海大学

报告题目:主集聚类:算法、扩展与应用

报告摘要:主集聚类是基于图理论和博弈论的一种序列式聚类算法,通过对类本身的定义,逐个提取类以达到聚类目的。主集聚类以数据相似度矩阵 作为唯一输入,不依赖任何参数,可以自动确定类别数量,并有其它一些有趣的性质。在原始主集聚类算法的基础上,针对向量型数据聚 类引入参数的问题,我们提出利用直方图均衡化外加初始类扩展来降低参数依赖。基于该算法的一些独特性质,主集聚类已经被应用于特 征组合分类、特征匹配等任务中。

报告人简介:侯建,男,工学博士,教授,硕士生导师。博士毕业于哈尔滨工业大学,曾作为博士后和访问学者在新加坡国立大学和意大利威尼斯大学 工作,目前在渤海大学任教。主要研究领域为模式识别、机器学习、计算机视觉和图像处理等。发表学术论文50余篇,其中包括IEEE TIP 、IEEE TNNLS、Pattern Recognition、Information Sciences等知名国际期刊和ICIP、ICPR、ICASSP、PAKDD和IJCNN等重要国际会议。 主持和参与了包括国家自然科学基金面上项目、辽宁省自然科学基金重点项目、欧盟EU-FP7和新加坡DSTA等科研项目。

论坛联系人

姓名:钟才明

单位和职称:宁波大学,教授

手机:13819878682

邮箱zhongcaiming@nbu.edu.cn


论坛初步日程

初步日期87日上午

初步议程于剑教授致辞、4个论坛报告