我的位置: 首页  » 师资力量  » 外聘专家  »

邵俊明

基本信息

  邵俊明,男,1982年12月生,电子科技大学计算机学院/大数据研究中心教授。2011年获德国慕尼黑大学数据挖掘中心博士学位,2011年11月至2012年07月在德国慕尼黑工业大学大脑科学实验室做博士后,2012年08月至2014年07月在德国美因茨大学数据挖掘小组做洪堡学者。

学习经历

  2001.09-2005.07: 西北农林科技大学,计算机科学与技术,学士

  2005.09-2008.07: 西北农林科技大学,计算机应用技术,硕士

  2008.09-2011.11: 德国慕尼黑大学,数据挖掘中心,博士

工作经历

  2011.11-2012.07: 德国慕尼黑工业大学,大脑科学实验室,博士后

  2012.08-2014.07: 德国美因茨大学,数据挖掘小组,洪堡学者

  2013.12-至今: 电子科技大学,计算机科学与工程学院/数据挖掘实验室,教授

学术兼职

  CCF 大数据专委会通信委员

  TKDE, IJCAI, ECML/PKDD等评委

获得的主要学术奖励及荣誉

  1. 三篇最佳论文奖

  2. 德国洪堡学者

  3. 四川省千人计划特聘专家

  4. 电子科技大学校百人

  5. 教育部霍英东基金获得者

  6. 最高荣誉(Summa Cum Laude)博士学位

  7. IJCAI杰出评审人

研究方向

  数据挖掘、机器学习、脑科学

主要学术成果

  邵俊明教授一直致力于数据挖掘的基础理论研究及在交叉学科领域的应用研究。受自然界同步现象的启发,将其原理引入数据挖掘领域,提出了一系列新的数据挖掘算法,其相关成果发表在数据挖掘的三大顶级会议(SIGKDD,ICDM,SDM)及期刊 IEEE TKDE上。在数据挖掘理论研究的同时,将数据挖掘相关技术应用于脑科学及环境科学等交叉学科领域,取得一批重要的研究成果,在脑科学顶级期刊Brain, Neurobiology of Aging,Schizophrenia bulletin及水资源研究领域顶级期刊Water Research、权威期刊Environmental Modelling & Software等发表国际学术论文。迄今,发表论文70余篇,其中发表JCR一区8篇,JCR二区12篇,CCF A/B论文25篇,其中三篇论文被DASFAA、ICDM研讨会和IGI Global第四届年度优秀期刊评为最佳论文奖。2014年成为洪堡学者,2015入选四川省千人计划专家、2018年获教育部霍英东教育基金。

  科研项目方面,近五年来主持并参与了多项研究项目,包括洪堡基金项目、国家重点研发计划项目、国家自然科学基金青年、面上和重点项目、四川省科技厅青年基金(省杰青)、 欧盟 INTERREG 项目以及德国联邦教育及研究部(BMBF)科研项目等。担任国际著名期刊/会议IEEE TKDE、Chaos,IJCAI, ECML/PKDD等审稿人,IJCAI杰出评审人、CCF大数据专委通信委员。在数据挖掘国际学术会议SIGKDD, ICDM, ECML/PKDD等上作重要学术报告20余次。

  总体而言,候选人主要学术贡献和创新成果集中体现在以下三个方面:

  1.针对大数据挖掘面临的海量、高维问题,将同步原理引入数据挖掘领域,发展建立了一套基于同步原理的数据挖掘新框架和一系列数据挖掘新算法。

  数据的海量性和高维性是大数据分析和挖掘面临的巨大挑战,也是数据挖掘领域关注的重大科学问题之一。候选人在数据挖掘基础理论算法研究中,将同步原理引入数据挖掘领域,解决或缓解了在面向大规模数据上的聚类、噪声检测及子空间分析等上相关难题。新提出的数据挖掘新方法,具有一些传统算法无法比拟的优越性,可在分钟级对亿级数据进行快速聚类且得到更高质量的聚类结果,同时支持高维数据的快速聚类分析。该系列成果得到了国内外同行的广泛认可,在ACM SIGKDD,IEEE Transaction on Knowledge and Data Engineering, IEEE ICDM, ACM Transactions on Knowledge Discovery from Data, Knowledge and Information Systems等上发表第一作者高水平论文12篇,其中CCF A/B 论文11篇。

  2.针对数据流上的概念漂移检测和半监督学习的安全性问题,提出了概念漂移检测、数据流分类和可靠性学习新方法。

  数据流挖掘有别于传统的静态数据挖掘,由于数据的连续性、实时性、海量性、演化性和复杂性等特征,使得数据流上的模式提取和知识发现变得更为困难。候选人从数据流的演化特征入手,提出基于原型的数据流分类和可靠性学习方法并进行应用。候选人针对数据流中的概念漂移检测和海量无标签数据的可靠性学习提出了新的解决方法。新提出的算法不仅具有很高的预测性能,同时具有很低的时间和空间复杂度,为实时进行大规模数据流分析提供了新的思路和技术方法,相关的论文得到了国际同行的认可,以第一作者发表在 KDD 2014,ICDM 2016 和 IEEE TKDE 2018上,授权国家发明专利2项。同时将数据流挖掘应用于遥感数据分析中,以通信作者在Environmental Modelling & Software上发表两篇JCR一区文章。

  3.利用同步原理的聚类分析和数据流挖掘基础理论研究,针对传统统计方法在神经影像分析、径流预测的不足,进行大脑疾病的诊断和水资源的优化管理应用研究。(1)脑科学:结合当前无创的神经影像技术,研究大脑的结构及功能连接网络,从数据挖掘的新视角探索大脑的连接机制和模式,辅助疾病的分析和诊断。针对传统统计方法在神经影像上分析的不足,候选者将基于同步原理的聚类分析、非负矩阵分解等技术用于揭示脑网络的结构和功能连接模式。相关成果得到国际同行的认同。首先,两篇关于纤维自动聚类的文章均被评为“最佳论文奖”(排名1)。其次,关于老年性痴呆自动预测的论文一经发表就受到著名视频期刊JoVE邀请发表其相关技术,并获得华西都市报、人民网、中国教育报等媒体报告,引起了广泛的社会关注。同时,全球著名的老年性痴呆学者Frederik Barkhof 教授也在对老年性痴呆综述文章中也总结了该工作。相关的研究成果发表在脑科学权威期刊Brain(IF= 10.840),Journal of Nuclear Medicine(IF = 7.439),Neurobiology of Aging(IF="4.454)等上。(2)环境数据挖掘:将数据流挖掘技术应用到水资源研究领域。研究项目得到了欧洲 INTTEREG 项目的资助,相关研究结果发表在水资源顶级期刊 Water Research (IF="7.051)" 及权威期刊 Environmental Modelling & Software (IF="4.177)等上。