http://keg.cs.tsinghua.edu.cn/jietang/
唐杰副教授的研究兴趣主要包括社会网络分析、数据挖掘和语义Web。具体的来说,我针对社会网络的建模、用户行为跟踪和网络结构演化进行了深入研究。我曾在伊利诺伊香槟分校、香港中文大学、香港科技大学、鲁汶大学进行学术访问,目前是多个国家级项目和多个国际合作项目的负责人。
唐杰副教授的主要创新性研究包括:
1)语义信息抽取,针对不同类型的数据源提出多种信息抽取方法,并将其成功应用于多个系统中;
2)基于话题的信息搜索,和传统的关键词搜索以及对象搜索不同,我研究的话题搜索主要侧重于如何理解文档和查询的话题语义信息,以及如何基于话题分布进行相关匹配;
3)网络行为建模和影响力分析,我提出了针对社会网络的微观动态分析方法,并首次提出了社会影响力的量化分析方法,以及社会网络行为和社会影响力关联关系的分析方法。
应用上述研究成果,我研发了研究者社会网络ArnetMiner系统 (http://arnetminer.org),该系统收集了100多万名研究者、300万篇论文信息、3700多万引用关系以及8000多个会议信息。从2006年运行以来,该系统吸引了189个国家73万个独立IP的访问(>6千960万访问日志),访问量还在以每月10%左右的速度增长。ArnetMiner系统在国际顶级会议WWW、KDD、ISWC、ICDM中进行了演示,得到一致好评,系统数据还被广泛应用于科学研究,在国际上具有一定的影响力。我曾被邀请访问美国IBM TJ Watson研究院、美国UIUC大学、香港科技大学、香港中文大学、鲁汶大学、Google China、MSRA、IBM CRL进行学术交流。我已申请相关技术专利7项,研究成果还在与IBM、Google、Nokia、国际最大的石油公司、搜狐和中国科学技术信息研究所的多个国际合作和企业合作项目中得到推广应用。在标准制定方面,我参加了国家中文新闻置标语言和分类标准的制定。
Factor Graph Models
Factor graph is one type of probabilistic graphical models, providing an elegant way to represent both undirected graphical structure and directed graphical structure, with more emphasis on the factorization of the distribution.
Online social networks are getting larger and machine learning tasks are facing several challenges:
(1) labeled data is insufficient and how to leverage the unlabeled data for learning a graphical model?
...