多源海量动态信息处理

1. 海量数据集成管理
研究结构化、半结构化、非结构化海量数据的采集、存储、集成管理机制与方法，海量数据清洗方法，以及需求驱动的全文检索机制与方法，突破核心技术，通过数据API提供海量数据服务，使数据松耦合于其它应用平台，实现海量异构数据的互操作和数据共享。

    2. 多源异构海量数据动态聚合
  从信息源、信息体、用户需求等多个视角，分析多源海量信息的可用性特征，建立满足信息演化应用的可用性评估推理模型，并在统一特征空间内进行多源海量异构信息的语义建模、相似性度量和语义归一化，探索多源海量信息的统计规律、概念漂移与非线性的突变机理，研究跨域跨平台的多源海量信息语义搜索、混搭及语义融合理论。

    3. 多源动态数据挖掘与分析
从多源异构、复杂内联和动态演化的角度构建新的知识发现策略与方法。基于海量信息获得的知识具有不确定性、不完整性、不协调性和不恒常性等特点，对海量知识进行提炼、排疑、融合、重组等处理，结合信息的动态变化规律定性和定量地分析知识的演化规律，为提高知识的决策支持价值提供关键理论和技术支撑。

    4. 海量信息服务与应用
   研究信息服务系统中的用户需求、用户行为和用户兴趣建模问题，探索云计算环境下信息服务系统的核心理论和关键技术，建立需求驱动的实时动态信息服务系统和数据云统一服务发布与运行平台，提供可用、有效而且具备进化能力的实时服务。面向医疗、农业、商务等行业和领域，开展大规模示范应用。

受资助的课题：

[1] 教育部创新团队“多源海量动态信息处理”（IRT13059），2013-2015；
[2] 国家863计划课题“多源异构数据集成与挖掘的关键技术研究”（2012AA011005），2012-1014；
[3] 国家自然科学基金“基于树结构模式Web信息抽取的关键问题研究”（61273297），2013-2017；
[4] 国家自然科学基金“基于特征发现的数据流概念漂移问题研究“(60975034)，2010-2012；
[5] 国家自然科学基金青年基金“基于多数据源协同学习方法的方剂组配规律研究”（61303131）, 2014-2016；
[6] 国家自然科学基金青年基金“基于树结构模式挖掘的Web信息抽取研究”（61005044），2011.1-2011.12；
[7] 国家发改委Chinagrid二期校园网格建设项目，2012.1-2013.12；
[8] 教育部博士点博导基金“基于特征扩展的Web 短文本数据流分类方法研究”（20130111110011）， 2014-2016；
[9] 中国科学院自动化所“情报与安全信息学（ISI）创新团队国际合作伙伴计划”子课题“HTML新闻网页过滤与总结”（No.2F05N01），2007-2008；
[10] [美国]国家科学基金(NSF)“CIF: Medium: Collaborative Research: Integrating and Mining Bio-Data from Multiple Sources in Biological Networks”（CCF-0905337），2009-2013.

下一篇：普适个性化与复杂系统的大数据计算