您当前的位置: 首页 > 科技网络

东北大学破解大数据分析难题

2017-04-12 19:46:13

  记者刘勇、毕玉才 日前在东北京大学学得悉,由该校教授王国仁牵头研发的项目“海量异构数据集成管理与分析技术及利用”,成功破解大数据集成质量、管理效力和分析可伸缩性等关键困难,实现对异构大数据的集成、管理、分析,将对我国“数字水资源”“数字医疗”和“数字国土资源”等领域海量异构数据集成管理与分析发挥不可替换的重要作用。

  据介绍,大数据处理进程中的海量数据已远远超越了人们掌握和理解数据的能力。特别是异构数据,由于缺少统1的格式与规范,在各部门和各软件系统中的活动与同享困难重重。针对这些困难,王国仁带领研究团队展开攻关,从模式匹配、数据清洗、数据管理和数据分析等关键技术切入,成功设计出1套基于人机交互的数据集成体系。与当前国际上最早进的数据清洗系统相比,该系统数据集成质量提升10%以上,集成方法的可用性居世界领先水平,与国际通用的系统相比,数据管理效力提升50%以上,并在国际上率先提出了面向大数据的散布式极限学习机数据分析技术。该系统的平台可伸缩性、数据可伸缩性、隐层节点可伸缩性、数据标注可伸缩性最高提升近20倍。

TAG:
推荐阅读
图文聚焦