首页

来自Data Management Lab
跳转至: 导航搜索
数据管理研究室从属于北京大学计算机科学技术研究所,负责人为邹磊 老师。研究所目前的研究工作以海量图数据管理为主。 海量图数据管理主要研究如何存储和检索基于RDF(统一资源描述框架)模型的海量语义数据; 图流数据分析、大规模分布式图数据库引擎的研发及图数据挖掘技术的应用;以及如何利用新硬件技术来提高图计算和图查询的性能。

新闻

  • [2018-05-24] 彭鹏的论文(Multi-Query Optimization in Federated RDF Systems)在DASFAA获得了Best Paper Award。本文在联邦型RDF系统上研究了经典的多查询优化问题。我们提出了一个启发式的基于查询重写的方法来共享多个查询执行过程中的公共计算,而且我们的方法同时考虑了查询执行和数据转移的代价。此外,我们提出了一个高效的方法来利用RDF数据源之间的连接来剪枝无关的RDF数据源和共享连接操作中的公共计算。在真实数据和人造数据上的实验显示了我们技术的高效。
  • [2018-05-03] 彭鹏的论文(Adaptive Distributed RDF Graph Fragmentation and Allocation based on Query Workload)被TKDE录用。随着资源描述框架(Resource Description Framework,RDF)数据规模的日益增长,设计一个分布式RDF数据管理系统对这些数据进行管理是一件十分必要的事情。在设计分布式RDF数据管理系统的过程中,常见做法在于:首先将RDF数据划分成多个称为分片的子数据,然后讲这些分片分布到不同机器上。因此,分布式系统设计的过程包含了两个部分:数据划分和分片分配。在本研究中,我们利用查询日志进行数据划分和分片分配,以旨在减少查询处理过程中的通信代价。具体而言,我们自适应地维护一些频繁读取模式(frequent access pattern,FAP)来反映查询日志的特性并保证数据完整性和方法近似率。基于这些的频繁读取模式,我们提出了三种数据划分策略:垂直划分策略、水平划分策略和混合划分策略,以针对不同查询处理目标来进行处理。数据划分之后,我们讨论如何将划分出来的分片分配到不同机器上以平衡负载。最后,我们还讨论了如何利用数据划分和分片分配的结果进行查询处理。在真实RDF数据集合上的实现验证了我们方法的卓越性能。
  • [2018-04-03] 张欣勃关于提升基于RDF的Q/A系统的精确性(IMPROVE-QA: An Interactive Mechanism for RDF Question/Answering Systems)的论文被SIGMOD 2018录用为demo。该论文中展示了接收用户反馈的完整的Q/A系统,允许用户对Q/A系统产生的初步结果做出评估,并根据用户的需求最小化重构SPARQL查询,已得到符合用户预期的更优结果。并为用户展示出重构的SPARQL与原始SPARQL之间的修改关系,以方便知识库设计人员直观地修正如下三类错误:实体链接、谓词消歧和结构缺失,并可以实时地更新上述三个词典,以让Q/A系统实时地采纳用户给出的正确意见。
  • [2018-04-03] 韩硕关于使用SIMD指令加速图算法中的集合求交操作的论文(Speeding Up Set Intersections in Graph Algorithms using SIMD Instructions)被SIGMOD 2018录用。这篇论文研究了通过加速集合求交这一基本操作,来加速相关的图算法。图的邻接表可以自然地理解为顶点的集合,因而集合的求交操作在许多图算法中都有所涉及,是非常基础和普遍的一种操作。我们提出了一种高效的求顶点集合交的QFilter算法,它利用了SIMD指令来快速地过滤掉大部分无效的比较操作。我们还提出了一种表示顶点集合的密集编码形式BSR。通过将QFilter算法和BSR编码相结合,我们从两个层面上实现了数据级并行,即BSR支持区块内部的并行,同时SIMD支持了区块之间的数据并行。进一步地,我们发现顶点的标号顺序影响了BSR的编码效率,从而也影响到图算法中的集合求交操作的效率。因此我们形式化将图顶点的重标号问题定义为BSR空间代价的最小化,并且证明了这一问题是强NP完全的。然后我们提出了一个近似算法来对图顶点进行重标号,来促进BSR对图顶点集合的编码效率,从而提高区块内部的并行度。在人造数据集和真实数据集上的实验结果表明,我们的方法能够显著提高图算法中集合求交操作的效率。
  • [2018-02-01] 实验室相关前期研究成果“大规模图结构数据管理”获得2017年教育部自然科学二等奖。
  • 更多...

通知

  • 实验室招聘信息详见左侧导航栏。
  • 常年招收北京地区的高校的优秀本科生来实验室实习,详见实习生招聘

近期会议

  • WWW 2017
  • ICDE 2017
  • SIGMOD 2017第二轮