首页

出自北京大学计算机科学技术研究所语言计算与互联网挖掘研究室

跳转到: 导航, 搜索
语言计算与互联网挖掘研究室从属于北京大学计算机科学技术研究所,成立于2008年7月,负责人为万小军老师。研究室以自然语言处理技术、数据挖掘技术与机器学习技术为基础,对互联网上多源异质的文本大数据进行智能分析与深度挖掘,为互联网搜索、舆情与情报分析、写稿与对话机器人等系统提供关键技术支撑,并从事计算机科学与人文社会科学的交叉科学研究。 研究室当前研究内容包括:1)语义理解:研制全新的语义分析系统实现对人类语言(尤其是汉语)的深层语义理解;2)机器写作:综合利用自动文摘与自然语言生成等技术让机器写出高质量的各类稿件;3)情感计算:针对多语言互联网文本实现高精度情感、立场与幽默分析;4)其他:包括特定情境下的人机对话技术等。

新闻

  • (2018-4-21)本研究室独立完成的五篇论文被自然语言处理领域顶级国际会议ACL 2018录用,其中长文4篇,短文1篇(1. Yajie Ye, Weiwei Sun and Xiaojun Wan: Language Generation via DAG Transduction; 2. Zhiwei Yu, Jiwei Tan and Xiaojun Wan: A Neural Approach to Pun Generation; 3. Yufei Chen, Yuanyuan Zhao, Weiwei Sun and Xiaojun Wan: Pre- and In-Parsing Models for Neural Empty Category Detection; 4. Yufei Chen, Weiwei Sun and Xiaojun Wan: Accurate SHRG-Based Semantic Parsing; 5. Yitao Cai, Yin Li and Xiaojun Wan: Sense-Aware Neural Models for Pun Location in Texts)。祝贺本科生叶亚杰、赵元媛、蔡懿韬、李银以及研究生陈宇非、于智薇、谭继伟等同学。
  • (2018-4-17)本研究室独立完成的两篇论文被人工智能领域顶级国际会议IJCAI 2018录用为长文(Ke Wang and Xiaojun Wan. SentiGAN: Generating Sentimental Texts via Mixture Adversarial Networks; Tianyu Liu, Wei Wei and Xiaojun Wan. Learning to Explain Ambiguous Headlines of Online News)。其中第二篇论文的第一作者刘天宇同学为在本组实习的大二本科生。
  • (2018-4-12)本研究室独立完成的论文被信息检索领域顶级国际会议SIGIR 2018录用为长文(Ke Wang and Xiaojun Wan. Sentiment Analysis of Peer Review Texts for Scholarly Papers)。
  • 更多...

通知

  • 研究室常年招收重点高校优秀本科实习生,欢迎申请。
  • 研究室招收自然语言处理与文本挖掘相关方向的博士后,欢迎申请。



近期会议

  • EMNLP 2018
个人工具