国家语言资源监测与研究平面媒体中心

发布时间:2025-08-07

国家语言资源监测与研究平面媒体中心(National Print Media Language Resources Monitoring & Research Center)成立于2004年6月,是教育部语言文字信息管理司与北京语言大学共建的研究中心。中心以科学研究为核心,以语言资源建设为根本,以服务国家服务社会为宗旨,有组织地开展科学研究,进行人才培养,努力推进语言文字信息化发展。

中心长期开展语言监测与研究、语言信息处理、社会计算、语言教育技术等交叉学科方向的研究工作。面向国家语言资源监测与研究重大需求,中心持续性建设动态流通语料库(Dynamic Circulating Corpus, DCC),建成了实时动态更新、历时共时与领域地域体系化分布、形式正确、内容安全的高质量大规模语言资源,保障了国家语言资源监测任务的实施:每年向社会发布媒体用字用语调查;支持了年度“汉语盘点”以及科技、教育、反腐领域年度盘点;为国家语言政策的制定提供数据基础,为语言生活、语言教学、语言信息处理提供服务。

中心在资源建设的基础上,积极对接国家任务。支持了国务院公布的《通用规范汉字表》的研制;为外语中文译写部际联席会议提供数据提取服务;在语信司的指导下,中心研发了全球首个多语种冬奥会术语库、《冬奥体育项目名词》,在2022北京冬奥会筹备、举办期间发挥了重要作用,获得国际奥委会巴赫主席的签名感谢;在国家语言资源服务平台上建构了语言翻译服务板块,创新性地实现了回译功能,提供了独特的翻译质量评估服务。

中心围绕语言文字信息化工作开展智能语言生活的调查跟踪,提交资政报告多份,获得党和国家领导人、国家语委科研规划领导小组批示或采纳。

中心围绕文本内容计算、智能辅助语言学习、价值计算、大语言模型语言能力评测等方面开展研究。开发了“文心”语料检索平台、中文文本特征计算平台、各类评测数据集等具有特色的语言资源服务平台,获得良好的社会反响。近五年在领域内国际、国内顶级会议、SCI/SSCI一区、二区国际期刊、国内CSSCI期刊、核心期刊上发表论文余80篇,获得专利12项。