LTP 4.0！单模型完成6项自然语言处理任务_一盘搜百科

当前位置：首页 » 生活常识 » 数码家电 » LTP 4.0！单模型完成6项自然语言处理任务

摘要语言技术平台（Language Technology Platform,LTP）是哈工大社会计算与信息检索研究中心（HIT-SCIR）历时多年研发的一整套高效、高精度的中文自然语言处理开源基础技术平台。该平台

LTP 4.0！单模型完成6项自然语言处理任务

语言技术平台（Language Technology Platform,LTP）是哈工大社会计算与信息检索研究中心（HIT-SCIR）历时多年研发的一整套高效、高精度的中文自然语言处理开源基础技术平台。该平台集词法分析（分词、词性标注、命名实体识别）、句法分析（依存句法分析）和语义分析（语义角色标注、语义依存分析）等多项自然语言处理技术于一体。

其中句法分析、语义分析等多项关键技术多次在CoNLL国际评测中获得了第1名。此外，平台还荣获了2010年中国中文信息学会科学技术一等奖、2016年黑龙江省科技进步一等奖。国内外众多研究单位和知名企业通过签署协议以及收费授权的方式使用该平台。

哈工大SCIR本科生冯云龙等同学在车万翔教授指导下，于近日对LTP进行了新一轮的全面升级，并推出了LTP 4.0版本。此次升级的主要改进为：

基于多任务学习框架进行统一学习，使得全部六项任务可以共享语义信息，达到了知识迁移的效果。既有效提升了系统的运行效率，又极大缩小了模型的占用空间
基于预训练模型进行统一的表示，有效提升了各项任务的准确率
基于教师退火模型蒸馏出单一的多任务模型，进一步提高了系统的准确率
基于PyTorch框架开发，提供了原生的Python调用接口，通过pip包管理系统一键安装，极大提高了系统的易用性

下表列出了新旧版LTP在精度、效率和模型大小方面的对比：

LTP 4.0！单模型完成6项自然语言处理任务

为了模型的小巧易用，本次发布的版本基于哈工大讯飞联合实验室发布的中文ELECTRA Small预训练模型。后续将陆续发布基于不同预训练模型的版本，从而为用户提供更多准确率和效率平衡点的选择。

测试环境如下：

Python 3.7
LTP 4.0 Batch Size = 1
centos 3.10.0-1062.9.1.el7.x86_64
Intel(R) Xeon(R) CPU E5-2640 v4 @ 2.40GHz

备注：速度数据在人民日报命名实体测试数据上获得，速度计算方式均为所有任务顺序执行的结果。另外，语义角色标注与语义依存新旧版采用的语料不相同，因此无法直接比较（新版语义依存使用SemEval 2016语料，语义角色标注使用CTB语料）。

TAGS：自然语言语言平台自然处理高精哈工大技术

声明：一盘搜百科所有作品（图文、音视频）均由用户自行上传分享，仅供网友学习交流。若您的权利被侵害，请联系 88888@qq.com

0

猜你喜欢

大自然的语言有哪些,大自然的语言有哪些说明方法？

百科大全

大自然的语言有哪些,大自然的语言有哪些说明方法？

2022-01-08 102阅读

大自然的语言有哪些,表达“大自然语言”的句子有哪些？

体育百科

大自然的语言有哪些,表达“大自然语言”的句子有哪些？

2022-01-08 76阅读

分词技术,为什么我的语言栏总是不显示？

百科大全

分词技术,为什么我的语言栏总是不显示？

2022-02-04 48阅读

人工智能简称

数码家电

人工智能简称

2022-02-24 85阅读

什么是ai技术

数码家电

什么是ai技术

2023-04-06 54阅读

小度在听吗

数码家电

小度在听吗

2023-04-06 48阅读