创客100
当前位置: 主页 > 人工智能 > >> 正文

AI阿里达摩院模型:中文语言理解水平已达到新巅峰

2022-11-25 21:28 来源:理财帮     

  11月25日消息,在最新的中文语言理解领域权威榜单CLUE中,来自阿里达摩院的AI模型“通义AliceMind”以86.685的总分成绩创造了新纪录,这是该榜单诞生近三年以来,AI首次超越人类成绩(86.678),意味着AI模型的中文语言理解水平达到了新的高度。

  作为业界最权威的中文自然语言理解榜单之一,CLUE从文本分类、阅读理解、自然语言推理等9项任务中全面考核AI模型的语言理解能力。过去三年,该榜单吸引了众多国内顶尖NLP团队的参与,尽管榜首位置多次易主,但参评AI模型一直未能超越人类成绩。

  根据最新的结果,阿里通义AliceMind在4项任务中的表现超过人类水平,同时实现了总榜平均分的首次超越。

  需要注意的是,中文语言理解是AI业界亟待攻克的难题之一。阿里方面表示,为提升AI模型对词语、句子以及语言整体的理解力,在预训练阶段,达摩院沿用超大规模模型训练所使用的海量高质量中文文本,同时对模型结构和训练技术进行了一系列优化,如使用激活函数GLU、字词混合的大词表等获得更强的文本建模能力,使用StrongHold训练加速技术缩短迭代周期、节约算力成本,进而获得性能的显著提升。在精调阶段,面对文本分类、阅读理解、自然语言推理等下游任务,达摩院采用了迁移学习、数据增强、特征增强等技术,进一步提升模型表现。

  在应用方面,通义AliceMind模型体系涵盖预训练模型、多语言预训练模型、超大中文预训练模型等,具备阅读理解、机器翻译、对话问答、文档处理等多种能力。目前,相关技术已应用于医疗、电商、法律等领域,在跨境电商领域,达摩院的机器翻译系统能提供214种语言的互译服务。其基础模型已在ModelScope平台(魔搭,https://modelscope.cn)开放。

免责声明: 创客100遵守行业规则,本站所转载的稿件都标注作者和来源。 创客100原创文章,请转载时务必注明文章作者和来源“创客100”, 不尊重本站原创的行为将受到创客100的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:admin@100tmt.com