科大讯飞刷新机器常识推理世界纪录
4月12日,由科大讯飞承建的我国首个认知智能国家重点实验室,以76.06%的成绩登顶常识推理挑战赛CommonsenseQA 2.0,刷新世界纪录,在让机器“能理解、会思考”上迈出一大步!
CommonsenseQA 2.0是艾伦人工智能研究院于2021年主导发布的国际常识推理评测数据集,旨在评估机器对常识知识的理解及掌握水平,吸引了包括谷歌、华盛顿大学等众多国际顶尖机构参与挑战。科大讯飞首次参赛,即创新性地提出ACROSS模型,以全新深度学习算法绝对优势,刷新机器常识推理水平世界纪录。
常识推理是神经语言程序学最重要的研究方向之一,其目的是帮助计算机学习常识知识,并利用所掌握的知识进行深层次的理解及推理。该领域的进展及技术突破中,对人工智能发展具有重要意义。当前,典型的阅读理解模型所关注的问题类型主要是事实类问题,这一类型的问题答案往往能直接在原文中找到。然而,如何基于常识和背景知识进行推理以获得答案,对计算机仍旧是一个巨大的挑战。
在CommonsenseQA 2.0这项颇具挑战的常识推理评测任务上,业界主流的中等大小预训练模型方法也只能取得55%的水平,略高于随机猜测平均水平。此前国际上该任务的最优方法,通过1750亿级参数量大小的GPT3模型生成针对CommonsenseQA 2.0常识推理问题的相关知识,取得了73%的准确率。
本次科大讯飞认知智能国家重点实验室团队,创新提出的面向常识知识推理的ACROSS模型,实现了统一语义空间下外部知识的有效融合,显著改进了超大规模预训练模型所存在的问题,在CommonsenseQA 2.0任务上取得76%的准确率。
人工智能技术的下一步发展,必须要突破常识推理这一瓶颈,才能在教育、医疗、养老等国计民生场景中,让人工智能产品更具备实用价值。“让机器能听会说、能理解会思考,是清晰可预见的未来。 ”科大讯飞有关负责人表示。(记者 汪永安)
您可能也感兴趣:
为您推荐
贷款370万元买保险?消费者需当心有人盯上你的保单
银保监会要求保险机构提升农业保险保障水平 发展特色农产品保险
湖北省棉花“保险+期货”项目落地三县市 5万棉农将成为受益者
排行
最近更新
- 科大讯飞刷新机器常识推理世界纪录
- 《行风在线》4月18日中国建设银行日照分行上线
- 不盲目抽贷、断贷 山西加大防疫保供、物流通畅的金融支持
- UNEP报告:发展可持续基础设施对后疫情时期复苏至关重要
- 续写春天的故事|河北保定市白沟箱包产业提质增效
- 中山证券状告泛海控股,案由系公司债券交易纠纷
- 质疑风波背后 连花清瘟的红利能否延续?
- 向上突破!自主品牌福田图雅诺不辱使命 护送航天英雄回家
- 陆磊:以“预期管理”为核心构建经济金融管理体系
- 张晓慧:坚持“以我为主”的宏观政策 才能稳住预期
- 邢炜:银行需以高标准兼顾防风险和促发展
- 四天三度“发声”!银保监会要求金融机构全力支持货运物流保...
- 廖岷:金融机构要为货车司机、快递小哥等开发更多差异化服务
- 核酸检测为什么呈阳性
- 核酸检测阳性怎么治疗
- 中国首款自研新药获批,反流性食管炎抑酸治疗有新选择
- “落地”阿拉善,人工关节平均降价82%!
- 提醒!野菜别乱吃!沧州一家人吃完后开始腹泻!
- 上海就医保药应急平台招募“社区健康大使”,保障“供药生命线”
- 市领导到巩义市调研 努力探索医共体 建设“郑州模式”
- 捕鱼者变身护鱼者,这是咋回事?
- 见车起意行盗窃 望江派出所抓获一对“雌雄大盗”
- 老人4000元“被盗”急得直打转,太安派出所民警热心找回速“...
- 安徽省计划募集就业见习岗位5万个
- 上海发布工业企业复工复产疫情防控指引
- 产教融合,山东6部门联合公布两个名单
- 这般“警容不整”,却引网友怒赞!
- @山东食品生产经营者:6月30日前须完成这件事!
- 黄金变“白银” 市场监管“验真身”
- 1至2月全国投资增长12.2% 实现良好开局