织梦CMS - 轻松建站从此开始!

罗索

什么是认知智能?为什么说认知智能是趋势?

jackyhwei 发布于 2020-04-28 10:12 点击:次 
国际知识发现和数据挖掘竞赛(KDD CUP),是目前知识发现与数据挖掘(Knowledge Discovery and Data Mining)研究领域中规模最大、影响最广、水平最高的国际顶级赛事,同时面向工业界和学术界,云集了
TAG: 认知智能  

国际知识发现和数据挖掘竞赛(KDD CUP),是目前知识发现与数据挖掘(Knowledge Discovery and Data Mining)研究领域中规模最大、影响最广、水平最高的国际顶级赛事,同时面向工业界和学术界,云集了该领域内的顶尖专家、学者、工程师、学生等,有数据挖掘领域“世界杯”之称。今年设置了多模态商品推荐、人工智能偏见消除两个赛题。

其中,多模态商品推荐指的是关联融合视频、图片、文本等多模态用户数据,并结合用户的购买习惯、浏览序列等多维信息进行建模学习,精准理解用户的检索需求,推荐并返回用户真正关心、感兴趣的产品图片或视频;

人工智能偏见消除,顾名思义,就是消除人工智能技术在学习样本数据时吸收到的偏见,这个偏见主要来自对数据的学习中(如只采集高端人群数据、忽略偏远人群等),消除偏见可以提升电商平台推荐的公平性,避免好的商品由于偏见而得不到推广的情况。这两个赛题有着非常广泛的应用和研究价值,也是大赛尝试在电商场景下解决“认知智能”问题上迈出的第一步。

 

从实现快速计算、记忆与存储的“计算智能”,到识别处理语音、图像、视频的“感知智能”,再到实现思考、理解、推理和解释的“认知智能”,人工智能发展的终极目标是赋予机器人类的智慧。

近年来,语音识别、人脸识别等“感知智能”技术已相对成熟,甚至在许多领域已经达到或超出了人类的水平。但这些技术仅在工具、模型层面实现了突破,对诸如需要专家知识、逻辑推理或者领域迁移等需要去思考、规划、联想、创作的复杂任务时,表现不佳。随着大数据、云计算、深度学习等技术的蓬勃发展,探索在如何保持大数据智能优势的同时,赋予机器常识和因果逻辑推理能力,实现“认知智能”,成为当下人工智能研究的核心,新一代人工智能技术也正在从“感知智能”向“认知智能”迈进。

由斯坦福大学发起的SQuAD[1](Stanford Question Answering Dataset)阅读理解竞赛,截至2019年7月,使用BERT[2]的集成系统暂列第一,其F1分值达到89.474,超越了人类水平,实现了认知智能在学术界的重大突破。

复旦大学肖仰华教授曾经提到,“所谓让机器具备认知智能是指让机器能够像人一样思考,而这种思考能力具体体现在机器能够理解数据、理解语言进而理解现实世界的能力,体现在机器能够解释数据、解释过程进而解释现象的能力,体现在推理、规划等等一系列人类所独有的认知能力上”[3]

也就是说,“认知智能”是人工智能技术发展的高级阶段,旨在赋予机器数据理解、知识表达、逻辑推理、自主学习的能力,使机器能够拥有类似人类的智慧,甚至具备各个行业领域专家的知识积累和运用的能力。

 

认知智能的实现离不开知识图谱技术[4]、自然语言处理技术的支撑。富含实体、概念、属性、关系等复杂信息的知识图谱,是机器认识和理解世界所依赖的知识体系(三观),是认知智能的“大脑”;

它赋予机器联想能力,能从一朵花,关联到颜色、形状、所属科目、能泡茶等信息,真正让机器认识花这个实体。自然语言理解技术是机器认识和理解世界的方式,是认知智能的“神经系统”,其结合知识图谱、持续学习、因果推理等研究领域,并借鉴心理学、脑科学以及人类社会的发展历史,模拟人脑的思考、推理过程,进一步解决复杂的阅读理解问题和少样本的知识图谱推理问题,提高非结构化的语义理解与推理的可解释性,实现基于自然语言理解的认知智能。

知识图谱的数据构建工作繁琐复杂,如何对海量冗杂无序的知识进行建模、转换、关联,至今仍是一项非常具备挑战性的任务。例如谷歌词库、百度百科、维基百科等都可以转换为知识图谱,但工作量大、内容庞杂、关联密度不足。目前小范围内的行业知识图谱表现出不错的效能,如电商、公安行业等; 我们相信,以更好地认知用户需求为目标的电商认知图谱,将助力搜索推荐等从基于行为的方式迈向基于行为与语义融合的认知智能时代,这也是下一代搜索引擎技术的关键。此外,知识图谱获取、建模、融合、计算等各个环节涉及算法的泛化能力差、算法鲁棒性差、算法多样化,缺乏统一的评测指标、算法可解释性差、基础知识库融合困难等,也是当前制约知识图谱技术发展的重要问题。

 

智能时代下,人们对智能化生活的要求越来越高,海量智能应用需求层出不穷,如智能围棋、智慧搜索、智能推荐、智能人机交互、精准预测等。但仅有感知智能,机器只是能感知世界,拥有简单、预设逻辑的交互能力,却不能像人脑一样理解和决策,无法帮助或替代人处理较为复杂的工作。在公安领域,人脸识别只是让机器能够识别出身份,但是涉及到侦查、破案,就需要对大量碎片化线索数据进行跨时间、空间的多维关联,推理或预测出可能的结果,这些都是仅靠感知智能无法完成的。

在电商行业中,感知智能只能让机器识别图片、视频或文字,而对这些多模态数据融合利用远远不够。简单基于标题关键词的推荐显然不能满足用户的检索需求,如何对视频、图片、文本等多模态数据的内容进行关联分析、识别与理解,提升对图像和视频的有效搜索和检索能力,以便我们可以召回具有适当多模态内容的产品并对其进行排名,帮助消费者做出更好的决策,成为了当前亟待解决的问题。

此外,众所周知,深度学习严重依赖样本,同一算法通过不同样本训练出的模型能力参差不齐,若采集样本中存在某些偏见(如只采集高端人群数据、忽略偏远人群等),深度学习模型在对样本进行拟合的过程中,将毫无疑问地对这些偏见进行学习、甚至放大,而这对电商平台来说无疑是灾难性的。

电商行业的认知智能,需要结合用户购买习惯、浏览序列等丰富的个人信息,进行多模态表示学习、模态映射、对齐、融合与协同学习,同时重点对抗深度学习以来样本数据可能带来的偏见,才能真正实现对用户需求的精准把握与认知。

 

未来的人工智能将是融合认知科学、脑科学、心理学等多学科的认知智能技术,它强调对人类感知、思考、理解和推理能力的模拟,并能适应复杂环境,使智能体具备高度的认知能力。认知智能的实现不再是虚无缥缈的存在,它即将到来,也许已经到来。而知识图谱技术、自然语言处理技术、深度学习技术的突破是新一代人工智能技术,实现认知智能的基础和关键。

参考

  1. ^http://stanford-qa.com
  2. ^BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
  3. ^https://zhuanlan.zhihu.com/p/35295166
  4. ^《知识图谱标准化白皮书2019》

 

(宝珠道人)
本站文章除注明转载外,均为本站原创或编译欢迎任何形式的转载,但请务必注明出处,尊重他人劳动,同学习共成长。转载请注明:文章转载自:罗索实验室 [http://www.rosoo.net/a/202004/17651.html]
本文出处:zhihu 作者:宝珠道人 原文
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片