联系我们 contact us
地址:北京市朝阳区汤立路
   218号明天·STUDIO·A座
010-84678879

您当前所在位置:主页>技术共享>物联世界>

林元庆破解小度问鼎最强大脑三大原理,后吴恩达时代百度 AI 突围
时间:2017-04-09 21:03 作者:佚名 点击:

  【新智元导读】《最强大脑》第四季最终回播出,百度人工智能机器人小度和人类一起问鼎“脑王”。小度在前两个环节(图像检索和人脸识别)表现优异,最后声纹识别项目挑战失败。成败背后的技术要点和难点是什么?本文为你带来最全解读。后附百度研究院院长林元庆对挑战赛技术原理、百度为何不做围棋AI、吴恩达走后百度人事架构的回答。

  本季脑王共分三个环节,前两个环节人类选手和小度都参与了挑战(小度都成功了,两名人类选手都失败了),第三个环节则是小度和人类选手分别挑战不同的项目(结果小度失败,人类成功)。

  最终结果:人类代表队和小度共同获得脑王。

  节目很明显的一点,就是“机器 PK 人类”的色彩相比第一季时弱化了很多,最后展现结果时也没有特意将人和机器做对比。对此,百度研究院院长林元庆表示,这确实是节目组的设计,“最后没有比拼,而是希望以展现人和机器能够共存,机器能够帮助人,希望突出这样一个主题”。

  整场挑战赛的三个环节(共四个项目)分别是:

  挑战一:沧海桑田(小度VS人类选手)

  比赛项目:根据一个很小很模糊的细节,找出这个细节是属于30张照片中哪一张,并且指出这个细节具体位于照片的哪个位置。匹配成功则挑战成功。

  比赛结果:小度选择正确,人类选手(黄政)选对了照片,但是标注错了碎片在照片中的位置。

  挑战二:亲爱的(小度VS人类选手

  比赛项目:嘉宾在40张父母合照中随机挑选一张,选手和小度同时观察该照片,在40位造型一致,身材接近的女生中,找到该父母的亲生女儿,找出的女儿手中全家福照片与父母合照背面的全家福完全一致,则挑战成功。

  比赛结果:小度答对,人类选手(Alex)答错。

  挑战三:永不消逝的电波(小度单独挑战)

  项目规则:现场30段情景的说话声,与30个笑声相匹配;小度采集完整的30段说话声,随后根据嘉宾随机挑选的一个笑声,找到对应的说话声。正确找出则挑战成功

  挑战结果:小度挑战失败。

  挑战三:一字成书(人类选手单独挑战)

  项目规则:现场20封由不同字体书写的家书,嘉宾随机选择一封,选手仅观察所选家书封面,判断所属字体,在232个四字重叠的叠字碎片墙中,找到属于该家书字体的所有字,全部找对,则挑战成功。

  挑战结果:人类选手(陈智强)挑战成功。

  脑王争霸赛比赛难点和技术分析

  下面,我们就来具体看看,小度参与的三个项目都涉及了哪些技术,难点又在哪里。图片来自4月5日媒体观影会百度研究院院长林元庆演讲PPT。

  挑战一:沧海桑田(图像检索)技术原理

  

林元庆破解小度问鼎最强大脑三大原理,后吴恩达时代百度 AI 突围

  这个技术其实很像百度常用的图像检索,拿一张照片来找到在互联网海量的照片中找到和它相似的照片。据悉,百度的这项技术已经在服务亿万的用户。

  计算机进行图像识别,是利用分类和提取出图像的重要特征,并对多余的无用特征加以有效地排出。计算机所能提取出来的上述特征有时会较为明显,而有时也会非常的普通,这在极大程度上对计算机的识别效率造成一定影响。

  因此,如何让图像特征抽取的过程更稳定,不受模糊、噪点等信息的干扰,让搜索结果更精准,是图像检索成功的关键。

  

林元庆破解小度问鼎最强大脑三大原理,后吴恩达时代百度 AI 突围

  这项挑战的难点:

比赛比平常的图像检索难度大大升级,老照片都是模糊、破损的,无法达到普通检索的要求,对算法造成了很大的干扰;

一般的图像检索中,图片中会有多个有效信息点来相互校验,但这次比赛提供的只是图片中的一小块,只有一个信息点。小度必须在线索少、干扰大的情况下,完成这个任务。

  据介绍,百度基于真实用户图像检索场景的图像检索数据,构建了覆盖了多种真实的图像扰动大规模图像匹配训练集合。利用神经网络训练进行监督训练得到图像局部特征表示模型,该模型可以提取鲁棒的低维图像特征表示。 基于该模型,百度实现了百亿规模的互联网图像的快速检索。

  挑战二:找“女儿”(隔代识别)技术原理

  

林元庆破解小度问鼎最强大脑三大原理,后吴恩达时代百度 AI 突围

  嘉宾在40张父母合照中随机挑选一张,选手和小度同时观察该照片,在40位造型一致,身材接近的女生中,找到该父母的亲生女儿,找出的女儿手中全家福照片与父母合照背面的全家福完全一致,则挑战成功。

  人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术。

  这项挑战所涉及的“隔代识别”仍属于图像识别分类中的人脸识别,只是难度更大。隔代识别技术原理与人脸识别相同:形成灰度图,分别提取父母面部的特征点和孩子的特征点进行比对。

  这项挑战的难点有几个:

  首先,计算机需要从图像中识别出人脸。计算机需要识别并去除脸部周围的多余像素,如用椭圆遮罩,只显示内部的人脸区域而不是头发或图片背景,因为头发或背景的变化往往多于脸部区域。

网站地图 | RSS订阅 | RSS地图 | 网站首页 | 关于我们 | 技术共享 | 产品中心 | 成功案例 | 加盟我们 | 客户服务 | 联系我们 |
工况监测
    地址:北京市朝阳区汤立路218号明天·STUDIO·A座
    电话:0086-10-8467  8879      TEL:0086-133  6699  5587   (电话推销勿扰)
    版权所有:新企力(北京)检测服务有限公司   工作时间:(周一至周五  8:30-17:30)
    邮箱:web#xqili.com   京ICP备15050323号  
关闭