从2013年1月李彦宏提出设立深度学习研究院到今天,百度全面发展人工智能战略已经整整50个月。在这50个月里,百度没有将人工智能锁在实验室里,而是走了一条与众不同的实用主义之路。
◆ 百度的AI基因
百度在人工智能领域布局之早、力度之大在中国互联网公司中堪称榜首,连马化腾都在刚刚结束的IT领袖峰会上都承认:“在人工智能领域,Robin(百度)走的更靠前,腾讯还是落后不少的”。
百度如此激进,或许因为移动红利的错失让其倍感压力。不过,百度现在已经找到了反攻方向。
据不完全统计,李彦宏去年在公开场合共提到了513次人工智能,更是在2016年百度世界大会上,宣布百度将彻底转型为一家人工智能公司。百度研究院院长林元庆在接受专访时曾表示:“外界确实有很多误会,觉得百度突然提人工智能,是不是在赶潮流。完全不是,百度从产品和用户需求出发,在人工智能技术上已经布局很多年,如今人工智能已经成为百度最核心的技术,对产品的贡献也非常重要,这种战略过渡在百度内部看来是顺势而为,一点也不突兀。”
人工智能技术已经融入到了百度各层级的产品中,其中百度搜索是人工智能技术应用的典型代表。从关键词的分析到结果的提取和排序,都融合了百度的人工智能技术。对于一些答案非常明确的问题检索,比如“奥巴马戴的手表是什么”,人工智能技术会自动解析问题的含义,提出信息点,然后在搜索结果中直接给出答案。搜索操作看起来好像是非常简单的数据库检索排序,但是林元庆院长告诉我们如果要得到准确合理的结果,背后离不开人工智能技术的支持。
“人工智能要对返回的结果自动过滤,一些反动的、涉黄的内容都不能出现。如果用户搜索一个词语,结果中包含图像信息的,人工智能还需要对图像信息有理解。如果用户直接搜索一张图片,人工智能要能够了解图片中的信息,再调取结果。”在百度人工智能图像识别能力逐步提升后,百度为大部分搜索结果都会匹配一张图片,帮助用户直观了解每一条搜索结果的内容。
百度研究院院长林元庆
在百度金融事业部,人工智能技术的重要性完全不亚于搜索业务。身份认证是金融行业所有业务至关重要的基础,如何能够在线上完成人脸识别和身份认证,且精准度跟线下一致,是对人工智能技术最大的考验,如果百度能够达成,将在金融领域收获极大的发展空间。“征信领域,如果百度在大数据、人工智能上做的足够好,我们能够知道用户的信用好不好,偿还贷款的可能性有多大,金融领域我们就有很大的机会。金融我们很难跟银行比,我们能比的就是人工智能能力。”
另外,百度在无人车领域正在积极尝试,希望用人工智能改变整个出行行业;在人机交互方面,度秘OS操作系统也在逐步扩展更多的合作伙伴……
人工智能已经成为百度每一个产品的基因,林元庆将人工智能比作工业革命时期的蒸汽机,将给百度以及整个产业带来新一波的升级,通过与各行各业的深度融合,掀起新一轮的经济热潮。
◆ 《最强大脑》——百度AI的“图灵测试”
在AlphaGo、Master相继横扫人类围棋高手之后,人机大战迎来了电视史上的首秀。在以人类脑力竞技为主要诉求的电视科学竞技真人秀节目《最强大脑》上,作为人工智能代表的百度“小度”机器人与人类选手进行了对决,最终以微弱优势摘得“脑王”桂冠。
人类大脑对决人工智能
半年前,百度接到了江苏卫视《最强大脑》节目组的邀约,希望进行一场人机对决。虽然仅被告知对决主题是人脸识别,并不知道详细比赛规则,时任百度首席科学家的吴恩达和IDL(百度深度学习实验室)负责人的林元庆还是非常兴奋的,他们将这次节目的录制当成了一次特殊的“图灵测试”。“之前有人做过普通人跟机器的PK,但是机器和这些脑王的PK还是第一次,我们也希望看看我们的人工智能技术究竟能达到什么水平,这个项目做下来,对我们整个人脸识别技术的促进还是非常大的。”林元庆在采访中表示。
这场人机对决比拼的是人脸识别中的跨年龄识别任务,共分两轮:第一轮,在现场表演嘉宾的动态录像表演中,挑出与2张童年照相对应的2位表演嘉宾。第二轮,从30张小学集体照中找出现场一位已经30岁以上的观众的位置。由于在第一轮第2个对象的识别中,“小度”在双胞胎中成功找到了匹配对象,而人类选手失利,导致最终总比分“小度”3:2战胜人类选手。
百度的人脸识别技术采用的是深度学习的算法,通过人脸检测、人脸图像预处理、人脸图像特征提取、人脸图像匹配与识别四个步骤完成最终的人脸识别任务。
百度的人脸识别流程图
第一步,人脸检测。机器根据人脸器官以及相互之间的几何位置关系来检测人脸以及大小、位置等信息。
机器人脸检测
第二步,人脸图像预处理。机器将对图片进行灰度校正、噪声过滤、人脸对准、人脸图像增强等预处理。
第三步,人脸图像特征提取。机器将人脸分成七个部分,提取相应的特征,这也是对人脸进行特征建模的过程。
人脸图像特征提取
第四步,人脸图像匹配与识别。将待识别的人脸特征与已得到的人脸特征模板进行比较,根据相似程度对人脸的身份信息进行判断。
《最强大脑》中设置的识别跨年龄人物的脸是人脸识别中比较难的课题,除了受到光照、表情、遮挡、姿态等因素的影像,年龄的变化也给机器学习造成了极大障碍。由于跨年龄的训练数据收集难度比较大,也限制了机器基于大数据的深度学习过程。
根据林元庆介绍,针对人脸识别,百度已经建立了一个包含200万人、2亿数据的图片库作为训练样本数据,因此在内部数据上,截止到2016年9月,百度的人脸识别技术已经可以做到2.3%的错误率。
通过《最强大脑》这次“图灵测试”之后,百度在通用人脸识别能力基础上做了很多优化,节目录制完成后,百度与宝贝回家平台合作,将人工智能的跨年龄人脸识别技术应用于寻找走失儿童中,超过6万条寻亲图片数据接入百度跨年龄人脸识别系统进行对比分析,通过对孩子与父母上传的照片做比对,已经初步筛选出30例疑似案例,并且成功帮助一位33岁男子寻找到亲人。
◆ 百度AI的闭环生态
人工智能的发展离不开三大元素:深度学习、计算、大数据,但是在百度AI的逻辑中还包含至关重要的第四元素——应用。在百度看来,人工智能走出实验室拥抱具体应用和产品意义重大。
这个观念与百度年初刚刚空降的“救兵”陆奇的观念非常契合,陆奇虽然是技术出身,但是却有超强的实用理念,他在加盟百度的第一天就强调人工智能系统不能脱离应用,如果没有应用就没有数据,就没办法继续开发新产品。
至此,百度AI的完整生态闭环体系就非常清晰了。从深度学习模型的建立,到大数据的引入,再到大计算进一步处理,最终落地到具体的应用产品,之后再吸纳新的用户数据继续训练深度学习模型,如此反复,形成一个完整的闭环生态。“人工智能技术研发非常重要的是闭环,我们只有把这个东西用在产品上,才能把这个闭环建起来。百度拥有上百条产品线,很多都跟人工智能有非常好的对接,我们在这个平台上做研发,很快就实现应用。”林元庆博士在采访中提到。
虽然建立了完整的闭环生态体系,但是百度并没有将人工智能变成封闭体系,而是要打造一个开放的平台。去年9月,百度宣布将2013年自主研发的深度学习平台Paddle Paddle正式开源,百度成为Google、Facebook、IBM之后又一家将人工智能技术开源的公司。今年4月19日,百度正式开放自动驾驶平台并取名“阿波罗(Apollo)”计划,将向合作伙伴提供一个开放、完整、安全的软件平台,帮助他们结合车辆和硬件系统,快速搭建一套属于自己的完整的自动驾驶系统。
林元庆博士透露,除了AI技术开源,百度还将开放计算平台和数据平台。人工智能对机器能力的要求非常高,搭建机房、购买昂贵的GPU和适配高电流输出的电源设备、配备降低能耗的水冷装置、维护监管的人力成本…要搭建一个人工智能计算平台需要投入相当大的人力物力成本。未来,百度将会直接开放学习计算平台,对于想要深度学习的单位和个人,一个百度账号就可以直接使用百度的计算平台。未来,百度还会将部分大数据直接预装在计算平台,用户不再需要耗费几个月的时间单独上传大量数据。
3月2日,百度联合清华北大以及研究机构组建的深度学习技术及应用国家工程实验室在北京挂牌成立,百度大脑正式进入人工智能“国家队”。“百度大脑”能否进化为“中国大脑”还是未知数,不过林元庆博士表示,百度将和国内领先的科研单位一起,定义国家和行业最前沿的研究方向,百度将提供资源、数据和平台让全球的科学家一起研究和突破,推动行业的发展。
2017年,百度从“移动先行”继续向“AI先行”的战略推进,人工智能已经成为百度乃至整个互联网的“下一幕”。但是,曾经在08年奥运会就提出的“刷脸进场馆”技术直到十年后的今天都还没有真正大规模普及,人工智能要走的路还很长。不过在互联网的“下半场”里,曾经的搜索引擎百度,已经越过了人工智能的起跑线。