顶级科学家描画大数据未来 百度深度学习领跑人工智能

2013.11.04

2013年11月,百度亮相全球软件开发大会QCon上海2013。在会上,百度IDL首席科学家张潼发表了大数据及深度机器学习的演讲,展示了百度IDL(深度学习研究院)取得的成绩,引起了全球软件开发人员的浓厚兴趣。

百度IDL首席科学家张潼亮相 揭示深度学习四大成功条件

作为机器学习领域的知名学者,百度 IDL首席科学家张潼的亮相引起了专业观众的关注。张潼1999年获得美国斯坦福大学计算机系博士学位,曾任职于美国IBM研究院及雅虎研究院,在机器学习、数据挖掘、自然语言处理、优化算法,及统计学等领域发表多篇论文,曾担任国际上主要机器学习机构NIPS、ICML的Area Chair和COLT主席。

会上,张潼回顾了大数据处理技术的发展和变革,指出大数据分析的主要工具,机器学习的方法也在不断创新,如深度学习技术,就在近些年取得了许多令人振奋的成果并在多个国际大型项目中运用,如2012年6月谷歌大脑项目、2012年11月微软智能同声传译项目、2013年9月facebook用户数据和社交关系挖掘项目。

张潼认为,近年来深度学习的成功条件可以归纳为“大数据+大规模计算能力+复杂模型+高效算法”,近年来,深度学习的训练数据每年成倍增长,图像达到数千万训练样本、语音达到数百亿训练样本、广告达到数千亿训练样本;而与此同时,多机GPU/CPU分布式计算能力也得到显著加强,模型上则由大型线性模型演进到树模型,可把特征发到不同机器;在算法上,则应用了深度神经网络等分布式算法。

百度机器学习成就:错误率降低30%,准确率升100%

百度在2012年夏季开展了深度学习方面的工作。2013年,百度IDL(深度学习研究院)成立,面向全球延揽一流学术人才,人才布局日趋完整,在深度学习上也取得了巨大成功,如用GPU提升计算效率,处理海量训练数据,语音识别,OCR识别,人脸识别,图像搜索水平得到巨大提升,到目前为止,已经有超过8项深度学习技术在百度产品上线。

百度与谷歌相似图片检索结果对比

深度学习对百度的影响深远,如语音,错误率相对降低20-30%;OCR,错误率相对降低30%;人脸识别,LFW测试世界领先,世界上首个全网人脸搜索引擎;全网相似图像搜索,效果显著超越国际搜索引擎同类产品;全流量上线广告CTR预估,提升CTR3.7%;基于深度学习的色情图像识别准确率超过传统方法100%,用于贴吧图搜黄反作弊。

百度机器学习发展路径:理论创新+应用实践

在深度学习方面,百度已经在学术理论、工程实现、产品应用等多方位取得了显著的进展,已经成为业界推动“大数据驱动的人工智能”的领导者之一,提交国家专利22项。在第30届国际机器学习大会(International Conference on Machine Learning, ICML 2013)上,百度IDL常务副院长余凯博士与美国佐治亚理工学院学者合作的有关深度学习的论文“Smooth Sparse Coding via Marginal Regression for Learning Sparse Representations”获得大会最佳论文奖银奖;基于深度学习人脸识别技术的PK大咖获得2013艾菲奖大中华区金奖。

在图像技术应用中,传统的从图像到语义的转换是极具挑战性的课题,业界称其为语义鸿沟。百度深度学习算法构造出一个多层非线性层叠式神经元网络,能够很好地模拟视觉信号从视网膜开始逐层处理传递,直至大脑深处的整个过程。这样的学习模式能够以更高的精度和更快的速度跨越语义鸿沟,让机器快速对对图像中可能蕴含的成千上万种语义概念进行有效地识别,进而确定图片的主题。

在人脸识别方面,最困难的是识别照片中的人是谁或者通过照片寻找相似的人。百度在深度学习的基础上,借鉴认知学中的一些概念与方法,探索出了独特的相似度量学习方法来寻找图像的相似性和关联,能够做到举一反三。

在深度神经网络训练方面,伴随着计算广告、文本、图像、语音等训练数据的快速增长,传统的基于单GPU的训练平台已经无法满足需求,为此,百度搭建了Paddle(Parallel Asynchronous Distributed Deep Learning)多机并行GPU训练平台。数据分布到不同的机器,通过Parameter Server协调各机器进行训练,多机训练使得大数据的模型训练成为可能。

在算法方面,单机多卡并行训练算法研发,难点在于通过并行提高计算速度一般会降低收敛速度。百度则研发了新算法,在不影响收敛速度的条件下计算速度图像提升至2.4倍,语音提升至1.4倍,这使得新算法在单机上收敛速度达到图像提升至12倍、语音提升至7倍的效果。相比Google的DistBelief系统用200台机器加速约7.3倍而言,百度的算法优势更加明显。

目前普遍认为深度学习是最接近人脑的复杂模型,也是目前向人工智能走得最近的方法,将会在百度得到越来越多的应用,同时,深度学习也将使得百度的智能性大为增强。以张潼等为代表的百度科学家群体,对深度学习的未来发展充满信心。