百度吴甜分享开源深度学习平台飞桨四大领先技

作者:广东十一选五-林业

中新网11月3日电 深度学习技术能让文化底蕴浓厚的老茶馆换上科技的“新装”,也能让原本1周的工作量缩短为1个小时,且效果更佳……这些看似稀奇的事已经随着深度学习技术的发展成熟逐渐普及。

11月2日,2019 AIIA人工智能开发者大会主论坛上,百度AI技术平台体系执行总监、深度学习技术及应用国家工程实验室副主任吴甜分享了百度开源深度学习平台飞桨的多项领先技术,飞桨成为改变人们生活的“助攻者”之一,同时也是开发者最想快速掌握的深度学习平台。

作者:赵广立 来源: 中国科学报 发布时间:2019/12/16 14:41:45 选择字号:小 中 大 我国自主深度学习平台比肩国际主流

11月1-2日,“2019 AIIA人工智能开发者大会”在杭州重磅开启。主论坛上,百度AI技术平台体系执行总监、深度学习技术及应用国家工程实验室副主任吴甜所分享的百度开源深度学习平台飞桨,正是改变人们生活的“助攻者”之一,同时也是开发者最想快速掌握的深度学习平台。会上,百度与中国人工智能产业发展联盟(AIIA)联合成立的人工智能人机对话联合实验室正式揭幕。

吴甜介绍,在人工智能领域,深度学习技术出现后,标准化、自动化程度大幅提升,以往需要反复调节的东西,都统一在深度学习框架下。技术足够通用,则意味着大规模产业应用的发端。

深度学习框架扮演着AI产业操作系统的角色,是AI产业生态的核心平台和基础。

现场,吴甜分享到:“‘源’开则行,‘机’智则灵,此次会议的主题也是百度飞桨开源开放的初心。当前深度学习技术已推动人工智能技术进入新阶段,我们期待与开发者们一道推进深度学习技术标准化、自动化、模块化,不断降低门槛,共拓产业智能浪潮。”

深度学习框架正是其中的核心,通常而言,人工智能算法从研发到部署是一套庞大的系统工程,深度学习框架作为通用性的底层支持平台,可实现算法训练和模型部署的高效流程化和深度神经网络模型设计自动化。在减少人员参与而不牺牲训练质量的条件下,大幅提高算法生产效率。

■本报记者 赵广立

当下,人工智能已经成为新一轮科技革命和产业变革的核心驱动力量,人工智能技术已从人工规则、机器学习发展至当前,以深度学习技术为核心的新阶段。而深度学习之所以带来深刻变化,其通用性优势是关键。

吴甜表示,深度学习框架下接芯片,上承各种业务模型、行业应用。类比来说,深度学习框架可以看作是智能时代的操作系统。通过对底层语言和重要算法模型进行封装,能有效帮助开发者面对大规模产业化实践过程中,在开发、训练、部署等方面面临的多种挑战。

近日,百度公司宣布旗下飞桨深度学习开源开放平台又一次迎来20多项功能发布和技术升级。这些发布和升级包括提升核心框架性能和易用性、新增产业级模型库、发布端侧推理引擎PaddleLite、发布面向产业应用场景的端到端开发套件等。

现场,吴甜以自然语言处理等经典人工智能问题为例进行了阐释。例如做机器翻译系统,在人工规则阶段,需要依赖语言学家的专业知识来编写规则,开发成本高且迁移困难。有了机器学习后,如MaxEnt等可以从数据里自动学习、训练模型但仍存在模型选择及算法调试复杂等问题。而深度学习技术出现后,标准化、自动化程度大幅提升,以往需要反复调节的东西,都统一在深度学习框架下。技术足够通用,则意味着大规模产业应用的发端。

百度在多年深度学习和人工智能技术的积累和业务实践的基础上,研发了“飞桨产业级深度学习开源开放平台”,自2016年正式开源以来,如今飞桨已经成长为集核心框架、模型库、开发套件、工具组件和服务平台为一体,功能完备、全面开源开放的产业级深度学习平台。

百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰向《中国科学报》表示,功能发布和技术升级后,飞桨平台的深度学习模型开发能力、训练能力、预测和部署能力进一步提升,可比肩TensorFlow、PyTorch等国际主流框架,在多项技术上有优于后者的表现。

深度学习框架正是其中的核心,吴甜表示,深度学习框架下接芯片,上承各种业务模型、行业应用。类比来说,深度学习框架可以看作是智能时代的操作系统。通过对底层语言和重要算法模型进行封装,能有效帮助开发者面对大规模产业化实践过程中,在开发、训练、部署等方面面临的多种挑战。

吴甜介绍,目前百度飞桨拥有四大领先技术。包括:

智能时代的操作系统

基于这一洞察,百度在多年深度学习和人工智能技术的积累和业务实践的基础上,研发了“飞桨产业级深度学习开源开放平台”,自2016年正式开源以来,如今飞桨已经成长为集核心框架、模型库、开发套件、工具组件和服务平台为一体,功能完备、全面开源开放的产业级深度学习平台。

第一,开发便捷的产业级深度学习框架。飞桨深度学习框架采用基于编程逻辑的组网范式,对于普通开发者而言更容易上手,符合他们的开发习惯。同时支持声明式和命令式编程,兼具开发的灵活性和高性能。网络结构自动设计,模型效果超越人类专家。

深度学习框架上承各种应用、下接芯片等硬件,起到了承上启下的作用,是智能时代的操作系统。王海峰说,然而,在2016年之前,国内外开发者主要基于谷歌TensorFlow、脸书PyTorch、亚马逊MxNet等国外深度学习框架进行人工智能算法、模型的开发、训练与部署。

吴甜介绍,目前百度飞桨拥有四大领先技术。包括:

第二,超大规模深度学习模型训练技术。飞桨突破了超大规模深度学习模型训练技术,实现了世界首个支持千亿特征、万亿参数、数百节点的开源大规模训练平台,攻克了超大规模深度学习模型的在线学习难题,实现了万亿规模参数模型的实时更新。

百度飞桨的开源开放及不断升级打破了这一局限。尤其是经过多轮升级和打磨之后,如今飞桨平台在深度学习框架的开发、训练、预测及部署等核心能力上均有着比肩甚至超越国外主流框架的表现。这使得我国人工智能技术开发者和使用者不必依赖于国外平台,同时还可进一步培育自主可控的AI开发应用生态。

第一,开发便捷的产业级深度学习框架。飞桨深度学习框架采用基于编程逻辑的组网范式,对于普通开发者而言更容易上手,符合他们的开发习惯。同时支持声明式和命令式编程,兼具开发的灵活性和高性能。网络结构自动设计,模型效果超越人类专家。

第三,多端多平台部署的高性能推理引擎。飞桨不仅兼容其他开源框架训练的模型,还可以轻松地部署到不同架构的平台设备上。同时,飞桨的推理速度也是全面领先的。尤其经过跟华为麒麟NPU的软硬一体优化,使得飞桨在NPU上的推理速度进一步突破。

飞桨是我国目前唯一具有完全自主知识产权的全功能性产业级深度学习平台,包括核心框架、模型库、开发套件、工具组件和服务平台五大部分。百度技术团队自2018年以来对飞桨进行了全面升级,并进行大规模推广。

第二,超大规模深度学习模型训练技术。飞桨突破了超大规模深度学习模型训练技术,实现了世界首个支持千亿特征、万亿参数、数百节点的开源大规模训练平台,攻克了超大规模深度学习模型的在线学习难题,实现了万亿规模参数模型的实时更新。

第四,覆盖多领域的产业级开源模型库。飞桨官方支持100多个经过产业实践长期打磨的主流模型,同时开源开放200多个预训练模型。机器视觉、自然语言理解、强化学习等多领域模型曾在国际竞赛中夺得20多项第一。

优于国外框架的使用体验

第三,多端多平台部署的高性能推理引擎。飞桨不仅兼容其他开源框架训练的模型,还可以轻松地部署到不同架构的平台设备上。同时,飞桨的推理速度也是全面领先的。尤其经过跟华为麒麟NPU的软硬一体优化,使得飞桨在NPU上的推理速度进一步突破。

在2019乌镇世界互联网大会上,百度飞桨还获评“世界互联网领先科技成果”。截止目前,飞桨深度学习平台已累计服务150多万开发者,仅在定制化训练平台上就有超过6.5万企业用户,发布了16.9万个模型。

近两年来,飞桨围绕深度学习框架的基本功能、性能、芯片支持的完备性等技术指标进行了一系列的易用性开发和性能迭代,为开发者提供了优于国外框架的使用体验。

第四,覆盖多领域的产业级开源模型库。飞桨官方支持100多个经过产业实践长期打磨的主流模型,同时开源开放200多个预训练模型。机器视觉、自然语言理解、强化学习等多领域模型曾在国际竞赛中夺得20多项第一。

同时,在大会上,百度与中国人工智能产业发展联盟联合成立的人工智能人机对话联合实验室正式揭幕。

在开发能力方面,飞桨除了支持对常用API的调用之外,还在编程范式上同时支持声明式编程和命令式编程,兼具很好的灵活性和稳定性,可满足不同开发者的开发习惯,更易上手。另外,飞桨提供了自动化网络结构设计这一工具,在多个任务上实测显示自动化设计水平已超过人类专家。

除核心框架外,飞桨还拥有完备的工具组件、面向任务的开发套件、产业级服务平台等全方位助力产业应用。吴甜在会上分享了一组数据,截止目前,飞桨深度学习平台已累计服务150多万开发者,仅在定制化训练平台上就有超过6.5万企业用户,发布了16.9万个模型。

图片 1

百度深度学习技术平台部总监马艳军告诉《中国科学报》,该领域顶级学术会议之一AAAI第一篇有关图像风格迁移网络的自动化网络结构设计的论文即来自百度飞桨技术团队。

11月1日的2019AIIA百度飞桨公开课上,众多慕名而来的开发者们参与实战,与百度资深工程师一道深度了解飞桨的特性、设计思路、深度学习算法开发及端侧部署全流程实践方案。

在训练方面,飞桨平台突破了超大规模深度学习模型训练技术,研制了千亿特征、万亿参数、数百节点的开源大规模训练平台,实现了万亿规模参数深度学习模型的实时更新。

飞桨备受瞩目的背后,是对产业切实的帮助。基于飞桨,百度、北京林业大学等合作开发,面向智能虫情监测系统“AI识虫”识别准确率能达到90%,原本1周的工作量只需1个小时即可完成。在飞桨的帮助下,百度与老舍茶馆打造了一套能够智能辨别茶叶品种特色的AI系统,不仅拥有丰富的茶叶知识储备,在快速分析后,还可在短时间内识别并判断茶的品类……

当前国际主流的开源框架还停留在仅支持千亿参数或更低规模的模型训练的水平,飞桨这一突破解决了大规模产业应用的难题。王海峰说,有的大型科技公司每天会有百亿级数据量,所需模型规模参数量达万亿级别,这要求深度学习平台的训练能力与之匹配。例如,OPPO在应用商店的应用推荐场景,使用基于飞桨的分布式训练技术,训练速度相比单机TensorFlow提升8倍。

责任编辑:刘迅

在预测、部署环节,飞桨技术团队在各类硬件适配上做了大量工作,当前可以轻松地部署到X86 CPU、英伟达GPU、Mali GPU、华为NPU等8种不同架构的平台设备上,并在对华为、寒武纪等国产AI芯片的适配方面取得了显著效果。比如在华为麒麟芯片上,无论推理速度还是能效都有大幅提升。

同时,飞桨平台和其他开源框架训练的模型也能无缝衔接,可进一步突破模型推理速度。

产业级应用要求很苛刻,推理速度快的优势尽显。比如质检线上一个零件的停留时间只有数十毫秒,如果推理速度不够,可能导致机器无法及时完成缺陷识别。马艳军举例说,飞桨下大力气结合许多苛刻场景做了性能优化,目的就是推动飞桨在工业场景的应用。在已上线飞桨计算机视觉相关模型的上海和辉光电OLED及重庆京东方LCD不良检测项目中,产品漏检率、过检率相较应用前均有数倍提升。

评测数据显示,通过采用CPU全异步并行,飞桨平台在点击率预估模型、词向量模型上比TensorFlow快8~10倍;在GPU多机多卡同步训练下,飞桨在多个模型下评测训练速度比TensorFlow快30%~70%。

在上述能力强化的基础上,飞桨官方支持100多个经过长期产业实践打磨的主流模型,其中包括在国际竞赛中夺得冠军的模型,同时开源开放200多个预训练模型,以助力快速产业应用。

培育自主可控的AI生态

统计数字显示,飞桨当前拥有超过6.5万企业用户,在定制化训练平台上发布了16.9万个模型,且模型数量呈现显著增长趋势,在工业、农业、服务业等各行各业中广泛应用。同时,飞桨已经累计服务150万开发者,这一数字约占中国软件从业平均人数的1/4。

不过,与TensorFlow等相比,飞桨在生态构建上仍然有较大发展空间。生态体系不是一朝一夕培育起来的,国外框架几年前就开始在中国大规模推广了,目前渗透很深。王海峰说,我们希望有关多方围绕深度学习框架和平台这个核心形成合力,下大力气培育自主的生态体系。

中国科学院计算技术研究所研究员陈云霁今年发表在《中国计算机学会通讯》上的《智能计算系统一门人工智能专业的系统课程》一文中提到,越是人工智能上层的研究,我国研究者对世界作出的贡献越多;越是底层,我国研究者的贡献越少。

在各种ImageNet比赛中,我国很多机构的算法模型已经呈现霸榜的趋势,可以说代表了世界前沿水平。但这些算法模型绝大部分都是在CUDA编程语言、TensorFlow编程框架以及GPU之上开发的。在这些底层的硬科技中,我国研究者对世界的贡献就相对少了很多。对这一现象,陈云霁表示担忧,底层研究能力的缺失不仅给我国人工智能基础研究拖后腿,更重要的是,将使得我国智能产业成为空中楼阁,走上信息产业受核心芯片和操作系统制约的老路。

对此,王海峰表示,国产智能芯片和深度学习框架都是构建我国自主AI生态的关键,智能时代深度学习平台一定要和AI芯片对接,不仅要做软件的优化,还要软硬一体,跟芯片一起联合优化。

如果不发展自主芯片、操作系统,国内也就培养不出相应的人才维护好自己的社区,跟在别人构建的社区中修修补补是完全不一样的。我国在智能时代不能再让受制于人的历史重演,这也是百度大力做飞桨平台的意义所在。王海峰表示,无论是推动AI技术从实验室走向产业,还是自主AI生态构建,飞桨深度学习框架未来将继续发挥重要作用。

本文由广东十一选五发布,转载请注明来源

关键词: