未加星标

谷歌AutoML凭什么成为“下一代AI黑科技”?深度学习

字体大小 | |
[商业智能 所属分类 商业智能 | 发布者 店小二04 | 时间 | 作者 红领巾 ] 0人收藏点击收藏

谷歌AutoML凭什么成为“下一代AI黑科技”?深度学习
网络
谷歌AutoML凭什么成为“下一代AI黑科技”?深度学习
模型
谷歌AutoML凭什么成为“下一代AI黑科技”?深度学习
架构
谷歌AutoML凭什么成为“下一代AI黑科技”?深度学习
机器学习
谷歌AutoML凭什么成为“下一代AI黑科技”?深度学习
神经网络

为什么我们需要 AutoML?

在谈论这个问题之前,我们需要先弄清楚机器学习的一般步骤。

其实,不论是图像识别、语音识别还是其他的机器学习项目,其结构差别是很小的,一个效果好的模型需要大量的经验来调优。实现过程有以下步骤:


数据预处理

特性选择

模型算法选择

调参

上线后模型的再优化

效果评估


在 AI 浪潮再次兴起的背景下,许多企业都对 AI 跃跃欲试,但因为相关人才在全球都呈现稀缺,企业想招人也不见得招得到,要不就是得重金聘请,像是美国顶尖 AI 科学家的年薪已经达到美国国家美式足球联盟(NFL)四分卫的水平(平均 270 万美金 / 年),甚至还有的已经超过 NBA 球星的平均薪水(2017 年数据:平均 800 万美金)。因此,对有意尝试或导入 AI 的企业来说,“让机器学习得以自动化”具有很大的吸引力。


深度学习技术往往比较复杂,从头开发的难度较大,有一些公司提供了能帮助开发者轻松使用深度学习的自动化深度学习(ADL)平台,比如微软的 CustomVision.AI、谷歌的 Cloud AutoML,国内诸如第四范式、智铀科技等公司也推出了 AutoML 平台。作为 AI 前线 AutoML 专题文章的第一篇,本文将重点介绍谷歌的 Cloud AutoML。


谷歌 Cloud AutoML

概况

AutoML 的概念源自 2012 年学术界提出一个新观念——Programming by Optimization(PbO),字面上的意思是指以最优化程序开发,乍听之下似乎看不出个所以然,这却是一个相当创新的观念,实质上就是要解决编程时人工调校参数的问题。


今年 1 月,谷歌发布了 Cloud AutoML。北京时间 1 月 18 日凌晨时分,李飞飞连发三条推特,发布了谷歌 AI 产品——Cloud AutoML Vision,“无需精通机器学习,每个人都能用这款 AI 产品定制机器学习模型。”

链接:https://cloud.google.com/automl



谷歌AutoML凭什么成为“下一代AI黑科技”?深度学习

AutoML Vision 是 Cloud AutoML 这个大项目推出的第一项服务,提供自定义图像识别系统自动开发服务。根据谷歌介绍,即使是没有机器学习专业知识的的小白,只需了解模型基本概念,就能借这项服务轻松搭建定制化的图像识别模型。 只需在系统中上传自己的标签数据,就能得到一个训练好的机器学习模型。整个过程,从导入数据到标记到模型训练,都可以通过拖放式界面完成。


除了图像识别,谷歌未来还计划将 AutoML 服务拓展到翻译、视频和自然语言处理等领域。


解析

Google Cloud AutoML 服务使用了三个核心技术,分别是:神经架构搜索技术(Neural Architecture Search Technology)、 learning2learn 以及迁移学习 (transfer learning) 。


通过这些技术把参数以及结构的调整交给机器。运作的概念是机器利用神经架构搜索技术不断测试,找出一个好的参数+神经网络结构的组合,AI 开发人员觉得这个组合不错,认可了之后,机器就会记住,下一次就会做得更快更精准,这就是 learning2learn;或是可以将此组合转移到另外的应用场景下使用,这就是迁移学习。


AutoML 神经架构

通常来说,机器学习模型是由工程师和科学家小组精心设计的。手动设计机器学习模型的过程是很困难的,因为所有可能的模型的搜索空间可以组合地大,典型的 10 层网络一般具有 10^10 个候选网络。出于这个原因,设计网络的过程往往需要大量的时间和具有重要机器学习专业知识的人进行实验。



谷歌AutoML凭什么成为“下一代AI黑科技”?深度学习

GoogleNet 架构。这个网络的设计需要从卷积体系结构的初始版本进行多年的仔细实验和改进。

为了使机器学习模型的设计过程更容易获得,谷歌一直在探索使机器学习模型的设计自动化的方法。在他们研究的许多算法中,演化算法和强化学习算法表现出了很大的希望。


在谷歌内部被称为 Auto ML 的方法中,一个控制器神经网络可以提出一个“子”模型架构,然后可以在特定任务中对其进行训练和评估质量。之后,这种反馈被用来通知控制器如何改进其下一轮提案。经过数千次的重复,新的体系结构生成了。最终,控制器学习为空间区域分配高可能性,以在保持出来的验证数据集上实现更高的准确性,并且对建筑空间区域得分较低的区域的可能性低。以下是这一过程的样子:



谷歌AutoML凭什么成为“下一代AI黑科技”?深度学习

这种方法已经被谷歌应用于深度学习中的两个高度基准测试数据集:使用 CIFAR-10 进行图像识别以及使用 Penn Treebank 进行语言建模。在这两个数据集上,该方法可以设计出与机器学习专家设计的较先进模型相媲美的模型。


那么,它会产生什么样的神经网络?举一个例子:经过训练的经常性架构可以预测 Penn Treebank 数据集中的下一个单词。这里左边是由专家设计的神经网络。右边是上述方法创建的经常性架构:



谷歌AutoML凭什么成为“下一代AI黑科技”?深度学习

机器选择的体系结构确实与人体设计共享一些共同特征,例如使用加法将输入和以前的隐藏状态组合在一起。但是,有一些值得注意的新元素 :例如,机器选择的体系结构包含乘法组合(右图中最左边的蓝色节点,标记为“ elem_mult ”)。这种类型的组合对于经常性网络并不常见,这可能是因为研究人员没有看到明显的好处。有趣的是,这种方法最简单的形式最近由人类设计师提出,他们也认为这种乘法组合可以实际上减轻梯度消失 / 爆炸问题,这表明机器选择的架构能够发现一种有用的新型神经网络架构。


这种方法也可以证明为什么某些类型的神经网络工作得很好。这里右边的架构有很多通道,所以梯度可以倒退,这可能有助于解释为什么 LSTM RNN 比标准 RNN 更好地工作。


迁移学习

迁移学习 (Transfer learning) 顾名思义就是就是把已学训练好的模型参数迁移到新的模型来帮助新模型训练。

考虑到大部分数据或任务是存在相关性的,所以通过迁移学习可以将已经学到的模型参数(也可理解为模型学到的知识)通过某种方式来分享给新模型从而加快并优化模型的学习效率不用像大多数网络那样从零学习(starting from scratch,tabula rasa)。


Cloud AutoML 通过迁移学习(Transfer Learning)将已训练完成的模型,转移到新的模型训练过程。这样,能够用较少量数据训练出机器学习模型。对于医疗领域而言,这点尤为重要,因为在为罕见疾病和一些特殊案例建模时,往往无法取得足够的训练数据。


Learning2learn

Cloud AutoML 通过 learning2learn 功能自动挑选适合的模型,搭配超参数调整技术(Hyperparameter tuning technologies)自动调整参数。


AutoML 面临的挑战

谷歌人工智能部门的掌门人 Jeff Dean 对 Auto ML 的出现感到兴奋,因为它帮助 Google“自动解决问题”,但对 AutoML 的使用也提出了独特的问题。

Dean 表示:“由于我们使用的是比传统手工编码软件更多的系统,我认为这给我们带来了很多挑战,我们正在处理这些问题。如果你从数据中学习并且数据已经对它做出了偏差决定,那么学习的机器学习模型本身会使这些偏见永久化。所以我们正在做很多工作,同机器学习社区中的其他人一起,努力研究如何培训没有偏见形式的机器学习模型。”


另一个挑战:如何使用 AutoML 正确设计安全关键系统,为医疗保健等行业创建 AI。已经建立了数十年的计算机科学较佳实践,以便对这些系统进行手工编码,机器制造机器也必须执行相同的步骤。


Dean 表示:在分类狗的种类时发现错误是一回事,但是在安全关键系统中犯下错误完全是另一回事。他说:“我认为这对我们来说是一个非常有意义且重要的应用方向,特别是当我们开始在更安全的关键系统中进行机器学习,比如对医疗保健或自动驾驶汽车进行决策。”


除了谷歌自家大佬提出的一些问题,其他专家也都对 AutoML 发表过看法。


一位不愿透露姓名的技术专家告诉 AI 前线,Cloud AutoML 目前推出的第一项服务是针对 Vision 的,ImageNet 数据集够好够大,所以大多情况下确实能够迁移出不错的效果,而且视觉现在属于比较好做的领域了,如果是 NLP、CTR 这些领域,则要难很多。大家现在有点“谷歌做的肯定都是好的”的心理,不得不说谷歌 PR 能力确实厉害。


当然,通过迁移学习实现 AutoML 这件事情本身确实给了从业者很大的想象空间,可以打破数据孤岛,更低成本地解决更多问题,比如用电商的数据去做传统行业的推荐,或者一个新公司没有数据但可以用其他公司或行业数据来做事情。


谷歌介绍称 AutoML Vision 提供了简洁的图形化用户界面,只需导入数据和拖拽组件就能打造全新模型,更有媒体报道直接突出“无需写一行代码”,那么真的可以不用写代码吗?这位专家讳莫如深地告诉 AI 前线:“不写代码容易做,不写代码能做出好结果难呀。”


What`s Next?

对于整个 AI 领域来说,AutoML 一定是下一个时代发展重点,并且极有可能是机器学习的“大杀器”。但是,对于大多数企业来说,哪怕是谷歌这样的大厂,AutoML 仍然是一个新兴的领域,所有人都在摸索,谁能先人一步抢占技术先机就显得尤为重要。


然而在前不久举办的谷歌 I/O 开发者大会上,除了 Jeff Dean 偶尔提到了 AutoML 以外,并没有任何的专题演讲来对 AutoML 的进展进行讲述,更是让人感觉到这一新型技术的神秘和巨大潜力。


除了谷歌,在国际上如微软这样的大厂也已入局,本系列之后的文章也会提到。当然,各位读者可千万不要以为 AutoML 这样的服务只有国外用户才能享受到,在国内,也有一批公司推出了自家的 AutoML 平台,令人惊喜的是,它们当中有相当一部分是初创公司,在本系列中,我们还会介绍几个国产的 AutoML 平台,请拭目以待!


参考链接

http://developers.googleblog.cn/2017/11/automl.html

https://zhuanlan.zhihu.com/p/27792859

https://www.datasciencecentral.com/profiles/blogs/automated-deep-learning-so-simple-anyone-can-do-it

http://www.mittrchina.com/news/1582

https://www.zhihu.com/question/41979241/answer/123545914

https://www.jianshu.com/p/1430dcc71d15


欢迎加入本站公开兴趣群

商业智能与数据分析群

兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识

QQ群:418451831

tags: AutoML,学习,模型,AI,机器,谷歌,Cloud,数据,架构,com,神经,迁移,训练,设计
分页:12
转载请注明
本文标题:谷歌AutoML凭什么成为“下一代AI黑科技”?深度学习
本站链接:http://www.codesec.net/view/577207.html
分享请点击:


1.凡CodeSecTeam转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
登录后可拥有收藏文章、关注作者等权限...
技术大类 技术大类 | 商业智能 | 评论(0) | 阅读(75)