参加卡格尔竞赛后,你可以直接派AutoML自动训练人工智能怪物参加竞赛。谷歌今天宣布,它将把云计算服务深度集成到卡格尔平台。尽管这是一项付费服务,但它提供了一套免费的试验和补贴计划。
谷歌宣布,它将把用于训练机器学习算法的云自动化服务(Cloud AutoML service)集成到数据科学平台Kaggle中。
Cloud AutoML是一个基于云的工具包,它提供了一个拖放界面来训练人工智能模型。有了AutoML,任何人都可以用最少的工作量和机器学习专业知识创建定制的机器学习模型。
Kaggle是一个供数据科学家和其他机器学习爱好者探索、分析和分享他们工作的在线社区,该社区于2017年被谷歌收购。Kaggle也是世界上最大的机器学习和数据科学竞赛平台。就在今天,谷歌宣布卡格莱社区最近达到了一个新的里程碑,拥有350万用户。
谷歌表示,通过将云计算与卡格莱集成,它正在推进其使命,即“通过向我们的数据科学家群体提供他们在该领域所需的技能和工具,使他们变得更强大”。
Cloud AutoML允许用户从软件开发工具包或基于网络的用户界面获取数据,设置一些参数,然后根据这些数据训练模型;经过训练的模型可以直接部署到谷歌的云基础设施中。
新的集成将使Kaggle用户能够在Jupyter笔记本电脑中直接使用云自动软件开发工具包,这是一个开源网络应用程序,数据科学家使用它来创建和共享实时代码、公式、可视化和叙事文本。
Kaggle产品经理Devvret Rishi说:“今天发布的重点是让我们的社区能够直接在Kaggle笔记本上使用SDK。”
Cloud AutoML是一项付费服务,但它为初学者提供免费试用。谷歌全年还为用户提供谷歌云平台(GCP)积分,帮助补贴在卡格尔使用汽车的费用,所有在GCP注册的新谷歌账户将获得300美元的补贴。
今年6月,谷歌还将BigQuery数据仓库服务与Kaggle集成。这种集成允许大查询(BigQuery)用户使用快速的SQL查询,在SQL中训练机器学习模型,并在卡格尔的Jupyter笔记本环境(称为卡格尔内核)中执行分析。
根据谷歌的说法,这种方法的优势在于用户不需要实际移动或下载数据来进行查询或机器学习。一旦用户的谷歌云帐户链接到内核笔记本或脚本,他们就可以使用BigQuery API客户端库直接在笔记本中编写查询,对BigQuery运行查询,并使用数据进行几乎任何类型的分析。
AutoML今年早些时候吸引了人们的注意力。它曾在卡格莱云时代下一个19年举办的机器学习竞赛中脱颖而出,直到最后一刻才被一群数据科学家以微弱优势淘汰。
今年4月,在8.5小时的卡格莱日(Kaggle Days)数据处理挑战赛中,有一个团队非常特别:这个由3名谷歌研究人员组成的团队并不打算自己参赛,而是使用了一款名为AutoML的人工智能软件。
200多名其他参与者来自凯格尔平台的高层。他们组成了几个小组,任务是“从一家匿名汽车零件制造商那里获取数据,通过这些数据他们可以预测工厂产出中的不良批次”。
谷歌研究人员魁克尔与同事陈明和陆逸风一起领导了汽车项目
现场悬挂着一个大屏幕,这是比赛的实时排名。参加比赛的程序员在大屏幕的阴影下努力工作。程序员通过向网站提交代码进行测试来衡量他们在比赛中的成绩,分数将实时显示在屏幕上。
弗拉基米尔·伊格洛维奇科夫,Kaggle.com头号“大师”,怀疑人工智能能否取代顶级程序员。在场的大多数人还认为人工智能软件无法与世界顶尖数据科学家的创造力相媲美。
然而,经过几个小时的竞争,令人震惊的结果出现了。AutoML提交了第一个自动生成的代码,排名第二,领先大多数团队。然而,这对谷歌的团队来说并不奇怪。这个软件是三年前用一大笔钱开发的。最初的目的是取代他们的一些工作。
领导谷歌自动开发的人工智能研究员Quotle很兴奋。他和他的团队在过去的几场卡格莱比赛中测试了AutoML,通常需要几个月而不是几个小时。他们认为AutMail可以在现场比赛中取得前10%的成绩。
到下午3点30分,汽车的胜利似乎是确定无疑的,最接近它的人类团队远远落后了。当球员们在下午5336030聚集在一起检查最终得分时,欢呼爆发了:AutMail名列第二。
AutoML赢得了99%的顶级人类程序员。
此外,在比赛中,使用AutoML的团队可以在不需要领域专业知识或监督的情况下,以更少的努力快速获得出色的表现。准备数据只需要很少的时间,但特征工程、模型选择和参数调整只需要很少的时间。
此外,在另一场IEEE竞赛中,AutoML的时间效率优势更加突出。数以千计的团队花了几周的时间才在排名中超过AutoML的基准水平。
上图显示了比赛前四周的提交分数(个人分数)和比赛开始时发布的自动表格基准分数(绿线)。蓝色虚线表示每日提交分数的90%。“自动化表”基准在竞赛的前两周超过了这一水平
AutoML的简单性和有效性使得为有数据科学问题需求的人(这些人不一定有深厚的数据科学背景)创建强大的模型成为可能。
大奖:Kaggle用户使用AutMail,每个关联账户获得300元的补贴
Cloud AutMail,这可以帮助用户为各种任务集(可视化、语言到结构化数据)构建定制的机器学习模型。每个应用程序的实际使用是不同的,但是方法都遵循从软件开发工具包或网络用户界面提取数据的一般模式。用户可以调整设置并输出训练有素的模型。今天的焦点是我们的社区已经能够在卡格尔笔记本电脑中直接使用SDK。
Kaggle和AutoML的集成遵循了我们之前在Kaggle笔记本中引入的BigQuery。
首先,只需关联用户的GCP帐户并授权访问要使用的云服务,同时启用云存储将使AutoML轻松访问您的数据。在
与谷歌帐户关联后,有必要仔细检查云帐户是否准备好。为此,请确保为GCP项目启用机器学习应用编程接口和结算设置。AutoML是一种付费服务。为了让更多凯格尔人使用汽车,我们计划全年提供GCP积分来补贴使用该服务的成本。所有在谷歌云平台注册的新账户将获得300美元的限额。
用户可以使用卡格尔笔记本中内置的客户端软件开发工具包,也可以使用云控制台中的网络接口轻松运行自动管理。要在笔记本中使用自动,请查看帮助文档或教程。要了解更多关于自动机器学习及其改进数据科学工作流程的主题,请观看我们的解释视频。
现在,AutoML已经深深地融入了卡格尔竞争平台。我相信将来会有越来越多的程序员会派AutMail去参加Kaggle的比赛。
极牛网精选文章《谷歌把打败99%程序员的AutoML集成到Kaggle平台!》文中所述为作者独立观点,不代表极牛网立场。如若转载请注明出处:https://geeknb.com/3016.html