25 captures
27 Jul 2019 - 14 Feb 2026
Jun
JUL
Aug
27
2018
2019
2020
success
fail
About this capture
COLLECTED BY
Collection:
Wikipedia Eventstream
TIMESTAMPS
The Wayback Machine - https://web.archive.org/web/20190727181813/https://developers-jp.googleblog.com/search/label/AutoML
Local blog for Japanese speaking developers
Google の AutoML が KaggleDays での表形式データのコンペで第 2 位に
2019年6月24日月曜日
この記事は Yifeng Lu による Google AI Blog の記事 "
An End-to-End AutoML Solution for Tabular Data at KaggleDays
" を元に翻訳・加筆したものです。詳しくは元記事をご覧ください。
投稿者: Google AI ソフトウェア エンジニア、Yifeng Lu
データベースのテーブルや表計算のシートなどの「表形式データ」に対する機械学習(ML)の適用は、特に活発に研究や実用化が進んでいる領域です。小売、サプライ チェーン、金融、製造、マーケティングなど、多くのビジネス分野において、不正検知や在庫予測など、表形式データにまつわる様々な課題が存在します。こうした課題を ML で解決するソリューションの開発には ML の専門家が欠かせません。例えば、手作業による
特徴量エンジニアリング
や
ハイパーパラメータの調整
などにより、最適なモデルを作成する必要があります。しかし、こういったスキルを持つ人材は希少であり、ML による業務の効率的な改善は簡単ではありませんでした。
こうしたビジネスや研究での ML の導入を加速し、スケーラブルなものとするのが、Google の AutoML です。AutoML の初期の取り組みである
ニューラル アーキテクチャ検索(NAS)
では、
NasNet
を通して画像認識の分野に革新をもたらしました。さらに、
AmoebaNet
などの進化した手法や、エッジ向けのモバイル ビジョン アーキテクチャである
MNasNet
によって、AutoML の特徴である「learning-to-learn」手法のメリットがさらに明らかになっています。
そして先日、Google は表形式データに learning-to-learn のアプローチを適用し、次の 3 つの特徴を備えるスケーラブルなエンドツーエンド AutoML ソリューションを開発しました。
全自動:
学習データと計算リソースを投入するだけで、すぐに利用できる TensorFlow モデルを出力します。その途中で人による作業は発生しません
広く適用可能:
表形式データを利用するあらゆる課題に適用できます
高品質:
AutoML が生成するモデルの性能は、トップクラスの ML エキスパートが手作業で作ったモデルに匹敵します
このソリューションを評価するため、Kaggle のハッカソンイベント
KaggleDays SF Hackathon
に AutoML でエントリしました。これは
KaggleDays イベント
の一部で、最大 3 名のチーム 74 組が 8 時間半をかけて競うコンペです。
ここで
AutoML が Kaggle の参加者と初めて競い合ったのは、一連の自動車部品についての素材の特性とテスト結果の情報を与えて、製造における欠陥を予測する課題でした。相手には
Kaggle progression system
の Master レベルの参加者や GrandMaster レベルの参加者もたくさんいました。しかし私たちの AutoML のチームはほぼ 1 日中首位をキープし、
順位表
にあるように最終的には
僅差で 2 位
となりました。
私たちのチームの AutoML ソリューションは、複数ステージの TensorFlow パイプラインで構成されています。第 1 ステージは、自動特徴量エンジニアリング、
アーキテクチャ検索
、検索によるハイパーパラメータ チューニングを担当します。第 1 ステージを経た有望なモデルは第 2 ステージに送られ、交差検証と
バギング
が適用されたのち、優れたモデルが選択されます。その後、第 2 ステージで得られた特に優れたモデルを組み合わせて、最終的なモデルとします。
「Google AutoML」チームのワークフローは、他の Kaggle 参加者のワークフローとはまったく異なっていました。他の参加者がデータを分析してさまざまな特徴量エンジニアリングを試している間、私たちのチームはジョブをモニタリングしてその終了を待っているだけです。最終的に 2 位となったソリューションのステージが終了するまでには、2500 CPU時間の計算処理を必要としました。
またコンテストの後に公開された
パブリック カーネル
を調査したところ、手作業で設計した上位のモデルを AutoML モデルで拡張すれば、ML エキスパートがさらに高性能のシステムを構築できることがわかりました。下の表が示すように、AutoML には ML エキスパートの能力を強化し、さまざまな課題に広く対処できるようにする可能性が秘められています。
AutoML モデルと他の Kaggle 参加者のモデルを組み合わせることでモデルをさらに改善できる可能性を表す順位表。「Erkut & Mark, Google AutoML」には、1 位となった「Erkut & Mark」と 2 位となった「Google AutoML」のモデルが含まれている。Erkut Aykutlug 氏と Mark Peng 氏は、
XGBoost
と独自の特徴量エンジニアリングを利用。一方の AutoML は、自動の特徴量エンジニアリングとハイパーパラメータチューニングとともに、ニューラル ネットワークと勾配ブースティング ツリーの双方(
TFBT
)を使った。
Google Cloud AutoML Tables
このコンペで利用したソリューションは、Cloud Next '19 でベータ版が提供開始された
Google Cloud AutoML Tables
のメイン アルゴリズムに採用されています。次の図に示すように、複数の Kaggle コンテストを対象としたベンチマーク テストでは AutoML Tables がコンスタントに高成績を記録しており、同様のサービスとしては SoTA 性能を達成しています。
複数の Kaggle コンテストを対象としたサードパーティによる AutoML Tables のベンチマーク結果
AutoML の手法は、実際のビジネスにおけるさまざまな問題に対して応用できる可能性があります。既にいくつかのお客様が、企業内のさまざまな表形式データに対して AutoML Tables を適用し、サプライ チェーン管理やマーケティングのリード コンバージョン最適化などの用途に活用しています。表形式データにまつわるさまざまな課題の解決に、最先端の ML 技術を適用可能になったことを嬉しく思います。
謝辞
このプロジェクトは、Google Brain チームのメンバー、Ming Chen、Da Huang、Yifeng Lu、Quoc V. Le、Vishy Tirumalashetty の尽力があってこそ実現できました。また、すばらしいインフラストラクチャとプロダクトのランディングに関して協力してくださった Cloud AutoML Tables チームの Dawei Jia、Chenyu Zhao、Tin-yun Ho にも感謝します。魅力的なコンテストを開催してくださった Walter Reade、Julia Elliott、そして Kaggle の皆さんにも感謝いたします。
Reviewed by
Kaz Sato - Staff Developer Advocate, Google Cloud
ラベル
.app
1
.dev
1
#DevFest16
1
#DevFest17
1
#DevFest18
1
#hack4jp
3
A/B Testing
1
A4A
4
Actions on Google
15
Activation Atlas
1
Addy Osmani
1
ADK
2
AdMob
31
Ads
39
Ads API
32
AdWords API
10
Agency
1
AI
10
AIY
3
AIY Vision Kit
2
ALPN
1
AMP
76
AMP Cache
5
AMP for Email
2
AMP Story
2
amp-bind
1
AMPHTML Ads
1
Analytics
9
Andorid
12
Android
334
Android Auto
1
Android Design Support Library
1
Android Developer Story
4
Android Developers
4
Android Enterprise
5
Android Go
1
Android Jetpack
3
Android N
18
Android O
13
Android P
7
Android Pay
1
Android Q
8
Android Security Year in Review
1
Android Studio
37
Android Support Library
5
Android Things
15
Android TV
10
Android Vitals
3
Android Wear
29
androidmarket
3
AndroidX
2
Angular
2
Angular 2
2
AngularJS
2
API
25
APIExpert
45
apk
2
app
3
App Action
1
app engine
23
App Indexing
7
App Invites
6
App Maker
2
AppCompat
2
Apps Script
11
aprilfool
4
AR
2
Architecture Components
6
ARCore
1
ArtTech
1
Associate Android Developer Certificate
1
Audio
7
Auth Code
1
Authentication
8
AuthSub
2
AutoML
1
Autotrack
2
award
1
Awareness API
1
Beacons
6
Better Ads Standards
1
BigQuery
9
Billing
1
BLE
4
Blink
1
Blockly
1
blogger
1
BodyPix
1
Brillo
1
Brotli
2
Budou
1
Calendar
3
Cardboard
4
Career
1
Case Study
1
Certificate
2
chrome
115
Chrome Custom Tab
2
Chrome Dev Summit
2
chrome extension
9
Chrome for Android
2
Chrome for iOS
2
Chrome OS
5
Chrome Tech Talk Night
4
Chromebook
3
Chromecast
7
chromewebstore
7
Chromium
5
CLI
1
ClientLogin
3
Closure Compiler
1
Cloud
21
Cloud Firestore
4
Cloud Functions
9
Cloud IoT Device SDK
1
Cloud Next
8
Cloud OnBoard
3
Cloud PubSub
1
Cloud Storage
1
Cloud Study Jams
3
Cloud Test Lab
2
Cloudflare
1
CNN
1
Coalition for Better Ads
1
CocoaPods
1
codejam
5
codelab
4
Colaboratory
1
Community
1
compute engine
3
Context
1
Cookie
1
Coral
2
Crash Reporting
2
Crashlytics
2
Dart
2
DataCenter
1
Daydream
4
Deep Learning
4
Demo Party
1
Design Sprint
3
DesignBytes
1
DevArt
3
DevBytes
6
Developer
14
Developer Console
4
Developer Preview
6
Developer Relations
2
DevFest
7
DevFestX
3
DevOps
1
devtools
4
Dialogflow
1
DirectShare
1
Domain
1
Doodle
1
DoubleClick
4
Doze モード
1
drive
2
Dynamic Links
3
EarlGrey
1
Easter Egg
1
ECMAScript 2015
1
Eddystone
4
egypt
1
Encryption
1
English
2
ES2015
1
ES2016
1
ES6
2
ES7
1
Featured
2
Firebase
115
Firebase Admin SDK
6
Firebase Analytics
10
Firebase Auth
4
Firebase Cloud Messaging
10
Firebase Crashlytics
2
Firebase Database
5
Firebase Libraries
1
Firebase Notifications
1
Firebase Performance
3
Firebase Remote Config
5
Flash
1
Flutter
6
font
3
fraud
1
G Suite
18
game
38
Game Developers Conference 2018
1
Game Developers Conference 2019
1
Gboard
1
GCP
9
GCPUG
1
GDD11JP
56
GDD2010JP
23
GDE
2
GDG
15
GDG Cloud
1
Geo
51
Gingerbread
1
GLIDE
5
Gmail
4
Gmail API
2
Go
1
golang
5
goo.gl
1
Google
5
Google Analytics
3
Google API
1
Google Apps
14
Google Apps Script
4
Google Assistant
8
Google Assistant SDK
1
Google Cast
8
Google Cloud
24
Google Cloud INSIDE Games & Apps
6
Google Cloud Messaging
11
Google Cloud Platform
11
Google Code-in
1
Google Developer Experts
2
Google Developers Academy
1
Google Developers live
5
Google Developers Summit
2
Google Drive
6
Google Earth
1
Google Fit
2
Google for Mobile
2
Google for Work
1
Google I/O
17
Google Impact Challenge
1
Google Maps
55
Google Maps Platform
4
Google Pay
1
Google Photo
1
Google Play
108
Google Play Console
8
Google Play Game Services
9
Google Play Instant
1
Google Play Services
22
Google Plus
14
Google Search
7
Google Sheets API
3
Google Sign-In
12
Google Slides API
5
Google Summer of Code
1
Google Tag Manager
1
Google Trust Services
1
Google マップ
4
Google+
2
Googleapps
10
GoogleGames
1
GoogleI/O
28
GoogleLabs
1
GooglePlay
1
GoogleTV
1
Gradle
1
gRPC
2
GTUG
5
GWT
2
hack4jp
2
hackathon
7
Hangouts Chat
2
Hosting
3
HTML5
17
HTML5Rocks
1
HTTP/2
5
HTTPS
11
I/O Extended
4
ID Token
1
Identity
14
Identity Toolkit
1
Ignite
4
IME
11
Indie Games Festival 2018
2
Indie Games Festival 2019
12
Inevitable ja Night
21
Instagram
1
Instant Apps
6
intern
2
Invites
1
IO19
3
iOS
20
IoT
6
IPv6
1
Issue Tracker
2
Japanese Input
1
JavaScript
7
Jetpack
1
K-12
1
Key Transparency
1
Knowledge Graph
1
Kotlin
8
l10n
8
LaunchPad
1
Lighthouse
1
LINE
1
Local AI
1
Lollipop
10
Machine Learning
20
Maker Faire Tokyo
1
Marshmallow
10
Material
1
Material Design
30
MDL
1
MDN
1
MIDI
2
ML Kit
10
Mobile
13
Mobile Bootcamp
4
Mobile Sites certification
1
Mobile Vision
4
mod_pagespeed
1
monetize
3
Mozc
15
Music
1
NativeDriver
2
NativeScript
1
NBU
1
ndk
3
Nearby
5
Next Extended
1
Next Tokyo
3
Nexus
2
Nexus S
1
NFC
1
Node.js
3
Noto CJK
1
NPAPI
2
NPN
1
oauth
11
OpenAI
1
OpenGL
4
OpenID
3
OpenID Connect
4
OpenSocial
1
opensource
17
Optimization
1
Payment
4
PEM
33
People API
2
Performance
12
Performance budget
1
PersonFinder
1
Physical Web
3
Pi
1
Place Picker
1
Play Billing Library
1
Player Analytics
4
Playtime 2017
1
Policy
4
Polymer
7
privacy
2
Progressive Web Apps
13
project hosting
1
Promise
1
Promo code
1
Protocol Buffers
1
PRPL
1
publicdata
1
Push API
1
Push Notification
3
PWA
2
Python
2
QUIC
1
QWIKLABS
3
RAIL
1
React
1
React Native
2
Realtime Database
9
Recap Live Japan 2019
3
reCaptcha
1
Redux
1
Remote Config
3
Remote Display API
1
Resonance Audio
1
Rewarded Video Ads
2
Runtime Permission
1
Safe Browsing
1
Sample Code
2
Santa Tracker
1
schema.org
1
secur
1
security
49
Service Worker
4
SHA-1
1
sketchup
1
SmartLock for Passwords
4
social
4
Social Good
1
Social Media
1
SPDY
3
speak2tweet
1
Spreadsheet
3
startup
5
Storage
2
story
1
streetview
3
Study Jams
5
Swift
2
SwiftShader
1
Symantec
1
Task
4
Team Drive
1
techtalk
12
TensorFlow
26
TensorFlow Federated
1
TensorFlow Lite
4
TensorFlow Object Detection API
1
TensorFlow Probability
2
TensorFlow.js
1
test
4
Test Lab
6
TFX
1
ToS
1
Transliteration
1
Twitter
1
Udacity
20
Unity
3
UX
4
V8
2
VP9
1
VR
11
Vulkan
2
Watch Face
2
wave
2
Wear OS
2
Weave
1
Web
21
Web Animations
1
Web Components
6
Web Manifest
1
Web Packaging
3
WebAssembly
4
WebGL
1
WebMusic
5
WebView
1
Women Techmakers Scholars Program
1
WTM
5
Xcode
1
YouTube
17
YouTube API
1
インタビュー
1
コードサンプル
1
プライバシー
1
言論の自由
1
節電
3
東日本大震災
9
日本語入力
41
ブログ アーカイブ
2019
7
6
5
4
3
2
1
2018
12
11
10
9
8
7
6
5
4
3
2
1
2017
12
11
10
9
8
7
6
5
4
3
2
1
2016
12
11
10
9
8
7
6
5
4
3
2
1
2015
12
11
10
9
8
7
6
5
4
3
2
2014
12
11
10
9
8
7
6
5
4
3
2
1
2013
12
11
10
9
8
7
6
5
4
3
2
1
2012
12
11
10
9
8
7
6
5
4
3
2
1
2011
12
11
10
9
8
7
6
5
4
3
2
1
2010
12
11
Feed
Follow @googledevjp
"プロダクトに関するご意見は
プロダクトフォーラム
にお願いします"