とりあえずディープラーニングしてみたいならErsatzという選択肢があるよ
2015/07/11
Contents
はじめに
ディープラーニングがスゴそうだとソーシャル流布に心を惑わされて、ワールドカップのときだけサムライブルーのユニフォームを身に包んで渋谷駅に集結するにわかサッカーファンのごとく機械学習に興味を持った素人が、玄人に「それ、SVMで十分でしょwwww」とdisられながら、Caffeとかをどうにかこうにか使ってみようとしたけど、意味不明過ぎて挫折しそうになってる、でもディープラーニングを体感してみたい。。!
…という、私のような人にはErsatzというサービスがオススメかも。
読み方分からない。
これはディープラーニングにまつわる道具群を時間貸ししてるサービス。
色んなディープラーニングの実装にデータを投げ込んで、勝手にハイパーパラメーター(って、いうニューラルネットのチューニング箇所)を最適化してくれたり、学習仮定やら判別精度なんかの結果をイイカンジにビジュアライズしたりしてくれる。
もちろん学習はGPUを搭載したマシンでやってくれるので早い。
GETTING STARTED、ドキュメントもしっかりしてるし。
つまづくことなくディープラーニングを体感できるはず。
CNNをGPUでぶん回したり、プレディクションを行うために1分あたり0.4ドル程度課金されるみたい。
今なら(か、どうかは分からない)会員登録するだけで180分間タダで使える。
ちょっとしたデータセットを学習させるくらいならトータル1分位で終わるのでそこそこディープラーニングできる。
ぶっちゃけ、ドキュメントがかなり丁寧に書かれてるので読めば終わりな話なんだけど、せっかくなので実際にディープラーニングを使って何かを分類してみる。
ディープラーニングといえば、Tシャツとデニムパンツなのでこの2つの衣類を分類する学習器を作ってみよう。
Tシャツとデニムパンツを分類してみよう
分類する画像を用意する
Tシャツ、デニムパンツの画像をそれぞれ30枚用意した。
枚数は何となく決めた。
それぞれ別フォルダに画像を入れて2フォルダをまとめてzip圧縮する。
ersatzに画像データをアップロードする
Upload Dataを選択してもよし、zipファイルを直接ドラッグアンドドロップしてもよし。
データセットを作る
先ほどアップロードした画像のうちN%は訓練データに100-N%はテストデータに使いたい。
といった分割やら、必要な前処理をここで行う。
っても、ユーザがやることは分割の配分をスライダーで選んだり、使いたいフィルターを選択する(画像ではフィルターの選択とかすらない!CSV形式のデータだと色々選べるみたい)程度の労力しか費やさないので楽。
アンサンブルを作る
アンサンブル、よく分からないのでドキュメントを読む。
An ensemble is simply a group of different Neural Network models.
アンサンブルってアンサンブル学習のこと指してるのだろうか。
複数のニューラルネットモデル群をとっかえひっかえして最適解を探す感じなのか。。?
と、いった感じで無知な私でも適当にボタンをクリックさえすればアンサンブルを作ることができる。
使用するニューラルネットワークを選択して、
使用するテストデータと訓練データを選択して、
ディープラーニングをやる上で骨の折れるハイパーパラメーターの調整は「CHOOSE FOR ME」を選ぶだけで勝手にやってくれる。
ベイジアン最適化アルゴリズムというシロモノを使ってパラメータをイイカンジにしてくれるみたいす。
ドキュメントに貼られていた論文
このスライドも面白い。
エキスパートな貴方は「LET ME DO IT」を選びます。
ハイパーパラメーターの設定を終えるとアンサンブルの作成(学習?)が始まる。
やってる感ある。
GPUを使って計算してるので数百件のデータの二値分類とかなら1分以内に終わっちゃう。
完成したアンサンブルを使って予測をしてみる
Tシャツかデニムパンツかを分類するアンサンブル(って表現が正しいのだろうか。。)が完成したので、実際に未知な画像をアンサンブルに突っ込んで予測してみる。
『Predict』を選択して、
予測したい画像をドラッグ&ドロップして、『Go Predict』をクリックするだけ。
しばらく待っていると結果が出た。
Tシャツと判定された。
まとめ
CNNを時間貸しするサービス(しかもUIとかもちゃんとしてる!)が去年からローンチされてることに驚いた。
海外のスタートアップは手が早いね。すごい。
336px
336px
関連記事
-
-
MacでKerasを使えるようにする
Ke …
-
-
deepdreamしてみたい
ht …