TensorFlowで画像分類した定食たちの銀河をつくった

先日公開された Google Cloud Platform Japan 公式ブログ: Cloud Vision API でイメージの「銀河」を探索しようを参考にしながら，自分でも可視化に挑戦してみた．記事で書かれている手順説明とGitHubで公開されているソースコードを眺めながら，可能な範囲で真似しながら作った．制作過程をざっくりまとめていく．

可視化の題材は，Cloud Vision APIではなくて，TensorFlowを使って実験を進めているConvolutional Neural Network での定食画像分類実験とした．定食分類実験については下記記事をご覧ください．

「銀河」の様子

ブラウザで3D空間を表示するためにthree.jsを使っていて，完全に初心者状態だったので予想以上にいろいろなところで躓いた．とりあえず今のところはこんな感じで触れるようになっている．

https://i.gyazo.com/cbcbded7a65680416d5216b306468614.gif

画像収集

tfPhotoPaletteを用いて画像を集める．このツールが出力するJSONファイルには，学習器に与えるbase64エンコードされた32x32pxの画像データだけでなく，教師ラベルや画像のURL，トリミング領域の座標情報も保持しているので，いつでもすぐに必要な情報を取り出せる．今回のようなデモを作りたくなったときに非常に便利．

画像分類

手持ちのありったけの食神定食画像を，最新の学習器に与えて，その画像がどのラベルが相応しそうかの確率を表したベクトルを得る．例えば，以下のような画像を与えると，

http://cdn-ak.f.st-hatena.com/images/fotolife/d/daiiz/20160218/20160218124959.jpg

このようなスコアベクトルが得られる．

{
    "teishoku-3": 0.9777767658233643, 
    "teishoku-1": 0.015356350690126419, 
    "teishoku-5": 0.0014701758045703173, 
    "teishoku-4": 0.005396719556301832
}

これを特徴ベクトルとして空間に描画したいが，今回は分類数が4個であるため，得られたスコアベクトルは4次元ベクトルとなっている．このままでは3D空間にプロットすることはできないが，冒頭に挙げたGoogleのブログで次元削減という技を知ったのでもう怖くない．ベクトル表現を3次元まで落していく．