Azure ML を使ってみた

Google Prediction APIチュートリアルの言語識別を、Azure ML でもやってみました。
中二病と熊本弁の識別は、日本語を入力すると学習に失敗しできませんでした。Logic Apps でもそうでしたが、日本語を交ぜるとどうもうまく動かない模様)

DataSets

https://cloud.google.com/prediction/docs/language_id.txt
より学習データをダウンロードします。
Azure Machine Learning Studio の DATASETS - NEW - FROM LOCAL FILE より、ダウンロードした language_id.txt をアップロードします。
dataset type には Generic CSV File With no header (.nh.csv) を選択します。

Experiments

EXPERIMENTS - NEW - Blank Experiment より、空の Experiment を作成し
f:id:blono:20150608222812p:plain
こんな感じでブロックを配置します。
黒い点を右クリックし、Visualize を選ぶことで可視化することもできます。

Metadata Editor

Launch column selector より Begin With に All columns を選択します。
そして、New column names に language,text と設定します。

Train Model

Launch column selector より language を選びます。

実行

画面下部の RUN を押し、実行します。
実行後には、Train Model 下部の丸を右クリック Visualize で結果を確認できます。

Scoring Experiment

実行後に、画面下部の Create scoring experiment を選ぶことで、
f:id:blono:20150608224622p:plain
こんな感じの Experiment を作ってくれます。
これを再度実行、画面下部の Publish Web service を選ぶことで、ウェブサービスを作ってくれます。

Web Service

WEB SERVICES - language_id [Scoring Exp.] - Test より、確認してみましょう。
f:id:blono:20150608225218p:plain
f:id:blono:20150608225358p:plain

無事英語に判定されました!
とまあこんな感じで簡単に使えるので、遅刻の多い社員が今日遅刻する確率とかを算出して楽しみたいと思います。