人工知能学会主催で行われてたデータ解析コンペティション(JSAI Cup 2017)で幸運にも優勝することが出来たので、2017年度人工知能学会全国大会の中で行われた「JSAI Cup報告会」で発表してきました。
発表で使用したスライドは、以下からご覧いただけます。
今回のコンペティションのタスクは、鉄道支障(支障なし、人身支障、機械支障、気象支障の4カテゴリ)の予測でした。
与えられている訓練データは、関東の5路線に関する10分毎の鉄道支障の履歴と、関東の気象データです。
ただし、予測する鉄道支障は訓練データとは別の5路線に関してで、この5路線の鉄道支障の履歴は与えられていません。
したがって、訓練路線で学習したモデルを何らかの形でテスト路線の方に反映できるようにしなければなりません。
これに対する僕のアプローチは、駅の緯度経度情報を外部から取得して、各駅での降水量や風速等の気象情報を特徴量にすることです。
このような特徴量を作ると、路線に依らない汎用的な特徴量が作成できるので、今回のようにテスト路線の支障履歴が与えられていない場合でも有効だと考えました。
当日の報告会を聞く限り、このアプローチを入賞者の約半数が取っていたと思います。
入賞者の特徴量の作り方や使用したモデルはほとんど同じでした。
一方で、僕しかやっていなかったこととしては、地震の履歴を特徴量に使った点です。
地震情報はアメリカ地質調査所のホームページから取得して、駅の緯度経度情報を利用して各駅の震度を推定し、特徴量として使用しました。
このコンペティションでは、モデリングのアイディアも評価対象となっていたので、そういった点も評価されたのかもしれません。
最後に、僕自身は将来的に学生と一緒にコンペに参加したかったり、コンペの企画をしてみたいと思い、今回のJSAI Cupに参加させていただきました。
報告会当日もこういった話をしたのですが、聴講されていた何人かの先生に「うちでも授業でやろうとしてる」「研究室で参加していた」と声を掛けていただいたので、コンペを教育題材として考えていらっしゃる方は多いのかもしれません。
また、コンペの企画に関しては、当センターでいくつかデータセットを構築しているので、それらを用いたコンペが将来的にできたら良いと思います。