先週、韓国で開催された The Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD) に参加してきました。
PAKDD は、データマイニング分野における著名な国際会議の一つで、今年で21回目の開催となります。
今年の PAKDD には、458本の投稿があり[1]、129本が採択されました (採択率28.2%)。その内、45本が long presentation (発表時間が長い) に選ばれ、残りの84本が regular presentation でした。日本からの発表は11本ぐらいでした。
採択された研究トピックとしては、ソーシャルネットワーク・グラフマイニングが最も多かったです。全23セッションの内、6セッションがこのトピックを対象としたものでした。各時間で、並列に4セッション行われていたので、全ての時間において、グラフに関する研究発表が行われていたことになります。
本会議において、best paper award を受賞したのは Microsoft India のグループ[2]の論文です:
-
Convoutional Bi-Directional LSTM for Detecting Inappropriate Query Suggestions in Web Search
-
Harish Yenala, Manoj Chinnakotla, and Jay Goyal
-
Google 検索や Bing 検索などの検索エンジンには、ユーザーが文字を入力すると、自動で補完や関連する単語列の候補を表示する query auto completion (QAC) という機能があります。この QAC は、データベース (これまで入力された膨大なクエリのログ) から、ユーザーが現在入力しているクエリに関連するものをいくつか選択して出力します。
この論文では、QAC がデータベースから 不適切なもの (inappropriate query) を選択して、ユーザーに提示してしまうことが問題である[3]、と主張しています。この問題を解決するために、この論文では自動で不適切な候補の検出を行っています。
具体的には, convolutional network と bi-directional LSTM を組み合わせたニューラルネットワークを提案しており, 実験でも良好な結果を報告しています.
私は、k-近傍分類の性能改善に関する研究を発表しました。
簡単に紹介すると、k-近傍分類の性能改善のために、従来の Mahalanobis distance の学習 (distance metric learning) ではなく、リッジ回帰の一種を使うことを提案しました。提案した方法は、学習が高速で、分類精度も悪くない結果となっています。
本会議2日目に、excursion があり、火山をハイキングしました。若手からベテランまで様々な研究者が、ひぃひぃ言いながら山を登っている姿は新鮮でした[4]。山の上は絶景で非常に気持ちよかったです。