STAIR Lab

Research

説明器に忠実な説明をさせるための最適化法 (IBIS2023) A Training Method to Force Explainers to Generate Faithful Explanations

第26回情報論的学習理論ワークショップ (IBIS2023)で、以下の内容でポスター発表しました。 こちらは、先日公開したarXiv論文をまとめたものになります。

タイトル

説明器に忠実な説明をさせるための最適化法

発表者

吉川友也; 岩田具治 (千葉工業大学; NTT)

概要

予測に対する説明の品質は、説明の忠実性、すなわち、説明が予測モデルの振る舞いをどれだけ正しく反映しているかで評価されることが多い。 説明の忠実性を定量評価するために、画像に対しては挿入・削除メトリクスがよく用いられる。 本発表では、微分可能な挿入・削除メトリクスを導入し、これを正則化に利用することで、説明器が忠実な説明を出力できるように予測モデルを最適化する方法を提案する。

Members 関連メンバー