自己説明型モデルが獲得した説明能力は転移可能か?(IBIS2025) Can the explanatory capabilities acquired by self-explaining models be transferred?

thumb image

発表者

吉川友也(千葉工業大学), 清水良太郎(ZOZO Research), 川島貴大(ZOZO Research), 斎藤侑輝(ZOZO Research)

概要

自己説明型モデルは、予測とその根拠の説明を一度の推論で同時に行える。しかし、人が望む説明を出力するにはそれ専用の訓練が必要となり、学習コストが増加する。本発表では、モデル編集技術の一つであるTask arithmeticに基づき、タスクAで獲得した説明能力を、タスクBで訓練された同じアーキテクチャの予測のみ可能なモデルに転移させ、追加学習無しでタスクBの自己説明型モデルを構築する方法を提案する。

Members