【終了】第25回ステアラボ人工知能セミナー 内部英治 様「強化学習と逆強化学習を組み合わせた模倣学習」 The 25th STAIR Lab AI Seminar: Dr. Eiji Uchibe, "Imitation Learning based on a Combination of Forward and Inverse Reinforcement Learning"

thumb image

STAIR (Software Technology and Artificial Intelligence Research Center, Chiba Institute of Technology) regularly organizes STAIR Lab AI Seminars.
Everyone can participate for free.
If there are available seats after the lottery drawing for participation, we accept additional applications until the day of the seminar, on a first-come, first-served basis.

千葉工業大学 人工知能・ソフトウェア技術研究センター (ステアラボ) では、機械学習、自然言語処理、画像処理等の人工知能分野の研究者をお招きし、最先端の研究についてご講演していただく「ステアラボ人工知能セミナー」を定期的に開催しています。
どなたでも無料でご参加いただけます。
参加申し込みの抽選後、座席に余裕がある場合は先着順でセミナー当日まで申込みを受け付けます。

【日時】
2019年9月20日 (金) 15:00-16:00

Date:
Sep. 20, 2019 (Fri.) 15:00 – 16:00

【場所】
千葉工業大学東京スカイツリータウン(R)キャンパス
東京スカイツリータウン® ソラマチ8F

Location:
Tokyo Skytree Town(R) Campus, Chiba Institute of Technology
8F solamachi, Tokyo Skytree Town®

【講演者】
国際電気通信基礎技術研究所 脳情報通信総合研究所 主幹研究員 内部 英治 様
https://researchmap.jp/uchibe/

Speaker:
Eiji Uchibe, Brain Information Communication Research Laboratory Group, Advanced Telecommunications Research Institute International
https://researchmap.jp/uchibe/

【講演タイトル】
強化学習と逆強化学習を組み合わせた模倣学習

Title:
Imitation Learning based on a Combination of Forward and Inverse Reinforcement Learning

【講演概要】
強化学習を適用する際に問題になるのは目的を規定する報酬関数の設計である。逆強化学習は熟練者から提示されたデモンストレーションから報酬を推定する枠組みであり、強化学習と逆強化学習を組み合わせた模倣学習はデモンストレーションに含まれない未知の状態に対しても適切な行動を学習できるといった、単純な制御方策の模倣の問題点を克服できること、敵対的生成ネットワーク(GAN)の枠組みで解釈できることといった点から、近年多くの研究がなされている。本公演では強化学習と逆強化学習の組み合わせによる模倣学習について紹介しつつ、強化学習と逆強化学習が互いに関数近似器を共有することで学習効率を改善した我々のアルゴリズムを紹介する。

The details are written in Japanese and the talk will be given in Japanese.

Members