《2026年2月16日》データサイエンスセミナー（講演者：杉山将氏　題目：「不完全情報と報酬設計から考える強化学習の新展開」）

日時：2026年2月16日(月) 10:30 ~　60分

場所：士魂商才館３Fセミナー室Ⅰ【大】　および　web併用　（※ 対象は特に限定しない）

講演者：杉山将先生（理化学研究所　革新知能統合研究センターデータサイエンス・AIイノベーション研究推進センター）　

題目：不完全情報と報酬設計から考える強化学習の新展開

概要：
　強化学習は、報酬を手がかりに試行錯誤しながら行動を学ぶAIの方法で、ゲーム、ロボット、生成AIなど幅広い分野で成果を上げています。一方で、現実の問題では「適切な報酬をどう与えるか」が大きな課題になります。本講演では、この報酬に関する最新の研究を紹介します。前半では、不完全な情報しか得られない状況でも学習できるよう、転移学習や弱教師付き学習を用いた強化学習手法を解説します。これにより、人間のフィードバックを用いるAIでも、環境変化や過学習に強い学習が可能になることを示します。後半では、報酬の与え方やまとめ方を柔軟に拡張する新しい強化学習の枠組みを紹介します。時刻ごとの報酬が得られない場合への対応や、安全性や効率を重視した多様な評価基準を扱えるようにすることで、現実世界のさまざまな目的に適応できる強化学習を目指します。

お問い合わせは以下のアドレスにメールでご連絡ください。
dser-center@biwako.shiga-u.ac.jp

お知らせトップへ戻る

お知らせInformation