データサイエンスセミナー開催報告
2026年2月16日、杉山 将 先生(理化学研究所 革新知能統合研究センター センター長/東京大学 大学院新領域創成科学研究科 複雑理工学専攻 教授/滋賀大学 データサイエンス・AIイノベーション研究推進センター 特別招聘教授)をお招きして、データサイエンスセミナーを開催しました。本セミナーでは、強化学習の発展についてお話しいただきました。強化学習とは、エージェントに最適な行動方策を獲得させるための枠組みで、行動の結果として得られる即時的な報酬をもとに、長期的な目標を達成できるよう行動規則を逐次的に改善していく機械学習の技術です。杉山先生は長年、機械学習の数学的な基礎研究を続けてこられ、その研究は、企業・技術機関の多岐にわたる課題に応用されています。強化学習は、ゲーム、ロボット、ドローンなど身の回りで見る機械の制御から、自動運転やインフラの管理、治療方針の最適化など、多方面へ応用されています。その技術の基礎となるのは、私たちがスマホを片手にクリックする何気ない動作であったり、飲むかどうかわからない薬の消費であったりといった、断片的かつ不完全な情報を有効活用する機械学習技術です。
前半では、不完全な情報に基づく強化学習の実行方法について解説され、転移学習や弱教師付き学習を活用した最新の手法が紹介されました。後半では、報酬の粒度や集約化に焦点を当てた講義が行われ、従来の枠組みでは想定されていなかった多様な状況・目的に対応し得る、強化学習の新たなパラダイムが示されました。
参加は教員・学生のほか、データサイエンス連携コンソーシアム企業会員も加わり、対面とオンラインを合わせて約60名の参加者が受講しました。多岐に渡る質問も寄せられ、機械学習の先端分野に関する知見を深める意義深いセミナーとなりました。来年度のセミナー(未定)では、今回の展開の新しい成果を伺うことができそうです。


