イベント
第113回 データサイエンスセミナー
開催日時:2022年07月28日13:30-14:30
開催場所:545演習室・オンライン (※学外の方も参加できます。)
講演者:佐藤健一(滋賀大・データサイエンス学系)
題目: 共変量を持つ非負値行列因子分解について
概要:
非負の成分からなる観測行列は非負値行列因子分解(NMF)によって、非負の成分からなる基底行列と係数行列の積として分解・近似できる。その結果、個体ごとの観測値ベクトルは全個体に共通の基底ベクトルと個体ごとの係数の一次線形結合でかけることになる。このとき、基底関数については通常の線形回帰モデルのように解析者が与える必要はなく、自動で最適化されることに注意する。一方、係数行列は個体ごとの和が1になるように基準化することができ、各基底に対する所属確率として解釈できるため、NMFは個体データのソフトクラスタリングに利用できる。実際、統計的テキスト解析において簡易なトピックモデルとしても利用されている。有用性の高いNMFであるが、その入力値は観測行列だけであり、個体ごとの共変量が存在していても、その情報を利用することができなかった。そこで、本稿では個体の特徴を示す共変量を用いて従来のNMFの拡張を考える。より具体的には、NMFの係数行列を個体ごとの共変量によって変化する変化係数として捉え、未知パラメータ行列と既知の共変量行列の積で表現する。つまり、観測値行列を1)基底行列、2) パラメータ行列、3) 共変量行列、の3つの行列の積として分解・近似する。なお、共変量行列を単位行列として与えれば、従来の共変量を用いない場合のNMFに一致する。提案手法によって、観測されていない共変量に対する観測値や所属確率の予測が可能になる。