2013-11-26から1日間の記事一覧
Massimo Silvetti, Ruth Seurinck and Tom Verguts frontiers in HUMAN NEUROSCIENCE 既存の強化学習モデル(基底核系)にACCを加えたというより、線条体部分をACCで置き換えたという感じ。 ACCは、報酬の大きさ(状態価値?)と正の予測誤差と負の予測誤差…
Jonathan Williams, MBBS, MSc, MRCPsych, and Peter Dayan, Ph.D. JOURNAL OF CHILD AND ADOLESCENT PSYCHOPHARMACOLOGY Volume 15, Number 2, 2005 少ない待ち時間で小報酬か、大きな待ち時間で大報酬かを選ぶ課題を強化学習でシミュレーション。 学習率と…