強化学習の学習済み方策の転移について

11 visualizaciones (últimos 30 días)
一馬 平田
一馬 平田 el 1 de Ag. de 2021
Respondida: Hiro Yoshino el 2 de Ag. de 2021
お世話になります。
強化学習(DQN)の学習済み方策を別の制御モデルに転移させる時、学習済みのQ-Networkを転移させることは可能でしょうか。
また、転移学習の例題では最終層以外の層の学習率を0にすることで最終層以外の重みを凍結させていましたが、一部の層の重みのみを凍結することは可能でしょうか。

Respuesta aceptada

Hiro Yoshino
Hiro Yoshino el 2 de Ag. de 2021
やったことが無いのですが、可能だと思います。
DQN なので、rlQValueRepresentation で学習済みのネットワークを渡せば良いと思います。
また、学習済みのネットワークを追加で学習する際に、一部のレイヤーの一部のパラメータの学習率をコントロールすることが任意で可能です。setLearnRateFactor で 任意のパラメータの学習係数を指定できます。
これにグローバルの学習率が掛け合わさって、そのパラメータの学習率になります。従って、これを使ってゼロを設定すれば、そのパラメータは学習において更新されません。

Más respuestas (0)

Categorías

Más información sobre 時系列、シーケンス、およびテキストを使用した深層学習 en Help Center y File Exchange.

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!