強化学習アルゴリズム入門: 「平均」からはじめる基礎と応用
曽我部 東馬, 電気通信大学
オーム社, 2019
ISBN: 9784274223716;
言語: 日本語
平均という初歩的な数学を入口として、「価値」「探索」「マルコフ性」といった強化学習の基本をわかりやすく解説します。また、各アルゴリズムについては、「多腕バンディット問題」および「グリッドワールド問題」のいずれかを用いて、比較しやすい状態で解説します。そのため、各アルゴリズムの特徴や差異がわかりやすくなっています。さらに、中核的なアルゴリズムについては MATLAB のコードを配布しており、コードを実行することで「原理→数式→プログラム」という一連の流れを直感的に把握できます。
本書の特徴
- 難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説
- さまざまなアルゴリズムを、共通する例題を用いて特徴がわかりやすいように比較
Seleccione un país/idioma
Seleccione un país/idioma para obtener contenido traducido, si está disponible, y ver eventos y ofertas de productos y servicios locales. Según su ubicación geográfica, recomendamos que seleccione: .
También puede seleccionar uno de estos países/idiomas:
Cómo obtener el mejor rendimiento
Seleccione China (en idioma chino o inglés) para obtener el mejor rendimiento. Los sitios web de otros países no están optimizados para ser accedidos desde su ubicación geográfica.
América
- América Latina (Español)
- Canada (English)
- United States (English)
Europa
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)