このエントリーをはてなブックマークに追加

3月

29

Reinforcement Learning Meetup #02

Tic Tac Toe

主催 : ScrumSign

募集内容

参加枠

無料

先着順
13/15

イベントの説明

Math & Codingは数学とプログラミングの知識を向上したい方が集い学び合う場です。 機械学習やデータ分析予測業務の仕事のニーズが高まるにつれ数学とプログラミングの 両方を習得していくことはとても重要です。 どちらも習得に時間はかかりますが、学べば品質の高い仕事につながると考えます。

内容

「Reinforcement Learning An Introduction」(Richard S. Sutton and Andrew G. Barto)second edition http://incompleteideas.net/book/the-book-2nd.html を読んでいきます。

「Reinforcement Learning An Introduction」について

著者の一人であるSutton氏は強化学習の第一人者で現在はDeepMindに所属されています。
「Reinforcement Learning An Introduction」は2000年に「強化学習」(森北出版)として出版されていますがそれ以降、強化学習の技術も進歩していることから今は、第二版の出版計画が進行中です。
オンラインドラフト版(英語)が無料で公開されており、サンプルコード(Python)がGithubにあげられています。
今回はそちらをテキストにして学びを深めていきます。

進め方

参加者同士が数式を含む文章と実装を相互に参照し理解を深めていきます。
予習は前提としません。
運営者は議論の整理をしたりペースを考えて進行します。

範囲

Chapter 1.「Introduction」
事例としてGit HubにあがっているTic Tac Toe のコードをメインにディスカションしていきます。
強化学習の枠組みが、コードにどのように反映されているかを中心にディスカッションし理解を深めます。

対象者

強化学習に関心がありベースから理解していきたいエンジニア
強化学習の理論に関心があるアルゴリズム開発者

資料 資料をもっと見る/編集する

資料が投稿されると、最新の3件が表示されます。

終了

2018/03/29(木)

19:00
22:00

開催日時が重複しているイベントに申し込んでいる場合、このイベントには申し込むことができません

募集期間
2018/03/14(水) 19:00 〜
2018/03/29(木) 22:00

会場

株式会社SOU

大阪市中央区瓦町3-4-9(ステーツ本町ビル8F)

参加者(13人)

SasanoYasumasa

SasanoYasumasa

Reinforcement Learning Meetup #02に参加を申し込みました!

TomokazuKitamura

TomokazuKitamura

Reinforcement Learning Meetup #02 に参加を申し込みました!

m_nshr

m_nshr

Reinforcement Learning Meetup #02に参加を申し込みました!

Fujita

Fujita

Reinforcement Learning Meetup #02 に参加を申し込みました!

y_sasagawa

y_sasagawa

Reinforcement Learning Meetup #02に参加を申し込みました!

byt78

byt78

Reinforcement Learning Meetup #02に参加を申し込みました!

mrsekut

mrsekut

Reinforcement Learning Meetup #02 に参加を申し込みました!

Takuma Wakamori

Takuma Wakamori

Reinforcement Learning Meetup #02 に参加を申し込みました!

hrs1985

hrs1985

Reinforcement Learning Meetup #02 に参加を申し込みました!

Ryusuke

Ryusuke

Reinforcement Learning Meetup #02 に参加を申し込みました!

参加者一覧(13人)

キャンセルした人(5人)