注意 現在X(旧Twitter)でのソーシャルログインができない事象を確認しています。事前にX(旧Twitter)側で再ログインした上でconnpassのソーシャルログインを行うか、
「ユーザー名(またはメールアドレス)」と「パスワード」の組み合わせでのログインをお試しください。合わせてFAQもご確認ください。

お知らせ 2024年9月1日よりconnpassサービスサイトへのスクレイピングを禁止とし、利用規約に禁止事項として明記します。
9月1日以降のconnpassの情報取得につきましては イベントサーチAPI の利用をご検討ください。

お知らせ connpassではさらなる価値のあるデータを提供するため、イベントサーチAPIの提供方法の見直しを決定しました。2024年5月23日(木)より 「企業・法人」「コミュニティ及び個人」向けの2プランを提供開始いたします。ご利用にあたっては利用申請及び審査がございます。詳細はヘルプページをご確認ください。

このエントリーをはてなブックマークに追加

Jun

4

強化学習: 理論から実践へ #3

強化学習から信頼できる意思決定へ

Organizing : ScrumSign

強化学習: 理論から実践へ #3
Registration info

一般枠

Free

FCFS
16/25

Attendees
kim-kic
hiro10
nogisoccer07
田中博基
jntrsmtr
ino
matsu_masa
ahuman2
1025johan
r-tsukuda
View Attendee List
Start Date
2024/06/04(Tue) 19:00 ~ 20:00
Registration Period

2024/05/28(Tue) 19:00 〜
2024/06/04(Tue) 20:00まで

Location

オンライン

オンライン

参加者への情報
(参加者と発表者のみに公開されます)
出席登録
(イベント開始時間の2時間前から終了時間まで、参加者のみに公開されます)

Description

Math & Codingとは

数学とプログラミングのスキルを向上させたい方が集い学び合う場です。

難しい概念や技術も、シンプルな例で確認したりメンバーが対話することで本質的な理解を得られると考えます。

本グループは、そのようなことができるようなコミュニティとなることを目指します。

◆groupページ

https://www.facebook.com/groups/284004485439214/

◆過去のイベント スクラムサインのコミュニティーページ

https://scrumsign.com/community/

強化学習とは

強化学習(Reinforcement Learning, RL)とは、逐次的意思決定を取り扱うための、数理的な枠組みである。

意思決定をする主体である「エージェント」と、意思決定の場を与える「環境」との相互作用によって逐次的意思決定の過程をモデル化した上で、環境からエージェントに与えられる報酬を最大化するように意思決定ルール(方策)を学習させていくことで、最適な意思決定ルールを獲得でき、それにより状況に応じてどのように行動すべきかの指針を得ることができる。(強化学習から信頼できる意思決定へ まえがきより)

本イベントで使用する教科書

強化学習から信頼できる意思決定へ (サイエンス社) https://amzn.asia/d/6ucjmXE

強化学習を勉強したことがない人は、以下の書籍をまず読むことをおすすめします
Reinforcement Learning: An Introduction https://web.stanford.edu/class/psych209/Readings/SuttonBartoIPRLBook2ndEd.pdf

この教科書を学ぶ意義

この教科書は、強化学習を実際にビジネスで応用することを目的として書かれた教科書である。

強化学習をビジネスで使用する際、試行錯誤の段階で、大きな損失を出すことや、重大なミスを犯してしまうリスクが、懸念点とされてきた。

この教科書では、それらの問題に対してうまく強化学習を適用する方法について書かれている。 具体的には以下の三つである。

2章 環境をシミュレーター内に構築するオフライン学習

3章 リスクを考慮し、安定性に重点を置いた、リスク考慮型強化学習

4章 最適化問題の制約条件として、エージェントの行動に制約をつける安全性制約考慮型強化学習

これらの課題を解決し、強化学習をビジネスなどの現実問題に適用できるようにすることが、本イベントの目的、この教科書を学ぶ意義である。

進め方

基本的に強化学習から信頼できる意思決定へ(サイエンス社 梶野洸 他)を読み進めながら、事前に進行者が用意した資料を授業ノートがわりに進めていきます。

教科書の記述をよみ、定理やその証明の数式を丁寧に追って、ホワイトボードに書いて確認したりします。 数式を言葉で言い換えたり、図を書いたりして、その数式が考えられた気持ちを理解していくことを大切にしています。

事前に進行者が用意した資料に、書き込みながら進めていきます。

主催者は議論の整理、進行をし、主催者がわからないところ、疑問を抱いているところは参加者の皆さんに質問したりもします。

集まったメンバー同士で重要となる定義、定理、命題について議論しています。

聴いているいるだけの参加の仕方もOKです。

準備

こちらのDiscord上で勉強会を行います。時間までに準備お願いします。

対象者

実践的な強化学習を学び、実際に業務に応用する基盤を学びたい方。

教科書をある程度読んできていただくことをおすすめします。

進行

尾崎 勇介(株式会社スクラムサイン インターン)

Media View all Media

If you add event media, up to 3 items will be shown here.

Feed

No comments yet.

Ended

2024/06/04(Tue)

19:00
20:00

You cannot RSVP if you are already participating in another event at the same date.

Registration Period
2024/05/28(Tue) 19:00 〜
2024/06/04(Tue) 20:00

Location

オンライン

オンライン

オンライン

Attendees(16)

kim-kic

kim-kic

強化学習: 理論から実践へ #3 に参加を申し込みました!

hiro10

hiro10

強化学習: 理論から実践へ #3 に参加を申し込みました!

nogisoccer07

nogisoccer07

強化学習: 理論から実践へ #3 に参加を申し込みました!

田中博基

田中博基

強化学習: 理論から実践へ #3 に参加を申し込みました!

jntrsmtr

jntrsmtr

I joined 強化学習: 理論から実践へ #3!

ino

ino

強化学習: 理論から実践へ #3 に参加を申し込みました!

matsu_masa

matsu_masa

強化学習: 理論から実践へ #3 に参加を申し込みました!

ahuman2

ahuman2

強化学習: 理論から実践へ #3 に参加を申し込みました!

1025johan

1025johan

I joined 強化学習: 理論から実践へ #3!

r-tsukuda

r-tsukuda

強化学習: 理論から実践へ #3 に参加を申し込みました!

Attendees (16)