'RL' 태그의 글 목록

[RL] Stable-baselines3 gym -> gymnasium

2023.04.20·

👾 Deep Learning

RL 계보로 보면 OpenAI와 Deepmind이 둘이 거의 다했다고 보면 된다.. 코드며 paper며 하지만 요즘 RL 보다 NLP LLM 모델에 관심이 쏠리면서 과거 OpenAI baseline git 이나 Deepmind rl acme git이 업데이트 되지 않고 있다. 그 사이 gym의 후원 재단이 바뀌면서 gymnasium으로 변형되고 일부 return 방식이 바뀌었다. 그래서 대부분의 2~3년이 지난 코드들은 과거 gym버전의 패키지가 아니면 호환이 되지 않고있다. 그러나 다행히 stable-baselines에서 최근 gymnasium으로 코드를 변경해 주었다. 이 패키지를 사용하면 기존 대부분의 PPO, HER, DDPG 등 RL model을 사용이 가능하고 custom 환경도 만들 수 있게..

[RL] Soft Actor-Critic (a.k.a SAC)

2023.04.12·

👾 Deep Learning

https://github.com/seohyunjun/RL_SAC/blob/main/README.md GitHub - seohyunjun/RL_SAC: Soft Actor-Critic Soft Actor-Critic. Contribute to seohyunjun/RL_SAC development by creating an account on GitHub. github.com * SAC (Soft Actor-Critic) Continuous Action Space / Discrete Action Space 모든 공간에서 안정적인 Policy를 찾는 방법을 고안 기존의 DDPG / TD3에서 한번 더 나아가 다음 state의 action 또한 보고 다음 policy를 선택 (좋은 영양분만 주겠다) * Pol..

[RL] A3C (Asynchronous Advantage Actor-Critic)

2023.03.28·

👾 Deep Learning

https://github.com/seohyunjun/RL_A3C GitHub - seohyunjun/RL_A3C: A3C (asynchronous advantage actor-critic) A3C (asynchronous advantage actor-critic). Contribute to seohyunjun/RL_A3C development by creating an account on GitHub. github.com

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

RL

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

개인정보

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역