[RL] Stable-baselines3 gym -> gymnasium

728x90

https://analyticsindiamag.com/has-openai-surpassed-deepmind/

RL 계보로 보면 OpenAI와 Deepmind이 둘이 거의 다했다고 보면 된다.. 코드며 paper며 하지만 요즘 RL 보다 NLP LLM 모델에 관심이 쏠리면서 과거 OpenAI baseline git 이나 Deepmind rl acme git이 업데이트 되지 않고 있다. 그 사이 gym의 후원 재단이 바뀌면서 gymnasium으로 변형되고 일부 return 방식이 바뀌었다. 그래서 대부분의 2~3년이 지난 코드들은 과거 gym버전의 패키지가 아니면 호환이 되지 않고있다.

그러나 다행히 stable-baselines에서 최근 gymnasium으로 코드를 변경해 주었다. 이 패키지를 사용하면 기존 대부분의 PPO, HER, DDPG 등 RL model을 사용이 가능하고 custom 환경도 만들 수 있게 만들었다.

https://github.com/DLR-RM/stable-baselines3

GitHub - DLR-RM/stable-baselines3: PyTorch version of Stable Baselines, reliable implementations of reinforcement learning algor

PyTorch version of Stable Baselines, reliable implementations of reinforcement learning algorithms. - GitHub - DLR-RM/stable-baselines3: PyTorch version of Stable Baselines, reliable implementatio...

github.com

baseline2에서는 Tensorflow를 지원.

현재 Trend에 맞춰 PyTorch와 Test 환경 구축

https://jmlr.org/papers/volume22/20-1364/20-1364.pdf

저작자표시

'👾 Deep Learning' 카테고리의 다른 글

[CS324] Introduction (0)	2023.07.03
[Drag Your GAN] Interactive Point-based Manipulation on the Generative Image Manifold (0)	2023.07.02
Choose Your Weapon:Survival Strategies for Depressed AI Academics (0)	2023.04.18
[RL] Soft Actor-Critic (a.k.a SAC) (0)	2023.04.12
[M1] Whisper.cpp Deploy C++ (ALL OS-) (0)	2023.04.06

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

[RL] Stable-baselines3 gym -> gymnasium

'👾 Deep Learning' 카테고리의 다른 글

'👾 Deep Learning' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

'👾 Deep Learning' 카테고리의 다른 글

'👾 Deep Learning' 카테고리의 다른 글

개인정보

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역