'stable-baseline' 태그의 글 목록

[RL] Stable-baselines3 gym -> gymnasium

2023.04.20·

👾 Deep Learning

RL 계보로 보면 OpenAI와 Deepmind이 둘이 거의 다했다고 보면 된다.. 코드며 paper며 하지만 요즘 RL 보다 NLP LLM 모델에 관심이 쏠리면서 과거 OpenAI baseline git 이나 Deepmind rl acme git이 업데이트 되지 않고 있다. 그 사이 gym의 후원 재단이 바뀌면서 gymnasium으로 변형되고 일부 return 방식이 바뀌었다. 그래서 대부분의 2~3년이 지난 코드들은 과거 gym버전의 패키지가 아니면 호환이 되지 않고있다. 그러나 다행히 stable-baselines에서 최근 gymnasium으로 코드를 변경해 주었다. 이 패키지를 사용하면 기존 대부분의 PPO, HER, DDPG 등 RL model을 사용이 가능하고 custom 환경도 만들 수 있게..

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

stable-baseline

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

개인정보

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역