[RL] Deep Deterministic Policy Gradient (A.K.A DDPG)

728x90

GitHub - seohyunjun/RL_DDPG: CONTINUOUS CONTROL WITH DEEP REINFORCEMENT LEARNING (a.k.a DDPG)

CONTINUOUS CONTROL WITH DEEP REINFORCEMENT LEARNING (a.k.a DDPG) - GitHub - seohyunjun/RL_DDPG: CONTINUOUS CONTROL WITH DEEP REINFORCEMENT LEARNING (a.k.a DDPG)

github.com

DDPG

* Continuous Action Space RL 문제 해결 (기존의 DQN discrete action space)

* DQN에서 actor-critic 사용

* off-policy

* Target Network(=AC) 사용

* Soft Update(Target Network를 업데이트할 때, parameter update t(tau) 비율 조정)

[Example Mujoco_Humanoid-v4] Episode 30

저작자표시

'👾 Deep Learning' 카테고리의 다른 글

[RL] Soft Actor-Critic (a.k.a SAC) (0)	2023.04.12
[M1] Whisper.cpp Deploy C++ (ALL OS-) (0)	2023.04.06
[RL] M1 Mac Mujoco_py 설치 (gcc@9 error) (0)	2023.03.29
[RL] A3C (비동기 Advantage Actor-Critic) 정리 (0)	2023.03.28
[RL] A3C (Asynchronous Advantage Actor-Critic) (0)	2023.03.28

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

[RL] Deep Deterministic Policy Gradient (A.K.A DDPG)

'👾 Deep Learning' 카테고리의 다른 글

'👾 Deep Learning' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

'👾 Deep Learning' 카테고리의 다른 글

'👾 Deep Learning' 카테고리의 다른 글

개인정보

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역