-
- 도로 주행 환경
- 차량 에이전트 구현
- 가상 도로 구현 (Unity Asset 활용)
- 차량 장애물 및 장애물 오브젝트 배치
-
- 심층 강화학습 모델 (customed DQN)
- Pytorch + CuPy/NumPy + CUDA (Anaconda 사용)
- Customed DQN(Deep Q-Network) = Vanilla DQN + Dueling Architecture + PER(Prioritized Experience Replay) + NoisyNet
- Epsilon Greedy decaying, Soft target Update
*추가로 고려해본 기법: Multi-step Learning, Distributional Q-learning
- 학습의 수렴성 및 안정성 증가
- 학습 효율성 개선
- 차선 유지, 장애물 회피, 신호 준수 자율 주행 성공