ML-Agents 2.0 + AI Competition 소개
참고자료 : ML-Agents 2.0 + AI Competition 소개 - Unity Technologies Korea 유튜브
참고자료 : 텐서플로와 유니티 ML-Agents로 배우는 강화학습, 민규식 등 6명, 위키북스
2021년 새로운 강화학습 사례 : AI system for designing microchips (2021.6)
마이크로 칩을 인공지능이 디자인하여 부품 Block을 설계할 수 있는가 -> TPU 설계에 실제에 적용함
- 강화학습의 경우 물리적 제약이 있는 환경에는 학습 시간이 더 오래 걸림
- 실패가 발생하면 안되는 환경에는 적용이 어려움 (보상은 좋은 보상 나쁜 보상이 나뉘니까)
Unity ML-Agents 2.0 신기능
Training cooperative behaviors
하나의 환경내에 있는 다수의 에이전트가 서로 협력하거나 경쟁하도록 학습시킬 수 있음
에이전트의 일부를 희생하더라도 공동의 목표를 우선시하여 수행할 수 있도록 학습
패널티를 1번 받지만 결과적으로는 최대의 학습
(Cooperative Push block), (Dungeon Escape)
Observing varying numbers of entites
실제 상황에는 인지 대상 수가 달라지는 경우가 많은데 Attention 기법 (자연어 처리를 할 때 주로 사용한 알고리즘)을 사용하여 효율적인 학습 가능 (Bullet, Sorter)
Task parameterization: One model to rule them all
하나의 모델한테 하나의 일만 시키는 학습을 진행하는데 이는 여러 메모리를 사용하게 됨
Hypernetwork를 통해 2가지 문제를 하나의 알고리즘을 통해 풀 수 있음
ML-Agents 2.0 Additional Info
ML-Agents 2.0 추가정보 요약
Grid Sensor
효율적으로 오브젝트 탐지 및 관측 가능
Match-3
새로운 퍼즐게임이 예제에 추가
성능개선
98%이상 메모리 할당량 감소
댓글