Unity/Unity ML-Agents

Unity ML-Agents 2.0 업데이트 정리

pnltoen 2022. 6. 30.

ML-Agents 2.0 + AI Competition 소개

참고자료 : ML-Agents 2.0 + AI Competition 소개 - Unity Technologies Korea 유튜브

참고자료 : 텐서플로와 유니티 ML-Agents로 배우는 강화학습, 민규식 등 6명, 위키북스

2021년 새로운 강화학습 사례 : AI system for designing microchips (2021.6)

마이크로 칩을 인공지능이 디자인하여 부품 Block을 설계할 수 있는가 -> TPU 설계에 실제에 적용함

- 강화학습의 경우 물리적 제약이 있는 환경에는 학습 시간이 더 오래 걸림

- 실패가 발생하면 안되는 환경에는 적용이 어려움 (보상은 좋은 보상 나쁜 보상이 나뉘니까)

하나의 환경내에 있는 다수의 에이전트가 서로 협력하거나 경쟁하도록 학습시킬 수 있음

에이전트의 일부를 희생하더라도 공동의 목표를 우선시하여 수행할 수 있도록 학습

패널티를 1번 받지만 결과적으로는 최대의 학습

(Cooperative Push block), (Dungeon Escape)

실제 상황에는 인지 대상 수가 달라지는 경우가 많은데 Attention 기법 (자연어 처리를 할 때 주로 사용한 알고리즘)을 사용하여 효율적인 학습 가능 (Bullet, Sorter)

하나의 모델한테 하나의 일만 시키는 학습을 진행하는데 이는 여러 메모리를 사용하게 됨

Hypernetwork를 통해 2가지 문제를 하나의 알고리즘을 통해 풀 수 있음

ML-Agents 2.0 추가정보 요약

효율적으로 오브젝트 탐지 및 관측 가능

새로운 퍼즐게임이 예제에 추가

98%이상 메모리 할당량 감소