실습 가이드: GR00T‑Mimic 원격 시연 로드 + 어노테이션

핵심 메세지

원격 시연 데이터를 통해 로봇 작업별 하위 작업 종료 시점을 정의하고 학습 데이터를 생성하는 방법

내용 요약

1단계: 원격 시연 데이터 로드하기

2단계: 궤적 재생 & 종료 시점 표기

3단계: 원격 시연 예시

4단계: 자동화된 데이터 생성

Isaac Lab Teleoperation and Imitation Learning 참고 링크

실습 가이드: GR00T‑Mimic 데이터 생성 & 재생

핵심 메세지

원격 시연 데이터를 통해 로봇 작업별 하위 작업 종료 시점을 정의하고 학습 데이터를 생성하는 방법

내용 요약

1단계: 데이터 생성 실행

2단계: 동작 시뮬레이션

3단계: Headless 모드 활용

대규모 데이터 생성 시 전체 Isaac Sim 시각화 대신 headless 모드로 실행 가능
- 성능 증가
- python run_data_generation.py --num_envs 100 --headless

4단계: 생성된 데이터 재생

생성된 데이터를 시각화해 품질 체크 가능
- replay_data.py 스크립트 실행
- python replay_data.py --dataset_dir path/to/dataset
로봇의 원래 동작뿐 아니라, 액션 노이즈가 추가된 데이터를 함께 재생 가능
병렬 환경 수도 지정 가능 (--num_envs)

-generation_num_trials 1000
- 생성하고자 하는 데이터셋의 전체 시도(샘플) 수를 의미
- 즉, 1000개의 데이터를 생성하겠다는 뜻
-num_env 4
- 데이터를 생성하는 동안 동시에 병렬로 실행될 환경(시뮬레이션) 수를 의미
- 1000개의 데이터를 한 개의 환경에서 생성하면 매우 오래 걸림
- 하지만 4개의 병렬 환경(--num_env 4)을 통해 한 번에 4개의 데이터를 생성하므로
- 속도가 4배 빨라질 수 있음

핵심 메세지

원격 시연 데이터를 통해 로봇 작업별 하위 작업 종료 시점을 정의하고 학습 데이터를 생성하는 방법

내용 요약

1단계: 생성된 데이터를 통해 로봇 정책 학습

LSTM (Long Short‑Term Memory)정책

2단계: 학습된 정책의 성능

3단계: 랜덤화 가능 범위 제어

학습 환경 내 로봇 작업 물체의 위치 랜덤화 가능
- 원래 시연과 동일한 데이터를 통해서도 랜덤화 범위 변경 가능
- 예: 원래 시연보다 랜덤화 범위를 더 넓혀서 학습 가능
원래 시연보다 랜덤화 범위를 너무 많이 늘리면 성능 저하 가능
- 일정 범위 내에서 랜덤화 가능
- 너무 큰 랜덤화는 원래 시연과 학습된 데이터 사이의 불일치로 실패 가능