본문 바로가기
자율주행

[자율주행 논문] Scaling Self-Supervised End-to-End Driving with Multi-View Attention Learning

by icebear3000 2023. 3. 24.
반응형

Abstract

 전문가 운전 시연을 사용하여 에이전트가 추가적인 인간 레이블링을 요구하지 않고 전문가의 행동을 모방하도록 훈련하는 자체 감독 종단 간 (self-supervised end-to-end)주행 모델의 개발에 대해 논의합니다. 그러나 기존 자체 감독 모델은 의미론적 세분화와 같은 데이터 집약적인 형식에 레이블을 지정해야 하며 해상도 및 시야 측면에서 한계가 있습니다.

 이 논문은 자체 감독 모방 학습을 사용하는 새로운 종단 간 모델이 더 큰 시야, 자기 주의 메커니즘 및 운전 장면에 대한 더 나은 이해를 포함하여 기존 모델에 비해 몇 가지 이점을 가지고 있다고 주장합니다. 결과적으로 이 모델은 많은 양의 인간 레이블링 데이터를 필요로 하지 않고 주행 메트릭에서 거의 전문가 수준의 성능을 달성합니다.

요약하면,  더 큰 시야, 자기 주의(self-supervised) 및 운전 장면에 대한 더 나은 이해를 통합하여 기존 모델을 개선하여 인간 레이블링이 필요한 모델과 비교할 수 있는 새로운 자체 감독 종단 간(self-supervised end-to-end) 주행 모델을 제시합니다.

 

8. Conclusions

 이 기사에서는 CIL++라고 하는 종단 간 자율 주행을 위한 새로운 모델의 개발에 대해 설명합니다. 이 모델은 자체 감독 모방(self-supervised imitation) 학습을 사용하여 훈련되며, 이는 추가적인 인간 레이블링을 요구하지 않고 전문가 드라이버를 모방하여 학습한다는 것을 의미합니다.

 저자들은 종단 간 자율 주행을 위한 이전의 자체 감독 모델이 차선의 조건에서 개발되었기 때문에 추가 감독에 의존하는 모델보다 성능이 좋지 않았다고 주장합니다. 이 문제를 해결하기 위해 CIL++는 세 대의 카메라를 사용하여 넓은 시야를 제공할 뿐만 아니라 시뮬레이터에서 온보드 데이터를 수집할 수 있는 보다 현실적인 전문가 드라이버를 제공합니다.

 CIL++는 또한 모델이 여러 뷰에 걸쳐 피쳐 맵 패치(토큰)를 연결하는 데 도움이 되는 중간 수준 주의(mid-level attention) 메커니즘으로 visual transformer를 사용합니다. 이는 복잡한 마을 환경을 탐색하는 모델의 능력을 향상시키며, 저자는 CIL++이 NoCrash 메트릭에 대한 전문가 수준에서 수행된다는 것을 보여줍니다.

 저자들은 또한 CIL++의 각 구성 요소의 중요성을 입증하기 위해 절제된 연구를 수행했으며, 모델이 재교육 없이 유사한 유형의 차량 간에 이전될 수 있음을 보여주었습니다.

 향후 연구에서, 저자들은 차선 변경 시 모델의 성능을 향상시키기 위해 백뷰 카메라를 추가할 계획입니다. 전반적으로, CIL++는 자체 감독 종단 간 자율 주행 모델에 대한 강력한 기준선을 나타냅니다.

반응형

댓글