banner
뉴스 센터
개인화된 주문은 항상 권장됩니다

육아 3

Jul 15, 2023

인간은 사회적 동물이므로 어릴 때부터 서로에게서 배웁니다. 유아는 부모, 형제자매, 보호자를 예리하게 관찰합니다. 그들은 기술과 행동을 배우기 위해 본 것을 보고, 모방하고, 재생합니다.

아기들이 주변 환경을 배우고 탐색하는 방식은 Carnegie Mellon University와 Meta AI의 연구원들에게 영감을 주어 로봇에게 여러 기술을 동시에 배우고 눈에 보이지 않는 일상 작업을 처리하는 방법을 가르치는 새로운 방법을 개발했습니다. 연구진은 3세 어린이와 동등한 조작 능력을 갖춘 로봇 AI 에이전트 개발에 나섰다.

팀은 수동적 관찰과 능동적 학습을 활용하여 로봇이 유아와 동등한 조작 능력을 습득할 수 있도록 하는 인공 지능 에이전트인 RoboAgent를 발표했습니다.

"RoboAgent는 효율적인 학습자이고, 새로운 상황에서 효과적이며, 시간이 지남에 따라 행동을 확장할 수 있는 일반 로봇 에이전트를 향한 중요한 이정표입니다."라고 컴퓨터 공학부(opens in new window) 로봇 공학부 겸임 교수인 Vikash Kumar는 말했습니다. 연구소(새 창에서 열림). “현재 로봇은 개별 작업에 대해 고도로 전문화되고 훈련되었습니다. 이와 대조적으로 우리는 보이지 않는 시나리오에서 광범위한 기술을 발휘할 수 있는 단일 인공 지능 에이전트를 만드는 데 착수했습니다. RoboAgent는 풍부한 수동적 관찰과 제한된 능동적 놀이의 조합을 활용하여 인간 아기처럼 학습합니다.”

RoboAgent는 다양한 장면에서 12가지 조작 기술을 완성할 수 있습니다. 이 연구는 변화하는 환경에 적응할 수 있는 로봇 학습 플랫폼을 지향합니다. 이전 연구와 달리 팀은 시뮬레이션이 아닌 실제 환경에서 작업을 시연했으며 이전 프로젝트보다 훨씬 적은 데이터를 사용하여 시연했습니다.

Robotics Institute의 부교수인 Abhinav Gupta(opens in new window)는 “RoboAgents는 다른 사람들이 달성한 것보다 훨씬 더 복잡하고 복잡한 기술을 사용할 수 있습니다.”라고 말했습니다. "우리는 고유한 보이지 않는 시나리오에 대한 효율성과 일반화 규모를 갖춘 단일 실제 로봇 에이전트가 달성한 그 어떤 것보다 더 다양한 기술을 보여주었습니다."

팀의 에이전트는 인터넷 데이터에 포함된 자기 경험과 수동적 관찰의 조합을 통해 학습합니다. 부모가 자녀를 지도하는 것처럼 연구자들은 유용한 자기 경험을 제공하기 위해 로봇을 원격 조종하여 작업을 수행했습니다.

"우리 접근 방식의 효과와 효율성은 에이전트가 제한된 경험으로도 추론할 수 있도록 하는 새로운 정책 아키텍처에서 비롯됩니다."라고 Homanga Bharadwaj 박사는 말했습니다. 로봇공학과 학생. "RoboAgent는 일반적으로 사용되는 시간 단계별 작업 대신 시간적 움직임 청크 측면에서 결정을 예측하고 집계하여 지정된 텍스트/시각적 목표에 응답하여 작동합니다."

로봇은 주변에서 수동적으로 일어나는 일이 아니라 주로 자신의 경험을 통해 학습합니다. 환경에서 일어나는 일에 대한 이러한 본질적인 맹목성은 로봇이 노출되는 경험의 다양성과 새로운 상황에 적응하는 능력을 근본적으로 제한합니다. 이러한 한계를 극복하기 위해 RoboAgent는 아기가 수동적으로 관찰하여 지식과 행동을 습득하는 방법과 유사하게 인터넷의 비디오에서 학습합니다.그들의 주변.

"RoboAgent는 이러한 비디오에 포함된 정보를 활용하여 인간이 객체와 상호 작용하는 방식에 대해 사전 학습하고 다양한 기술을 사용하여 작업을 성공적으로 완료합니다."라고 박사인 Mohit Sharma는 말했습니다. 로봇공학과 학생. “또한 여러 시나리오에서 유사한 기술을 관찰하면 작업을 완료하는 데 필요한 것과 필요하지 않은 것을 배울 수 있습니다. 알려지지 않은 작업이나 보이지 않는 환경이 제시될 때 이러한 교훈을 활용합니다.”

"이런 종류의 학습이 가능한 에이전트는 우리를 보이지 않는 다양한 환경에서 다양한 작업을 완료하고 더 많은 경험을 수집하면서 지속적으로 진화할 수 있는 일반 로봇에 더 가까이 다가가게 해줍니다."라고 조교수인 Shubham Tulsiani(opens in new window)는 말했습니다. 로봇연구소에서. “RoboAgent는 제한된 도메인 내 데이터를 사용하여 로봇을 빠르게 훈련시키는 동시에 인터넷에서 풍부하게 사용 가능한 무료 데이터를 주로 활용하여 다양한 작업을 학습할 수 있습니다. 이는 집, 병원, 기타 공공 장소와 같이 구조화되지 않은 환경에서 로봇을 더욱 유용하게 만들 수 있습니다.”