MIT 연구원들은 로봇이 몸 전체를 사용하여 물체를 조작하도록 돕습니다.
브리아나 웨슬링 | 2023년 8월 29일
손 전체를 사용하여 양동이를 180° 회전시키려는 로봇. | 출처: MIT
MIT 연구팀이 로봇이 손가락 끝이 아닌 손이나 몸 전체를 이용해 물체를 조작할 수 있는 AI 기술을 개발했다.
사람이 상자를 집을 때 일반적으로 손 전체를 사용하여 들어 올린 다음 상자를 다른 곳으로 옮기는 동안 팔뚝과 가슴을 사용하여 상자를 안정되게 유지합니다. 이런 종류의 조작은 전신 조작이며 로봇이 어려움을 겪는 부분입니다.
로봇의 경우 상자가 손가락, 팔, 몸통의 어느 지점에나 닿을 수 있는 각 지점은 로봇이 추론해야 하는 접촉 이벤트입니다. 이로 인해 로봇에는 수십억 개의 잠재적 접촉 이벤트가 발생하므로 전신이 필요한 작업 계획이 매우 복잡해집니다. 로봇이 물체를 이동하는 가장 좋은 방법을 학습하려고 하는 이러한 과정을 접촉이 많은 조작 계획이라고 합니다.
그러나 MIT 연구진은 스무딩(smoothing)이라는 AI 기술과 팀이 구축한 알고리즘을 사용해 이 과정을 단순화하는 방법을 찾아냈다. 평활화는 많은 연락처 이벤트를 더 적은 수의 결정으로 요약하여 작업에 중요하지 않은 이벤트를 제거하고 더 적은 수의 결정으로 범위를 좁힙니다. 이를 통해 간단한 알고리즘이라도 효과적인 조작 계획을 신속하게 고안할 수 있습니다.
많은 로봇은 에이전트가 시행착오를 통해 보상을 위해 작업을 완료하는 방법을 배우는 기계 학습 기술인 강화 학습을 통해 객체를 처리하는 방법을 배웁니다. 이러한 학습을 통해 시스템은 시행착오를 거쳐 세상의 모든 것을 배워야 합니다.
수십억 개의 접점을 시도해야 하는 강화 학습에는 많은 계산이 필요할 수 있으므로 충분한 시간이 있으면 효과적일 수 있지만 접점이 많은 조작 계획에 이상적인 선택은 아닙니다.
그러나 강화 학습은 다양한 접점을 시도하고 결과의 가중 평균을 계산하여 평활화 프로세스를 수행합니다. 이는 로봇을 가르치는 데 매우 효과적인 데 도움이 됩니다.
MIT 연구팀은 이러한 지식을 바탕으로 이러한 종류의 연구를 수행하는 간단한 모델을 구축하여 시스템이 핵심 로봇-객체 상호 작용에 집중하고 장기적인 동작을 예측할 수 있도록 했습니다.
그런 다음 팀은 로봇이 내릴 수 있는 모든 가능한 결정을 신속하게 검색할 수 있는 알고리즘과 모델을 결합했습니다. 스무딩 모델과 알고리즘 사이에서 팀은 표준 노트북에서 약 1분 정도의 계산 시간만 필요한 시스템을 만들었습니다.
이 프로젝트는 아직 초기 단계이지만, 이 방법을 사용하면 손가락 끝으로만 잡는 대형 로봇 팔 대신 몸 전체를 사용하여 물체를 조작하는 더 작은 모바일 로봇을 공장에 배치할 수 있습니다.
모델은 시뮬레이션 테스트에서 유망한 결과를 보였지만 물체가 떨어지는 것과 같은 매우 역동적인 모션을 처리할 수는 없습니다. 이는 연구팀이 향후 연구에서 계속해서 다루기를 희망하는 문제 중 하나입니다.
팀의 연구는 부분적으로 Amazon, MIT Lincoln Laboratory, National Science Foundation 및 Ocado Group의 자금 지원을 받았습니다. 팀에는 전기 공학 및 컴퓨터 과학(EECS) 대학원생인 HJ Terry Suh가 포함되었으며 논문의 공동 저자이자 공동 저자인 Tao Pang Ph.D. '23, Boston Dynamics AI Institute의 로봇공학자; EECS 대학원생 Lujie Yang; 수석 저자인 Russ Tedrake는 EECS, 항공우주학, 기계 공학의 Toyota 교수이자 CSAIL(컴퓨터 과학 및 인공 지능 연구소)의 회원입니다.