팀의 새로운 AI 기술로 로봇 인식 기술이 크게 향상되었습니다.
달라스에 있는 텍사스 대학의 지능형 로봇 공학 및 비전 연구소에서 로봇이 테이블 주위로 버터 장난감 패키지를 옮깁니다. 누를 때마다 로봇은 UT Dallas 컴퓨터 과학자 팀이 개발한 새로운 시스템을 통해 물체를 인식하는 방법을 학습합니다.
새로운 시스템을 통해 로봇은 일련의 이미지가 수집될 때까지 물체를 여러 번 밀 수 있으며, 이를 통해 시스템은 로봇이 물체를 인식할 때까지 순서대로 모든 물체를 분할할 수 있습니다. 이전 접근 방식은 물체를 "학습"하기 위해 로봇이 한 번만 밀거나 잡는 것에 의존했습니다.
연구팀은 지난 7월 10~14일 대구에서 열린 로봇공학: 과학 및 시스템 컨퍼런스에서 연구 논문을 발표했습니다. 컨퍼런스 논문은 참신함, 기술적 품질, 중요성, 잠재적 영향 및 명확성을 기준으로 선정됩니다.
로봇이 저녁을 요리하고, 식탁을 치우고, 식기 세척기를 비울 수 있는 날은 아직 멀었습니다. 그러나 연구 그룹은 인공 지능을 사용하여 로봇이 물체를 더 잘 식별하고 기억할 수 있도록 돕는 로봇 시스템으로 상당한 발전을 이루었다고 논문의 수석 저자인 Yu Xiang 박사가 말했습니다.
Erik Jonsson 공학 및 컴퓨터 과학 대학의 컴퓨터 과학 조교수인 Xiang은 "로봇에게 머그컵이나 물병을 가져오라고 하면 로봇은 그러한 물체를 인식해야 합니다."라고 말했습니다.
UTD 연구원의 기술은 로봇이 집과 같은 환경에서 발견되는 다양한 물체를 감지하고 다양한 브랜드, 모양 또는 크기로 제공되는 물병과 같은 일반적인 품목의 유사한 버전을 일반화하거나 식별할 수 있도록 설계되었습니다.
Xiang의 실험실 내부에는 Ramp라는 실험실 로봇을 훈련시키는 데 사용되는 스파게티, 케첩, 당근과 같은 일반적인 음식의 장난감 패키지로 가득 찬 보관함이 있습니다. Ramp는 둥근 모바일 플랫폼 위에 약 4피트 높이로 서 있는 Fetch Robotics 모바일 조작 로봇입니다. 램프에는 7개의 관절이 있는 긴 기계 팔이 있습니다. 끝에는 물체를 잡을 수 있는 두 손가락이 있는 사각형 "손"이 있습니다.
Xiang은 로봇이 아이들이 장난감과 상호 작용하는 법을 배우는 것과 비슷한 방식으로 항목을 인식하는 법을 배운다고 말했습니다.
Xiang은 "물체를 밀고 나면 로봇은 그것을 인식하는 법을 배웁니다."라고 말했습니다. “이 데이터를 사용하여 AI 모델을 훈련하므로 다음에 로봇이 물체를 볼 때 다시 밀어 넣을 필요가 없습니다. 두 번째로 물체를 볼 때쯤에는 그 물체를 집어들 것입니다.”
연구진의 방법에서 새로운 점은 로봇이 각 항목을 15~20회 밀어 넣는 반면, 이전의 대화형 인식 방법은 한 번만 누르는 것입니다. Xiang은 여러 번 누르면 로봇이 깊이 센서가 포함된 RGB-D 카메라로 더 많은 사진을 찍어 각 항목에 대해 더 자세히 배울 수 있다고 말했습니다. 이렇게 하면 실수 가능성이 줄어듭니다.
“물체를 밀고 나면 로봇은 그것을 인식하는 법을 배웁니다. 그 데이터를 사용하여 우리는 AI 모델을 훈련시켜서 두 번째로 물체를 볼 때 바로 집어들게 됩니다.”
Yu Xiang 박사, Erik Jonsson 공학 및 컴퓨터 과학 학교 컴퓨터 과학 조교수
분할이라고 불리는 물체를 인식하고 구별하고 기억하는 작업은 로봇이 작업을 완료하는 데 필요한 주요 기능 중 하나입니다.
Xiang은 "우리가 아는 한, 이것은 객체 분할을 위해 장기적인 로봇 상호 작용을 활용하는 최초의 시스템입니다."라고 말했습니다.
컴퓨터 과학 박사 과정 학생인 Ninad Khargonkar는 이 프로젝트 작업을 통해 로봇이 의사 결정을 내리는 데 도움이 되는 알고리즘을 개선하는 데 도움이 되었다고 말했습니다.
“알고리즘을 개발하고 추상적인 데이터 세트에서 테스트하는 것은 하나의 일입니다. 실제 작업에서 테스트하는 것은 또 다른 일입니다.”라고 Khargonkar는 말했습니다. "실제 성과를 보는 것은 중요한 학습 경험이었습니다."
연구원들의 다음 단계는 재활용 재료 분류와 같은 작업을 가능하게 할 수 있는 계획 및 제어를 포함한 다른 기능을 개선하는 것입니다.
이 논문의 다른 UTD 저자로는 컴퓨터 과학 대학원생 Yangxiao Lu; 컴퓨터 과학 선배인 Zesheng Xu와 Charles Averill; Kamalesh Palanisamy MS'23; 컴퓨터과학과 조교수 Yunhui Guo 박사; 그리고 컴퓨터 과학 부교수인 Nicholas Ruozzi 박사도 있습니다. 라이스 대학교의 Kaiyu Hang 박사도 참여했습니다.