테슬라 AI Day에서 주목되는 하이라이트 4가지

테슬라가 2년 전 시점인 2019년 4월 Autonomy Day를 개최한 이후, 8월 19일(미국 현지 시각) AI Day 행사를 개최했습니다. 


해당 이벤트는 자사가 전기차 회사 그 이상으로 보여지기 원하는 CEO인 일론 머스크(Elon Musk)의 열망이 확인된 것으로 평가됩니다. 머스크는 테슬라를 "추론 및 학습 레벨로 하드웨어에서 심층 AI 활동을 하는 회사(a company with “deep AI activity in hardware on the inference level and on the training level)"로 설명했습니다. 구체적으로 자사가 활용하는 AI가, 이번 이벤트에서 공개된 휴머노이드 로봇을 포함해, 자율주행차는 물론, 그 이상의 애플리케이션에 사용될 수 있는 기술임을 강조한 것입니다.


테슬라 AI Day는 테슬라의 비전 및 AI 팀에 합류하고 회사가 자율주행 그 이상으로 나아가는 것을 돕는 최고의 인재를 모집하고자 하는 분명한 목표와 함께, 엔지니어들이 다양한 자사 기술을 설명하는 것으로 구성되었습니다. 머스크 역시 이를 작동시키려면 엄청난 양의 작업이 필요하기 때문에 재능있는 사람들이 참여하고 문제를 해결할 필요가 있다고 강조했습니다.  


머스크는 언제 무인 자동차가 될수 있을지에 대한 어떠한 예측도 자제하는 모습을 보이며, 2년 전 개최된 Autonomy Day보다 더욱 신중한 접근을 보여주었습니다. 최근 알려진 테슬라 오토파일럿에 대한 NHTSA의 조사 착수 건에 대해서는 회피하는 입장이었다고 합니다.


테슬라는 자사가 진행 중인 R&D 이니셔티브를 강조하는 몇가지 차세대 기술을 선보였는데, 공개된 몇가지 사항 중 하이라이트 4가지를 정리하면, 하기와 같습니다.


1. 휴머노이드 로봇인 테슬라 봇(Tesla Bot)


테슬라 봇 공개 소식은 테슬라 엔지니어들과 경영진이 컴퓨터 비전·Dojo 슈퍼컴퓨터· 테슬라 자체 칩 등에 대해 설명한 이후, AI Day 이벤트를 마무리하는 Q&A 세션 바로 전에 공개된 것임에도 가장 흥미를 끌었습니다. 실제 머스크가 테슬라 봇(Tesla Bot)을 무대에서 소개하는 것으로 금번 이벤트를 마무리했는데요.

물론 행사에서 공개된 것은 검정 헬멧과 흰색 양복 옷을 입고, 로봇처럼 걷고 춤을 추는 '휴먼'이었습니다. 그럼에도 테슬라 봇은 단순한 대역이 아니라, 테슬라가 실제로 구축하고 휴머노이드 로봇을 소개한 것으로, 머스크는 아마도 내년 정도에 프로토타입을 만들 것이며 기본적으로 이같은 모양이라고 밝혔습니다.


테슬라봇 소개 영상

출처: 유튜브


머스크는 식료품 쇼핑과 같은 힘들고 단조로운 휴먼의 일 또는 사람들이 가장 하기 싫은 일이나 위험한 일들을 테슬라 봇과 같은 휴머노이드 로봇이 대신할 수 있는 세상을 꿈꾼다고 밝혔습니다.


코드명 옵티머스(Optimus)인 테슬라 봇은 5피트 8인치, 125 파운드로, 150 파운드의 무게를 들수 있고 시속 5마일로 걸을 수 있으며, 중요한 정보를 표시하는 헤드 스크린이 있다고 합니다.


한편 테슬라 봇은 신경망 및 Dojo 고급 슈퍼컴퓨터에 대한 자사의 기술력을, 비자동차(non-automotive) 영역의 로보틱스 유즈케이스로 확장한 것으로 여겨지고 있습니다. 



2. Dojo 슈퍼컴퓨터 용 자체 설계 칩인 'D1' 공개


테슬라 자율주행 부서를 이끌고 있는 가네시 벤카타라마난(Ganesh Venkataramanan) 이사는 완전히 사내에서 설계/제작된 자체 칩을 공개했습니다. 해당 칩은 시뮬레이션 및 비디오 트레이닝에 사용할 계획인 자사 슈퍼컴퓨터인 Dojo를 작동시키는데 사용한다고 합니다.


테슬라의 AI 아키텍쳐 대부분을 신경망 훈련 컴퓨터(neural network training computer)인 Dojo에 의존하고 있는데요. 머스크의 설명에 의하면, 해당 슈퍼컴퓨터는 방대한 양의 카메라 이미징 데이터를 타 컴퓨터 대비 4배 더 빠르게 처리할 것이며, Dojo에서 훈련된 AI 소프트웨어는 무선업데이트(OTA update)를 통해 테슬라 고객에게 푸시될 것이라고 합니다.


이번에 공개된 해당 칩의 이름은 D1으로, 7nm 기술이 포함되어 있습니다. 벤카타라마난은 D1이 CPU 연결이 가능한 GPU 레벨의 연산 역량을 가졌으며, I/O 대역폭이 현재 시중에 나와있는 최첨단 네트워킹 스위치 칩의 두배라는 점을 자랑스럽게 언급했다고 합니다.


D1칩

출처: 테슬라 유튜브


벤카타라마난는 또한 테슬라가 병목(bottlenecks) 현상을 피하기 위해 가능한 한 많은 기술 스택을 소유하기를 원한다고도 덧붙였는데, 글로벌 칩 쇼티지를 차치하더라도, 사내에서 칩을 생산하고자 하는 전반적인 목표는 더 나은 AI 성능을 위해 대역폭을 늘리고 레이턴시를 줄이기 위함임을 강조했습니다.


또한 자사는 연산과 데이터 전송을 동시에 수행할 수 있으며, 커스텀 명령어 집합 아키텍처(ISA, instruction set architecture)가 머신러닝 워크로드에 완전히 최적화되어 있다고 엇붙였습니다. 


마지막으로 벤카타라마난는 타일당 9페타플롭 및 초당 36테라바이트의 대역폭이라는 더 높은 대역폭과 놀라운 컴퓨팅 파워를 얻기 위해 여러 칩을 통합하는 '트레이닝 타일(training tile)'을 공개했으며, 여러 트레이닝 타일들이 Dojo 슈퍼 컴퓨터를 구성한다고 설명했습니다.


한편 블룸버그 측은 머스크가 D1 칩에 대해 타 오토메이커를 대상으로 자사 기술을 라이센스하는 방안을 고려할 것이라고 언급했음을 전했는데요. 테슬라가 이같이 기술 라이선스를 추진할 경우, 엔비디아(Nvidia)는 물론 현재 오토메이커에 칩을 공급하는 업체들과 경쟁하게 될 것으로 보입니다. 서스쿼하나 파이낸셜 그룹(Susquehanna Financial Group) 소속의 한 반도체 애널리스트는, 엔비디아의 프로그래밍 언어인 CUDA가 산업 표준으로 작용하고 있어 인공지능 칩 분야에서 여전히 선두를 달리고 있는 가운데, 엔지니어들이 새로운 언어를 학습해야 하는 것을 꺼리지만, 그럼에도 테슬라에게 여전히 놀라운 성과가 될 것이라고 평가했습니다.



3. 완전 자율주행과 그 이상으로의 확장


다수 엔지니어들은 Dojo에 대해, 테슬라의 확실히 인상적인 ADAS(advanced driver assistance system)인 FSD(Full Self-Driving) 시스템을 위한 기술일 뿐만 아니라, 아직 완전히 자율주행하거나 자율적이지 않은 시스템을 위한 기술이라고도 설명했습니다.


강력한 슈퍼컴퓨터는 시뮬레이션 아키텍처 등 여러 측면으로 구성되어 있는데, 테슬라 측은 타 오토메이커나 기술 기업들에게까지 개방되어 보편적으로 확장하기를 희망한다고 밝혔습니다.


머스크는 해당 기술이 테슬라 차량에만 국한된 것이 아니라며, FSD 베타를 경험해 본 사람이라면 테슬라 신경망이 운전을 배우는 속도를 이해할 것이라고 설명했습니다. 


또한 머스크는 Dojo가 내년에 운영될 것으로 예상하고 있으며, 그 시점에 해당 기술이 다른 많은 유즈케이스에 적용되는 방법에 대해 논의할 것이라고 전했습니다.



4. 컴퓨터 비전 문제를 해결하기 위한 노력


주지하다시피, 자율주행 영역에서 오로라(Aurora), 크루즈(Cruise), 웨이모(Waymo), 죽스(Zoox)와 같은 라이벌 업체들은 자율성을 추구하기 위해 카메라·라이다·레이더 센서를 혼합하여 사용하는 반면, 테슬라는 엔지니어들이 말하는 실시간 3차원 벡터 스페이스(vector space)을 처리하기 위해 차량에 장착된 8개의 카메라를 사용하는 순수한 비전 기반 시스템(purely“vision"-based system)을 개발하고 있습니다. 


테슬라 비전 시스템 

출처: 테슬라 유튜브


특히 AI Day에서 다수 엔지니어들은 테슬라가 자율성(Autonomy)에 대한 자사 접근 방식인 비전 기반 접근(vision-based approach)에 대한 강력한 지지를 나타냈습니다. 이는 오토파일럿 시스템을 통해 자동차가 지구상의 어느 곳에서나 이상적으로 작동할 수 있도록 신경망(neural networks)을 사용한 접근법을 의미하는데요.


테슬라 AI 이사인 안드레아 카르파티(Andrej Karpathy)는 테슬라의 아키텍처를 "처음부터 동물을 만드는 것(building an animal from the ground up)"에 빗대어, 이리저리 움직이고 주변 환경을 감지하며, 보는 것에 따라 지능적이고 자율적으로 행동하기 때문이라고 설명했습니다. 


또한 그는 테슬라의 신경망이 시간이 지남에 따라 어떻게 발전했는지 설명하며, 본질적으로 시각 정보를 처리하는 자동차의 뇌(brain)의 첫번째 파트인 시각 피질(visual cortex)이 광범위한 신경망 아키텍처와 함께 설계됨에 따라 정보가 시스템에 보다 지능적으로 흐르는지를 설명했습니다.


이와 관련하여 테슬라가 컴퓨터 비전 아키텍처로 해결하기 위해 노력하고 있는 두가지 주요 문제 중, 첫번째는 일시적인 폐색(temporary occlusions)을 꼽을 수 있다고 합니다. 이는 번잡한 교차로에 있는 자동차들이 도로 너머의 오토파일럿 시야를 차단하는 것을 의미합니다. 두번째는 도로에서 더 일찍 나타나는 표지판이나 표시로서, 예를 들면 100미터 차선이 합쳐진다는 표지판이 있는데, (그 이전 시점이 아니라) 합류 차선에 도착했을 때 컴퓨터가 이를 기억한다던가 하는 이슈였다고 합니다.


해당 이슈들을 해결하기 위해 테슬라 엔지니어들은 공간적 반복 네트워크 비디오 모듈(spatial recurring network video module)을 도입했다고 합니다. 이는 모듈의 다른 측면들이 도로의 다른 측면을 추적하여 공간 기반 및 시간 기반의 대기열(queue)을 형성하고, 둘다 데이터 캐시를 생성해, 도로에 대한 예측을 시도할 때 모델이 다시 참조하도록 하는 기법을 의미합니다.


또한 테슬라는 대규모로 레이블을 지정하기 위해 1,000명 이상 인력으로 구성된 수동 데이터 레이블링 팀을 유연하게 꾸려서, 테슬라가 (대부분 도로에 있는 테슬라 차량에서 가져 온) 특정 클립에 자동 레이블을 지정하는 방법을 학습시켰다고 합니다.


이같이 모든 실제 정보를 바탕으로 AI팀이 놀라운 시뮬레이션을 활용하고 있으며, 시뮬레이션은 특히 소스나 레이블 지정이 어려운 데이터에 도움이 된다고 밝혔습니다. 



출처: 테크크런치, 블룸버그




함께보면 좋은 기사

테슬라 AI Day에서 주목되는 하이라이트 4가지

테슬라가 2년 전 시점인 2019년 4월 Autonomy Day를 개최한 이후, 8월 19일(미국 현지 시각) AI Day 행사를 개최했습니다. 


해당 이벤트는 자사가 전기차 회사 그 이상으로 보여지기 원하는 CEO인 일론 머스크(Elon Musk)의 열망이 확인된 것으로 평가됩니다. 머스크는 테슬라를 "추론 및 학습 레벨로 하드웨어에서 심층 AI 활동을 하는 회사(a company with “deep AI activity in hardware on the inference level and on the training level)"로 설명했습니다. 구체적으로 자사가 활용하는 AI가, 이번 이벤트에서 공개된 휴머노이드 로봇을 포함해, 자율주행차는 물론, 그 이상의 애플리케이션에 사용될 수 있는 기술임을 강조한 것입니다.


테슬라 AI Day는 테슬라의 비전 및 AI 팀에 합류하고 회사가 자율주행 그 이상으로 나아가는 것을 돕는 최고의 인재를 모집하고자 하는 분명한 목표와 함께, 엔지니어들이 다양한 자사 기술을 설명하는 것으로 구성되었습니다. 머스크 역시 이를 작동시키려면 엄청난 양의 작업이 필요하기 때문에 재능있는 사람들이 참여하고 문제를 해결할 필요가 있다고 강조했습니다.  


머스크는 언제 무인 자동차가 될수 있을지에 대한 어떠한 예측도 자제하는 모습을 보이며, 2년 전 개최된 Autonomy Day보다 더욱 신중한 접근을 보여주었습니다. 최근 알려진 테슬라 오토파일럿에 대한 NHTSA의 조사 착수 건에 대해서는 회피하는 입장이었다고 합니다.


테슬라는 자사가 진행 중인 R&D 이니셔티브를 강조하는 몇가지 차세대 기술을 선보였는데, 공개된 몇가지 사항 중 하이라이트 4가지를 정리하면, 하기와 같습니다.


1. 휴머노이드 로봇인 테슬라 봇(Tesla Bot)


테슬라 봇 공개 소식은 테슬라 엔지니어들과 경영진이 컴퓨터 비전·Dojo 슈퍼컴퓨터· 테슬라 자체 칩 등에 대해 설명한 이후, AI Day 이벤트를 마무리하는 Q&A 세션 바로 전에 공개된 것임에도 가장 흥미를 끌었습니다. 실제 머스크가 테슬라 봇(Tesla Bot)을 무대에서 소개하는 것으로 금번 이벤트를 마무리했는데요.

물론 행사에서 공개된 것은 검정 헬멧과 흰색 양복 옷을 입고, 로봇처럼 걷고 춤을 추는 '휴먼'이었습니다. 그럼에도 테슬라 봇은 단순한 대역이 아니라, 테슬라가 실제로 구축하고 휴머노이드 로봇을 소개한 것으로, 머스크는 아마도 내년 정도에 프로토타입을 만들 것이며 기본적으로 이같은 모양이라고 밝혔습니다.


테슬라봇 소개 영상

출처: 유튜브


머스크는 식료품 쇼핑과 같은 힘들고 단조로운 휴먼의 일 또는 사람들이 가장 하기 싫은 일이나 위험한 일들을 테슬라 봇과 같은 휴머노이드 로봇이 대신할 수 있는 세상을 꿈꾼다고 밝혔습니다.


코드명 옵티머스(Optimus)인 테슬라 봇은 5피트 8인치, 125 파운드로, 150 파운드의 무게를 들수 있고 시속 5마일로 걸을 수 있으며, 중요한 정보를 표시하는 헤드 스크린이 있다고 합니다.


한편 테슬라 봇은 신경망 및 Dojo 고급 슈퍼컴퓨터에 대한 자사의 기술력을, 비자동차(non-automotive) 영역의 로보틱스 유즈케이스로 확장한 것으로 여겨지고 있습니다. 



2. Dojo 슈퍼컴퓨터 용 자체 설계 칩인 'D1' 공개


테슬라 자율주행 부서를 이끌고 있는 가네시 벤카타라마난(Ganesh Venkataramanan) 이사는 완전히 사내에서 설계/제작된 자체 칩을 공개했습니다. 해당 칩은 시뮬레이션 및 비디오 트레이닝에 사용할 계획인 자사 슈퍼컴퓨터인 Dojo를 작동시키는데 사용한다고 합니다.


테슬라의 AI 아키텍쳐 대부분을 신경망 훈련 컴퓨터(neural network training computer)인 Dojo에 의존하고 있는데요. 머스크의 설명에 의하면, 해당 슈퍼컴퓨터는 방대한 양의 카메라 이미징 데이터를 타 컴퓨터 대비 4배 더 빠르게 처리할 것이며, Dojo에서 훈련된 AI 소프트웨어는 무선업데이트(OTA update)를 통해 테슬라 고객에게 푸시될 것이라고 합니다.


이번에 공개된 해당 칩의 이름은 D1으로, 7nm 기술이 포함되어 있습니다. 벤카타라마난은 D1이 CPU 연결이 가능한 GPU 레벨의 연산 역량을 가졌으며, I/O 대역폭이 현재 시중에 나와있는 최첨단 네트워킹 스위치 칩의 두배라는 점을 자랑스럽게 언급했다고 합니다.


D1칩

출처: 테슬라 유튜브


벤카타라마난는 또한 테슬라가 병목(bottlenecks) 현상을 피하기 위해 가능한 한 많은 기술 스택을 소유하기를 원한다고도 덧붙였는데, 글로벌 칩 쇼티지를 차치하더라도, 사내에서 칩을 생산하고자 하는 전반적인 목표는 더 나은 AI 성능을 위해 대역폭을 늘리고 레이턴시를 줄이기 위함임을 강조했습니다.


또한 자사는 연산과 데이터 전송을 동시에 수행할 수 있으며, 커스텀 명령어 집합 아키텍처(ISA, instruction set architecture)가 머신러닝 워크로드에 완전히 최적화되어 있다고 엇붙였습니다. 


마지막으로 벤카타라마난는 타일당 9페타플롭 및 초당 36테라바이트의 대역폭이라는 더 높은 대역폭과 놀라운 컴퓨팅 파워를 얻기 위해 여러 칩을 통합하는 '트레이닝 타일(training tile)'을 공개했으며, 여러 트레이닝 타일들이 Dojo 슈퍼 컴퓨터를 구성한다고 설명했습니다.


한편 블룸버그 측은 머스크가 D1 칩에 대해 타 오토메이커를 대상으로 자사 기술을 라이센스하는 방안을 고려할 것이라고 언급했음을 전했는데요. 테슬라가 이같이 기술 라이선스를 추진할 경우, 엔비디아(Nvidia)는 물론 현재 오토메이커에 칩을 공급하는 업체들과 경쟁하게 될 것으로 보입니다. 서스쿼하나 파이낸셜 그룹(Susquehanna Financial Group) 소속의 한 반도체 애널리스트는, 엔비디아의 프로그래밍 언어인 CUDA가 산업 표준으로 작용하고 있어 인공지능 칩 분야에서 여전히 선두를 달리고 있는 가운데, 엔지니어들이 새로운 언어를 학습해야 하는 것을 꺼리지만, 그럼에도 테슬라에게 여전히 놀라운 성과가 될 것이라고 평가했습니다.



3. 완전 자율주행과 그 이상으로의 확장


다수 엔지니어들은 Dojo에 대해, 테슬라의 확실히 인상적인 ADAS(advanced driver assistance system)인 FSD(Full Self-Driving) 시스템을 위한 기술일 뿐만 아니라, 아직 완전히 자율주행하거나 자율적이지 않은 시스템을 위한 기술이라고도 설명했습니다.


강력한 슈퍼컴퓨터는 시뮬레이션 아키텍처 등 여러 측면으로 구성되어 있는데, 테슬라 측은 타 오토메이커나 기술 기업들에게까지 개방되어 보편적으로 확장하기를 희망한다고 밝혔습니다.


머스크는 해당 기술이 테슬라 차량에만 국한된 것이 아니라며, FSD 베타를 경험해 본 사람이라면 테슬라 신경망이 운전을 배우는 속도를 이해할 것이라고 설명했습니다. 


또한 머스크는 Dojo가 내년에 운영될 것으로 예상하고 있으며, 그 시점에 해당 기술이 다른 많은 유즈케이스에 적용되는 방법에 대해 논의할 것이라고 전했습니다.



4. 컴퓨터 비전 문제를 해결하기 위한 노력


주지하다시피, 자율주행 영역에서 오로라(Aurora), 크루즈(Cruise), 웨이모(Waymo), 죽스(Zoox)와 같은 라이벌 업체들은 자율성을 추구하기 위해 카메라·라이다·레이더 센서를 혼합하여 사용하는 반면, 테슬라는 엔지니어들이 말하는 실시간 3차원 벡터 스페이스(vector space)을 처리하기 위해 차량에 장착된 8개의 카메라를 사용하는 순수한 비전 기반 시스템(purely“vision"-based system)을 개발하고 있습니다. 


테슬라 비전 시스템 

출처: 테슬라 유튜브


특히 AI Day에서 다수 엔지니어들은 테슬라가 자율성(Autonomy)에 대한 자사 접근 방식인 비전 기반 접근(vision-based approach)에 대한 강력한 지지를 나타냈습니다. 이는 오토파일럿 시스템을 통해 자동차가 지구상의 어느 곳에서나 이상적으로 작동할 수 있도록 신경망(neural networks)을 사용한 접근법을 의미하는데요.


테슬라 AI 이사인 안드레아 카르파티(Andrej Karpathy)는 테슬라의 아키텍처를 "처음부터 동물을 만드는 것(building an animal from the ground up)"에 빗대어, 이리저리 움직이고 주변 환경을 감지하며, 보는 것에 따라 지능적이고 자율적으로 행동하기 때문이라고 설명했습니다. 


또한 그는 테슬라의 신경망이 시간이 지남에 따라 어떻게 발전했는지 설명하며, 본질적으로 시각 정보를 처리하는 자동차의 뇌(brain)의 첫번째 파트인 시각 피질(visual cortex)이 광범위한 신경망 아키텍처와 함께 설계됨에 따라 정보가 시스템에 보다 지능적으로 흐르는지를 설명했습니다.


이와 관련하여 테슬라가 컴퓨터 비전 아키텍처로 해결하기 위해 노력하고 있는 두가지 주요 문제 중, 첫번째는 일시적인 폐색(temporary occlusions)을 꼽을 수 있다고 합니다. 이는 번잡한 교차로에 있는 자동차들이 도로 너머의 오토파일럿 시야를 차단하는 것을 의미합니다. 두번째는 도로에서 더 일찍 나타나는 표지판이나 표시로서, 예를 들면 100미터 차선이 합쳐진다는 표지판이 있는데, (그 이전 시점이 아니라) 합류 차선에 도착했을 때 컴퓨터가 이를 기억한다던가 하는 이슈였다고 합니다.


해당 이슈들을 해결하기 위해 테슬라 엔지니어들은 공간적 반복 네트워크 비디오 모듈(spatial recurring network video module)을 도입했다고 합니다. 이는 모듈의 다른 측면들이 도로의 다른 측면을 추적하여 공간 기반 및 시간 기반의 대기열(queue)을 형성하고, 둘다 데이터 캐시를 생성해, 도로에 대한 예측을 시도할 때 모델이 다시 참조하도록 하는 기법을 의미합니다.


또한 테슬라는 대규모로 레이블을 지정하기 위해 1,000명 이상 인력으로 구성된 수동 데이터 레이블링 팀을 유연하게 꾸려서, 테슬라가 (대부분 도로에 있는 테슬라 차량에서 가져 온) 특정 클립에 자동 레이블을 지정하는 방법을 학습시켰다고 합니다.


이같이 모든 실제 정보를 바탕으로 AI팀이 놀라운 시뮬레이션을 활용하고 있으며, 시뮬레이션은 특히 소스나 레이블 지정이 어려운 데이터에 도움이 된다고 밝혔습니다. 



출처: 테크크런치, 블룸버그




함께보면 좋은 기사