Google DeepMind, 2D 이미지에서 3D 객체를 렌더링 할 수 있는 AI 발표



Google의 DeepMind는 2D 이미지로부터 3D 객체를 렌더링 할 수 있는 컴퓨터 비전 인식 알고리즘인 GQN(Generative Query Network) 시스템을 Science지에 발표했습니다.

GQN 프로젝트는 사람의 뇌가 주위를 둘러보면서 세상에 대해 배우는 방식을 그대로 재현하는 것을 목표합니다. GQN에는 두 부분이 있는데, 첫 번째는 몇 장의 이미지 센서를 통해 장면을 보고 컴퓨터 코드로 표현하는 “representation network”이고, 두 번째는 관찰하지 않은 시점에서 장면을 예측하거나 상상하는 "generation network"입니다.

기존의 비전 인식 알고리즘은 시스템을 교육하기 위해 방대한 양의 주석이 달린 이미지 데이터 세트가 필요했습니다. GQN은 이러한 효율적이지 않은 비전 인식 알고리즘을 단 몇 장의 이미지만으로 교육할 수 있도록 개발되고 있습니다.

GQN 시스템은 앞으로 많은 분야에서 활용될 수 있는 가능성을 지니고 있습니다. 자율주행차에 적용되어 차 주위에 무엇이 있는지 더 정확히 파악할 수 있으며, 홈로봇에 적용되어 집의 구조와 사물들의 종류 및 위치를 정확히 알 수 있습니다. 또한 AR 안경에 적용되면 가상 이미지와 실제 공간은 더욱 자연스럽게 보일 것입니다.

출처 : deepmindventurebeat

이미지 출처 : deepmind

함께보면 좋은 기사

Google DeepMind, 2D 이미지에서 3D 객체를 렌더링 할 수 있는 AI 발표



Google의 DeepMind는 2D 이미지로부터 3D 객체를 렌더링 할 수 있는 컴퓨터 비전 인식 알고리즘인 GQN(Generative Query Network) 시스템을 Science지에 발표했습니다.

GQN 프로젝트는 사람의 뇌가 주위를 둘러보면서 세상에 대해 배우는 방식을 그대로 재현하는 것을 목표합니다. GQN에는 두 부분이 있는데, 첫 번째는 몇 장의 이미지 센서를 통해 장면을 보고 컴퓨터 코드로 표현하는 “representation network”이고, 두 번째는 관찰하지 않은 시점에서 장면을 예측하거나 상상하는 "generation network"입니다.

기존의 비전 인식 알고리즘은 시스템을 교육하기 위해 방대한 양의 주석이 달린 이미지 데이터 세트가 필요했습니다. GQN은 이러한 효율적이지 않은 비전 인식 알고리즘을 단 몇 장의 이미지만으로 교육할 수 있도록 개발되고 있습니다.

GQN 시스템은 앞으로 많은 분야에서 활용될 수 있는 가능성을 지니고 있습니다. 자율주행차에 적용되어 차 주위에 무엇이 있는지 더 정확히 파악할 수 있으며, 홈로봇에 적용되어 집의 구조와 사물들의 종류 및 위치를 정확히 알 수 있습니다. 또한 AR 안경에 적용되면 가상 이미지와 실제 공간은 더욱 자연스럽게 보일 것입니다.

출처 : deepmindventurebeat

이미지 출처 : deepmind

함께보면 좋은 기사