엔비디아가 꿈꾸는 미래, 월드 모델과 함께 여는 새로운 AI 생태계

 

1. 더 이상 주가를 움직이지 않는 GTC, 그런데 왜 중요할까?

얼마전 엔비디아의 최대 연례 행사 GTC가 있었습니다. 예전 같으면 젠슨 황의 발표 하나에 시장이 들썩이고, 주가는 상승 곡선을 그렸을 겁니다. 하지만 이번엔 달랐습니다. 주가는 별다른 움직임 없이 조용했고, 분위기도 이전만큼 뜨겁진 않았습니다. 언론에선 AI 관련 기사들이 쏟아지지만, 실제로 무엇이 달라지는 건지 와닿지 않고, 새롭게 등장하는 용어들에선 혼란만 커질 뿐입니다.
그래서 ‘도대체 엔비디아가 진짜 그리고 있는 미래는 무엇인가’라는 질문의 답을 찾아보겠습니다.

2. 딥러닝의 데모, 페이리와 이미지넷의 시대

2006년, 스탠퍼드의 컴퓨터 비전 연구실을 이끌던 페이리는 딥러닝 시대의 문을 여는 거대한 프로젝트 하나를 시작합니다. 바로 이미지넷입니다. 천만 건이 넘는 이미지 데이터를 무료로 제공하고, 이를 분류하는 대회를 함께 운영했죠. 그리고 2012년, 이 대회에서 세상을 놀라게 한 팀이 등장합니다. 슈퍼비전입니다.
당시 다른 팀들이 20~30% 수준의 오답률을 기록할 때, 슈퍼비전은 15.3%라는 경이적인 성과를 냈습니다. 이 팀을 이끈 인물은 바로 제프리 힌턴, 그리고 그의 제자 알렉스 크리제브스키, 일리야 수츠케버였습니다. 이들은 기존 방식 대신 딥러닝을 활용했고, 그 딥러닝을 구동하기 위해 엔비디아의 GPU와 쿠다가 사용되었습니다.
이 순간, 딥러닝이 AI의 주류가 되었고, 엔비디아는 AI 시대의 필수 인프라가 됩니다.

3. AI 3대장과 엔비디아 생태계의 탄생

 이후 제프리 힌턴과 그의 제자들은 AI 스타트업인 DNN리서치를 만들고, 구글이 이를 인수합니다. 이에 맞서 페이스북은 얀 르쿤을 초청해 뉴욕에 FAIR라는 AI 연구소를 세웁니다. 여기에 요슈아 벤지오까지 합세해, 이들은 선의의 경쟁과 협업을 거듭하며 AI 생태계를 이끌게 됩니다.
삼성전자 역시 2017년 캐나다 몬트리올에 있는 벤지오의 연구소와 협력하며 발을 담갔습니다. 그리고 2018년, 이 세 사람은 딥러닝에 대한 공로로 컴퓨터 과학계의 노벨상인 튜링상을 공동 수상하게 됩니다.

4. AI의 급속한 발전, 그리고 입장 차이

그러나 AI가 빠르게 발전하면서 이들 사이에도 입장 차가 생기기 시작합니다. 힌턴은 2023년 구글을 퇴사하며 “내 AI 연구를 후회한다”고 말합니다. AI가 인간의 통제력을 빼앗을 수 있다는 우려 때문이었죠.
반면 얀 르쿤과 페이리는 다른 입장입니다. AI는 잘만 활용하면 충분히 인간에게 도움이 될 수 있다는 낙관적인 시선입니다. 특히 얀 르쿤은 “지금의 AI는 고양이보다도 못하다”며 우려가 과장됐다고 일축합니다.

5. LLM의 한계, 그리고 얀 르쿤의 월드 모델

얀 르쿤은 LLM, 즉 대규모 언어 모델만으로는 인간 수준의 지능, 즉 AGI에 도달할 수 없다고 말합니다. 인간의 지능은 언어뿐 아니라 비언어적 상호작용에서 비롯되기 때문입니다.
그래서 그는 월드 모델이라는 새로운 학습 방식을 제안합니다. 인간이 세상을 직접 조작하고 그 결과를 학습하듯, AI도 시뮬레이션된 세계 속에서 행동과 결과를 경험하며 학습해야 한다는 것이죠.

6. 월드 모델의 가능성과 월드랩스의 등장

2018년, 구글이 월드 모델이라는 논문을 발표합니다. 현실을 가상 세계로 시뮬레이션하고, 그 안에서 AI가 학습하는 방식입니다. 그리고 2024년, 페이리가 다시 돌아옵니다. 월드 모델 스타트업 월드랩스를 창업한 것이죠.
이 회사는 아직 2D 이미지를 3D로 바꿔주는 서비스 하나만 공개했지만, 무려 2억 3천만 달러의 투자를 받았습니다. 단 한 장의 이미지로 3D 가상 세계를 만들고, 그 속에서 AI가 학습하게 하려는 것이 이들의 목표입니다.

7. 젠슨 황의 코스모스, 그리고 월드 모델 생태계 구축

이런 상황에서 가장 흐뭇한 얼굴을 한 사람이 있습니다. 바로 젠슨 황입니다. 그는 월드 모델이야말로 다음 AI 생태계의 중심이 될 것이라 보고, 누구보다 빠르게 코스모스라는 플랫폼을 공개합니다.
코스모스는 문장이나 이미지를 넣으면, 딸깍 한 번에 현실처럼 동작하는 가상의 세계를 만들어주는 툴입니다. 그리고 그 안에서는 물리 법칙이 적용된 시뮬레이션도 가능합니다.

8. 코스모스의 힘, GPU 수요를 다시 폭발시킬까?

이 월드 모델은 기존의 텍스트와 이미지 생성보다 훨씬 더 많은 GPU 연산을 요구합니다. 실제로 엔비디아는 코스모스 학습에 2천만 시간 분량의 영상 데이터를 사용했다고 밝혔습니다. 이건 기원전 258년부터 지금까지의 시간에 해당하는 양입니다.
코스모스에 사용된 데이터의 대부분은 자연에서의 상호작용, 공간 탐색, 손동작 및 물체 조작, 자율주행 관련 영상입니다. 여기서 자율주행이 핵심 타깃이라는 걸 알 수 있습니다.

9. 자율주행, 월드 모델이 필요한 산업의 대표 주자

자율주행 기술은 무수히 많은 변수를 학습해야 합니다. 그런데 실제 도로에서 테스트하는 것은 위험하고, 시간과 비용도 많이 듭니다. 어떤 연구에 따르면 안전성을 검증하려면 500년이 걸릴 수도 있다고 하죠.
이 문제를 해결하는 것이 월드 모델입니다. 가상 세계에서 수백만 번의 시뮬레이션을 반복하게 하면, 훨씬 빠르고 안전하게 자율주행 기술을 고도화할 수 있기 때문입니다. 이번 GTC에서도 엔비디아는 GM과의 협업을 통해 자율주행은 물론, 공장 자동화와 로봇 개발까지 확장하겠다고 밝혔습니다.

10. 저작권 논란, 그리고 AI가 마주한 딜레마

하지만 문제는 있습니다. 2천만 시간 분량의 영상, 그 출처가 명확하지 않다는 점입니다. 404 미디어에 따르면, 엔비디아는 유튜브, 넷플릭스 영상을 무단으로 크롤링해 학습에 사용했습니다. 실제로 유튜브 제작자들은 집단소송까지 제기한 상태입니다.
이런 상황은 엔비디아만의 문제는 아닙니다. 오픈AI, 구글, 메타 등도 저작권 논란에서 자유롭지 못합니다. 그런데 더 놀라운 건, 미국 정부가 오히려 이 저작권 장벽을 완화하려 한다는 점입니다. 지난 1월, 바이든 정부는 행정명령 14179호를 통해, AI 시장에서 미국의 리더십을 가로막는 장벽들을 제거하겠다고 선언합니다.
그중 대표적인 장벽으로, 빅테크 기업들이 저작권을 꼽은 것이죠. 중국과의 경쟁에서 우위를 점하기 위해서라면, 남의 데이터라도 마음껏 쓰게 해달라는 겁니다.

11. 월드 모델의 미래, 아직은 시작일 뿐

월드 모델은 엄청난 가능성을 품고 있지만, 동시에 많은 숙제를 안고 있습니다. 저작권 문제, 에너지 사용량, 그리고 상용화까지 걸릴 시간까지. 전문가들은 월드 모델이 실제 시장에 안착하기까지 최소 5년은 더 필요하다고 보고 있습니다.
하지만 이 5년은 결코 짧은 시간이 아닙니다. 그 사이, 제도와 윤리적 가이드라인, 그리고 기술적 인프라를 잘 마련해 둔다면, AI는 인간과 세상을 더 깊이 이해하고, 더 유익한 방식으로 우리와 공존할 수 있을지도 모릅니다.

GTC는 단순히 신제품 발표 행사가 아닙니다. 엔비디아가 AI의 미래를 어떻게 설계하고 있는지를 가장 생생하게 보여주는 무대입니다. 이번 행사에서 드러난 젠슨 황의 큰 그림은 명확합니다. 단지 더 똑똑한 AI가 아니라, 더 많이 행동하는 AI가 중심이 되는 세상. 그리고 그 중심에는 여전히 엔비디아가 있습니다.