Silicon Valley Story

벤처와 벤처캐피탈에 대한 개인적인 경험과 생각

AI의 미래

2012년 CNN (convolutional neural network)이라는 말이 등장하고, 2013년도에는 그 유명한 개/고양이 classification 모델이 나와서 일반인들의 어마어마한 관심을 이끌었다. 그리고 한동안 쥐죽은 듯이 조용하다가…(물론 그 사이에 수 많은 AI 회사들이 등장했고, 대부분 제대로된 사업모델을 만들지 못했다) 그러다가 2023년도 ChatGPT와 함께 AI는 다시 일반인들도 다 미래라고 수긍하는 주제가 되었다. 물론 그 기간 사이에 개/고양이 classification은 완벽해졌다. 더 이상은 개/고양이를 헤깔리게 하려는 트릭은 통하지 않는다.

이제 AI의 가장 화두는 ‘집중화’이다. AI의 성능을 좌우하는 것이 1) compute, 2) data size, 3) parameters 라고 한다. ‘연산/데이터/모델’이라고 할수도 있겠다. 일반적으로는 대부분 시스템에서 input이 어느 규모를 넘어가면 output 성능 개선의 정도가 저하되거나 오히려 성능의 하락을 가져오는데, AI는 아직까지도 1/2/3에 따라 AI 성능이 증가하고 있다고 한다. 더 강력한 연산, 더 많은 데이터 확보, 더 뛰어난 모델 개발. 그래서 output 대비 input의 최적화 보다는, input 최대화/output 최대화의 경쟁에 있다. 물론 이것은 소위 AGI (artificial general intelligence)에 해당하기는 하고, 특정 서비스/애플리케이션에는 최적화가 필요하기는 하다.

그런데 이런 ‘최대화’ 경쟁의 가장 중요한 무기는 ‘자본’이다. 그래서 자본이 많은 대기업과 대규모의 펀딩을 받은 몇몇 회사 (OpenAI, Anthropic 등)가 output의 질적인 경쟁적 우위를 보이고 있다. 이런 ‘집중화’는 향후 AI의 위험성, 신뢰성, 공정성 등 여러 측면에서, ‘아직은 알 수 없는, 하지만 개연성이 충분히 있는’ 여러 리스크를 담고 있다.

연산 측면에서 GPU를 어마어마하게 구매하고 전력비를 아낌없이 쓸수 있는 자원은 AI를 실제 구현하는 데에 결정적인 경쟁력이다. 데이터는 데이터 가치 증가에 따라 데이터 오너가 공짜로 스크래핑해가는 활동에 뭔가 제한을 가하기 시작했고 이를 유료화할 수록 자본이 빵빵한 기업이 데이터 접근이 더 용이해 질 것이다. (물론 AI 트레이닝에 필요한 데이터가 더 이상 남아있지 않다고도 한다). 모델 측면에서는 경쟁이 분명히 있을 것이고, 특히 오픈소스 모델과의 경쟁이 증가할 것이다.

오픈소스의 “무료 + 조금은 좀 떨어진 수준 결과물” vs. 자본력의 “유료 + 높은 수준 결과물” 간의 경쟁이 가능할 수도 있고, 오히려 오픈소스에 유리한 환경이 될수도 있다. 특히 트레이닝이 거의 끝나는 시점이 된다면. 지금의 자본에 의한 기술발전의 ‘집중화’는 서비스 개발을 통한 사업의 ‘집중화’로 전개될 수 있을 것이다. 애플이나 구글처럼. OpenAI와 Jony Ive가 힘을 합쳐서 “HW + SW”의 사업모델을 굳이 만들어 보려는 이유가 이런 환경 때문일수도 있겠다.

Published by

Leave a comment