최근에 Meta와 nVidia에서 굉장히 중요한 발표를 했는데, 언론에서는 그다지 비중있게 다뤄지지 않는 것 같아서, 발표 내용을 바탕으로, AI 업계의 변화 방향에 대해 이야기 해보려고 합니다.

 

먼저 메타부터 보겠습니다.

https://ai.meta.com/blog/meta-llama-3-1/

 

Introducing Llama 3.1: Our most capable models to date

For this release, we evaluated performance on over 150 benchmark datasets that span a wide range of languages. In addition, we performed extensive human evaluations that compare Llama 3.1 with competing models in real-world scenarios. Our experimental eval

ai.meta.com

메타는 기존 Llama 3.0을 개선하여 3.1을 발표했습니다.  7B, 80B 모델을 모두 개선하여 공개하였는데, 놀라운 점은 그 동안은 공개하지 않았던 405B 모델을 Open Source로 공개한 것입니다. 기존 7B, 80B 모델은 동급에서는 괜찮은 성능이었습니다만, ChatGPT나 Claude같은 경쟁사의 주력 모델에 대비해서는 모자랐습니다. 그런데 이 405B 모델은 ChatGPT, Claude대비 파라메터의 수는 절반 정도임에 비해, 초기 벤치마크 상의 성능은 비슷하거나 우위에 있음을 보여주고 있습니다. 이게 무슨 뜻이냐면, OpenAI와 Enthropic이 돈을 벌기 위한 핵심 아이템보다 비용효율적인 솔루션을 Meta는 Open Source로 뿌려버렸다는 것입니다. 이미 Groq, nVidia 등은 이 모델을 적극 지원하고 나섰습니다. 

 

다음으로 엔비디아입니다.

https://venturebeat.com/ai/nvidias-latest-ai-offering-could-spark-a-custom-model-gold-rush/

 

Nvidia’s latest AI offering could spark a custom model gold rush

Nvidia launches AI Foundry service, enabling businesses to create custom AI models with increased accuracy and control, potentially revolutionizing enterprise AI adoption.

venturebeat.com

엔비디아는 더 멀리보고 있는 것 같습니다. AI Foundry라는 일종의 LLM 플랫폼 서비스를 발표했습니다. 이 AI Foundry는 현재의 CUDA만큼 독점적 영향력을 발휘할 것으로 예상됩니다. AI Foundry는 반도체 업계에서의 TSMC와 같이, AI개발자들이 자신들의 모델을 만들 수 있게하고, 동시에 원하는 추론 아키텍쳐에 맞게 최적화된 NIMs(nVidia Inference Microservice)로 패키징하여 제공니다. 고객 맞춤형 AI 모델을 손쉽게 만들거나 만들 수 있게 해준다는 의미입니다. 이 NIMs는 다른 하드웨어에서도 실행될 수는 있지만, nVidia의 하드웨에서 훨씬 빠르고 효율적으로 실행될 것이기 때문에, 개발자는 다른 하드웨어를 사용할 이유가 별로 없을 것입니다. NIMs가 예상대로 워킹한다면, 학습시장 뿐 아니라 추론시장에서도 엔비디아는 강력한 영향력을 발휘할 것으로 예상되며, 이미 Accenture가 이 NIMs를 Pilot으로 실험하는 중입니다. 그리고, 이 AI Foundry는 Llama 3.1을 적극 지원합니다.

 

같은 시기에 연이어 이루어진 이 Meta와 nVidia의 발표가 과연 우연일까요? 적어도 하나는 확실합니다. AI시장에서 Meta와 nVidia의 이해관계가 맞아떨어졌다는 것이죠. 이 두 사건은 AI 산업의 경쟁구도를 크게 변화시킬 잠재력이 있다고 보여집니다.

 

1. 비용 절감

 - 메타의 무료 모델과 엔비디아의 효율적인 NIMs는 AI서비스의 비용 구조를 낮출 수 있을 것으로 예상됩니다.

2. 경쟁 심화

 - 메타의 무료 모델과 NIMs를 활용하여 무료 혹은 저렴한 AI 서비스들이 등장하게 되면, Open AI, Anthropic같은 기존 강자들은 가격 압박을 심하게 받게 될 것입니다.

3. 시장 지배력

 - 엔비디아의 시장 지배력은 CUDA라는 강력한 무기가 원동력이 되고 있는데, CUDA에 이어 NIMs가 두번째 원동력을 제공하게 될 것으로 보여집니다.

4. AI 생태계 발전

 - AI Foundry와 같은 플랫폼은 AI개발자들이 더 쉽게 고성능 AI모델/서비스를 개발하고 배포할 수 있도록 기여할 것으로 예상됩니다. (이는 마치 스마트폰의 시대를 열어제친 애플의 앱스토어와 비슷합니다.)

 

최근 몇 년간 AI 업계는 "LLM 성능 경쟁과 이를 바탕으로 한 투자 유치"의 선순환이 경쟁 구도 였습니다.  

그런 상황에서 발표된 Llama 3.1과 AI Foundry, 그리고 최근 삼성이나 애플이 보여준 on-device AI의 발전까지 고려한다면, 이러한 소모적인 경쟁 구도의 유효 기간이 머지 않은 것으로 보여집니다.

 

어쩌면, AI 산업은 보다 현실적인 비지니스 모델을 구축하여, 지속 가능한 방향을 모색해야하는 중요한 전환점에 와 있는 것이 아닐까 합니다.