2025년 1월 20일, 중국의 AI 모델 DeepSeek-R1이 출시 되었습니다.
불과 1년 반 만에 개발된 이 모델은 미국 앱스토어 무료 앱 1위에 오르며 새로운 강자로 부상했으며
출시 7일만에 엔비디아 비롯한 AI 관련 기업 주가를 급락시키며 업계 지각변동을 일으켰습니다.
딥시크(DeepSeek)의 등장이 왜그리 시끄러운지 차근히 알아보겠습니다.
1. 딥시크? 그게 뭔데
딥시크(DeepSeek)는 중국 항저우에 본사를 두고 있는 AI 기업이자 서비스입니다.
2023년 5월 설립 이후 과감한 오픈소스 전략을 택하면서 고성능 AI 모델들을 무료로 공개하며 발전시켜왔습니다.
2023년 : 오픈소스의 시작
최초로 공개된 두 모델 DeepSeek-Coder과 DeepSeek-LLM은 AI 커뮤니티에 큰 반향을 일으켰습니다. 그도 그럴 것이 개발자 중심으로 이루어진 커뮤니티에 프로그래밍 및 코딩 작업에 특화된 모델과 그동안 폐쇄적인 환경에서 개발되었던 OpenAI의 GPT-4에 근접한 LLM 모델이 모두 무료로 제공되었기 때문입니다. 이러한 딥시크의 오픈소스 전략은 AI 기술에 대한 접근성을 대폭 향상시켰다는 평가를 받았습니다.
2024년 : 혁신의 가속화
2024년이 되자 딥시크는 더 강력해진 모델들을 연이어 공개하며 오픈소스 AI의 가능성을 입증했습니다. MoE 아키텍처와 MLA 기술을 도입해 AI 모델의 활용성 및 메모리 효율성을 증대시켰으며 점차 학습 파라미터를 확장시키면서 복잡성과 표현력이 증가하는 등 모델 자체의 성능이 향상되었습니다. 동시에 모델의 메모리 사용량을 더욱 줄이고 AI 모델 개발의 더 큰 효율성을 위해 FP8 혼합 정밀도 훈련을 도입하는 등 AI 혁신을 거듭해왔습니다.
2025년 : 게임 체인저(?)의 등장
2025년 1월 20일, 마침내 세상에 등장한 DeepSeek-R1는 AI 업계에 커다란 충격을 안겼습니다. 고급 추론 능력, OpenAI의 o1과 유사, 순수 강화 학습 등 모델 자체가 지닌 성능 또한 놀라웠지만, 무엇보다도 560만 달러의 개발 비용이 큰 파장을 일으켰고 이윽고 엔비디아(-17%)를 비롯한 마이크로소프트(-4.3%), 메타(-3.1%), 알파벳(-3.4%) 등 주요 AI 관련 기업들의 주가 급락에 영향을 미치게 되었습니다.
DeepSeek-R1의 출현은 단순한 주가 변동을 넘어 AI 산업 전반의 판도 변화를 예고하는 사건이었습니다. 수십억 달러를 투자하며 AI 시장 패권을 쥐고 있던 미국 기업들 대비 십분의 일 수준 비용으로 그에 준하는 모델 개발이 가능하다는 것은 AI 개발 패러다임 자체를 전복시킬 가능성을 시사하기 때문입니다. 이처럼 딥시크(DeepSeek)의 등장은 느슨했던 AI 시장에 긴장감을 초래하였으며, AI의 기술적 혁신뿐 아니라 비용 효율성에 대한 주목과 수요를 높이는 계기가 되었습니다.
현재는 딥시크(DeepSeek)에 대한 초기 시장 반응이 다소 과대평가 되었다는 인식과 함께 다시금 엔비디아 등 AI 관련 기업의 주가는 점차 회복세를 보이고 있습니다만, 분명 업계에 미친 영향력은 실로 대단했고 앞으로 AI 글로벌 경쟁력을 논하는데 있어 딥시크(DeepSeek)의 행보에 주목해볼 필요가 있겠습니다.
다음에는 딥시크(DeepSeek)의 "오픈소스 전략"과 "리스크"에 대해 알아보도록 하겠습니다.
'AI 일반' 카테고리의 다른 글
인간의 자유의지 박탈과 의존성 증가: 우리는 AI 없이 살 수 있을까? (10) | 2025.03.09 |
---|---|
뉴로-러닝 시대, AI가 학습의 미래를 바꿀 수 있을까? (1) | 2025.03.09 |
딥시크(DeepSeek) 쇼크 - ④ (2) | 2025.02.15 |
딥시크(DeepSeek) 쇼크 - ③ (1) | 2025.02.15 |
딥시크(DeepSeek) 쇼크 - ② (2) | 2025.02.13 |