저자: BadBot, IOBC Capital
바로 어제 밤, DeepSeek은 Hugging Face의 V3 버전에 대한 업데이트인 DeepSeek-V3-0324를 출시했습니다. 이 업데이트에는 6,850억 개의 모델 매개변수가 포함되었고 코딩 기능, UI 디자인, 추론 기능이 상당히 향상되었습니다.
방금 마무리된 2025 GTC 컨퍼런스에서 황런쉰은 DeepSeek을 극찬하며, 시장이 DeepSeek의 효율적 모델이 엔비디아 칩 수요를 줄일 것이라는 기존 생각은 틀렸으며, 향후 컴퓨팅 수요는 줄어들지 않고 오히려 더 커질 것이라고 강조했습니다.
알고리즘 혁신을 이룬 스타 제품인 DeepSeek와 NVIDIA의 컴퓨팅 파워 공급 간의 관계는 무엇입니까? 먼저, 산업 발전에 있어서 컴퓨팅 능력과 알고리즘의 중요성에 대해 논의하고 싶습니다.
컴퓨팅 파워와 알고리즘의 공생적 진화
AI 분야에서 컴퓨팅 능력의 향상은 보다 복잡한 알고리즘을 위한 운영 기반을 제공하며, 모델이 더 많은 양의 데이터를 처리하고 더 복잡한 패턴을 학습할 수 있게 해줍니다. 알고리즘 최적화는 컴퓨팅 능력을 보다 효율적으로 활용하고 컴퓨팅 리소스 활용의 효율성을 개선할 수 있습니다.
컴퓨팅 파워와 알고리즘 간의 공생 관계는 AI 산업 환경을 재편하고 있습니다.
기술적 경로의 차별화: OpenAI와 같은 회사는 초대형 컴퓨팅 클러스터 구축을 추진하는 반면, DeepSeek 및 기타 회사는 알고리즘 효율성 최적화에 집중하여 다양한 기술 학파를 형성합니다.
산업 체인 재구축: NVIDIA는 CUDA 생태계를 통해 AI 컴퓨팅 파워의 선두주자가 되었으며, 클라우드 서비스 제공업체는 탄력적 컴퓨팅 파워 서비스를 통해 배포 임계값을 낮추었습니다.
리소스 할당 조정: 회사의 R&D는 하드웨어 인프라 투자와 효율적인 알고리즘 개발 간의 균형을 찾는 데 중점을 두고 있습니다.
오픈소스 커뮤니티의 부상: DeepSeek, LLaMA와 같은 오픈소스 모델은 알고리즘 혁신과 컴퓨팅 파워 최적화 결과를 공유할 수 있게 하여 기술 반복과 확산을 가속화합니다.
DeepSeek의 기술 혁신
DeepSeek의 인기는 확실히 기술 혁신과 분리할 수 없습니다. 대부분의 사람들이 이해할 수 있도록 간단한 언어를 사용하여 설명하겠습니다.
모델 아키텍처 최적화
DeepSeek은 Transformer+MOE(Mixture of Experts)의 결합된 아키텍처를 채택하고 Multi-Head Latent Attension(MLA) 메커니즘을 도입했습니다. 이 아키텍처는 마치 슈퍼팀과 같습니다. Transformer는 일상적인 업무를 담당하고 MOE는 팀 내의 전문가 그룹과 같습니다. 각 전문가는 자신만의 전문 분야를 갖고 있습니다. 특정 문제가 발생하는 경우 가장 유능한 전문가가 해당 문제를 처리하여 모델의 효율성과 정확성을 크게 향상시킬 수 있습니다. MLA 메커니즘을 사용하면 모델이 정보를 처리할 때 다양한 중요한 세부 정보에 더욱 유연하게 집중할 수 있어 모델의 성능이 더욱 향상됩니다.
훈련 방법의 혁신
DeepSeek은 FP8 혼합 정밀도 학습 프레임워크를 제안했습니다. 이 프레임워크는 학습 과정의 다양한 단계에서의 요구 사항에 따라 적절한 컴퓨팅 정확도를 동적으로 선택할 수 있는 지능형 리소스 할당기와 같습니다. 고정밀 계산이 필요한 경우 모델의 정확성을 보장하기 위해 더 높은 정밀도를 사용합니다. 더 낮은 정밀도가 허용되는 경우 컴퓨팅 리소스를 절약하고, 학습 속도를 높이고, 메모리 사용량을 줄이기 위해 정밀도를 낮춥니다.
향상된 추론 효율성
추론 단계에서 DeepSeek은 다중 토큰 예측(MTP) 기술을 도입했습니다. 전통적인 추론 방법은 단계별로 진행하면서 각 단계에서 하나의 토큰만 예측하는 것입니다. MTP 기술은 한 번에 여러 토큰을 예측할 수 있어 추론 프로세스의 속도를 크게 높이고 추론 비용을 줄여줍니다.
강화 학습 알고리즘 혁신
DeepSeek의 새로운 강화 학습 알고리즘 GRPO(Generalized Reward-Penalized Optimization)는 모델 학습 프로세스를 최적화합니다. 강화 학습은 보상과 처벌을 통해 모델이 더 나은 행동을 학습하도록 안내하는 코치를 모델에 제공하는 것과 같습니다. 기존의 강화 학습 알고리즘은 이 과정에서 많은 컴퓨팅 리소스를 소모하지만, DeepSeek의 새로운 알고리즘은 더욱 효율적입니다. 이를 통해 불필요한 계산을 줄이고 모델 성능을 향상시켜 성능과 비용 간의 균형을 달성할 수 있습니다.
이러한 혁신은 고립된 기술적 요소가 아니라, 학습에서 추론에 이르기까지 전체 체인에서 컴퓨팅 전력 요구 사항을 줄이는 완전한 기술 시스템을 형성합니다. 일반 소비자용 그래픽 카드로도 강력한 AI 모델을 실행할 수 있어 AI 응용 프로그램의 한계가 크게 낮아지고 더 많은 개발자와 기업이 AI 혁신에 참여할 수 있게 됐습니다.
엔비디아에 미치는 영향
많은 사람들은 DeepSeek가 CUDA 계층을 우회하여 NVIDIA에 대한 종속성을 없앨 것이라고 믿습니다. 실제로 DeepSeek는 NVIDIA의 PTX(Parallel Thread Execution) 계층을 통해 알고리즘을 직접 최적화합니다. PTX는 고급 CUDA 코드와 실제 GPU 명령어 사이의 중간 표현 언어입니다. DeepSeek는 이 수준에서 작동함으로써 더욱 정교한 성능 튜닝을 달성할 수 있습니다.
이는 NVIDIA에 양면적인 영향을 미쳤습니다. 한편, DeepSeek은 실제로 NVIDIA의 하드웨어와 CUDA 생태계에 더 깊이 연결되어 있으며, AI 애플리케이션에 대한 임계값을 낮추면 전체 시장 규모가 확대될 수 있습니다. 반면, DeepSeek의 알고리즘 최적화는 하이엔드 칩에 대한 시장 수요 구조를 바꿀 수도 있습니다. 원래 H100과 같은 GPU가 필요했던 일부 AI 모델은 이제 A100 또는 소비자용 그래픽 카드에서도 효율적으로 실행될 수 있습니다.
이것이 중국의 AI 산업에 미치는 영향
DeepSeek의 알고리즘 최적화는 중국 AI 산업에 기술 혁신의 길을 제공합니다. 고가 칩에 대한 제한이 있는 상황에서 '소프트웨어로 하드웨어를 보완한다'는 아이디어가 고급 수입 칩에 대한 의존도를 낮추었습니다.
상류에서는 효율적인 알고리즘을 통해 컴퓨팅 전력 수요에 대한 압박을 줄여, 컴퓨팅 전력 서비스 제공업체가 하드웨어 사용 주기를 연장하고 소프트웨어 최적화를 통해 투자 수익을 개선할 수 있습니다. 다운스트림에서는 최적화된 오픈소스 모델이 AI 애플리케이션 개발의 한계를 낮춥니다. 많은 중소기업은 많은 컴퓨팅 리소스 없이도 DeepSeek 모델을 기반으로 경쟁력 있는 애플리케이션을 개발할 수 있으며, 이를 통해 보다 수직적인 AI 솔루션이 등장하게 될 것입니다.
Web3+AI에 큰 영향
분산형 AI 인프라
DeepSeek의 알고리즘 최적화는 Web3 AI 인프라에 새로운 원동력을 제공합니다. 혁신적인 아키텍처, 효율적인 알고리즘, 낮은 컴퓨팅 전력 요구 사항 덕분에 분산형 AI 추론이 가능해졌습니다. MoE 아키텍처는 분산형 배포에 적합합니다. 다양한 노드가 다양한 전문가 네트워크를 보유할 수 있으며, 전체 모델을 저장하기 위해 단일 노드가 필요하지 않습니다. 이를 통해 단일 노드의 저장 및 컴퓨팅 요구 사항이 크게 줄어들어 모델의 유연성과 효율성이 향상됩니다.
FP8 훈련 프레임워크는 고성능 컴퓨팅 리소스에 대한 수요를 더욱 줄여 노드 네트워크에 더 많은 컴퓨팅 리소스를 추가할 수 있게 해줍니다. 이를 통해 분산형 AI 컴퓨팅에 참여하기 위한 문턱이 낮아질 뿐만 아니라, 전체 네트워크의 컴퓨팅 성능과 효율성도 향상됩니다.
다중 에이전트 시스템
지능형 거래 전략 최적화: 실시간 시장 데이터 분석 에이전트, 단기 가격 변동 예측 에이전트, 온체인 거래 실행 에이전트, 거래 결과 감독 에이전트 등의 조화로운 운영을 통해 사용자가 더 높은 수익을 얻는 데 도움이 됩니다.
스마트 계약의 자동 실행: 스마트 계약 모니터링 에이전트, 스마트 계약 실행 에이전트, 실행 결과 감독 에이전트 등이 함께 작동하여 보다 복잡한 비즈니스 로직 자동화를 달성합니다.
개인화된 포트폴리오 관리: AI는 사용자의 위험 선호도, 투자 목표, 재정 상태에 따라 실시간으로 최상의 스테이킹 또는 유동성 기회를 찾는 데 도움을 줍니다.
"우리는 아주 짧은 미래만 볼 수 있지만, 그곳에서 해야 할 일이 많이 있다는 것을 보는 데는 충분합니다." DeepSeek은 컴퓨팅 파워의 제약 하에 알고리즘 혁신을 통해 획기적인 성과를 거두고 있으며, 중국 AI 산업에 차별화된 발전 경로를 열어주고 있습니다. 적용 문턱을 낮추고, Web3와 AI의 통합을 촉진하고, 하이엔드 칩에 대한 의존도를 낮추고, 금융 혁신을 가능하게 함으로써 디지털 경제가 재편되고 있습니다. AI의 미래 발전은 더 이상 단순한 컴퓨팅 파워 경쟁이 아니라, 컴퓨팅 파워와 알고리즘의 조화로운 최적화 경쟁이 될 것입니다. 이 새로운 트랙에서 DeepSeek와 같은 혁신가들은 중국의 지혜로 게임의 규칙을 새롭게 정의하고 있습니다.