저자 : 유진체아
편집자: J1N, Techub News
AI 컴퓨팅 성능의 비용 하락은 혁신을 위해 저비용 리소스를 사용하는 스타트업의 급증을 자극할 것입니다.
지난해에는 AI 컴퓨팅 파워의 타이트한 공급으로 인해 H100의 렌탈 가격이 시간당 8달러까지 올랐으나, 지금은 시장에 컴퓨팅 파워가 과잉 공급되면서 가격이 미국 이하로 떨어졌다. 시간당 2달러. 이는 일부 기업이 초기 단계에서 컴퓨팅 파워 임대 계약을 체결했기 때문이다. 과도한 컴퓨팅 파워가 낭비되는 것을 방지하기 위해 대부분의 시장이 오픈 소스 모델을 선택하여 수요가 감소했기 때문이다. 새로운 모델의 경우. 이제 시중에 나와 있는 H100의 공급은 수요를 훨씬 초과하므로 H100을 구입하는 것보다 임대하는 것이 비용 효율적이며 새로운 H100에 대한 투자는 더 이상 수익성이 없습니다.
AI 대회의 간략한 역사
GPU 컴퓨팅 파워 시장의 가격이 급등하고 있는 H100의 초기 렌탈 가격은 시간당 약 4.70달러로 최고 8달러 이상까지 올랐다. 이는 프로젝트 창립자가 다음 단계의 자금 조달을 달성하고 투자자를 설득하기 위해 AI 모델을 훈련하는 데 시간을 투자해야 하기 때문입니다.
ChatGPT는 2022년 11월에 출시되었으며 A100 시리즈 GPU를 사용합니다. 2023년 3월까지 NVIDIA는 새로운 H100 시리즈 GPU를 출시했습니다. 프로모션에서 H100의 성능은 A100보다 3배 우수하지만 가격은 A100보다 2배 더 높다고 언급되었습니다.
이는 AI 스타트업에게 큰 매력이다. GPU의 성능이 개발할 수 있는 AI 모델의 속도와 규모를 직접적으로 결정하기 때문입니다. H100의 강력한 성능은 이들 기업이 이전보다 더 빠르고, 더 크고, 더 효율적인 AI 모델을 개발할 수 있음을 의미하며, 잠재적으로 OpenAI와 같은 업계 리더를 따라잡거나 능가할 수도 있습니다. 물론 이 모든 것은 그들이 많은 수의 H100을 구매하거나 임대할 수 있는 충분한 자본을 가지고 있다고 가정합니다.
H100의 대폭 향상된 성능과 AI 분야의 치열한 경쟁으로 인해 많은 스타트업들이 막대한 자금을 투자해 H100을 구입하고 이를 모델 훈련에 가속화하고 있다. 이러한 수요 급증으로 인해 H100의 임대 가격은 처음에는 시간당 4.70달러로 급등했지만 나중에는 8달러 이상으로 치솟았습니다.
이러한 스타트업은 모델을 신속하게 교육하여 다음 자금 조달 라운드에서 투자자의 관심을 끌고 비즈니스 확장을 계속하기 위해 수억 달러를 확보할 수 있기 때문에 높은 임대료를 기꺼이 지불합니다.
H100 GPU를 많이 보유한 컴퓨팅 센터(농장)의 경우 GPU 임대 수요가 매우 높아 마치 '돈이 문앞에 들어오는' 것과 같습니다. 그 이유는 이러한 AI 스타트업이 모델 훈련을 위해 H100을 임대하고 심지어 임대료를 선불로 지불할 의향이 있기 때문입니다. 이는 GPU 팜이 장기적으로 시간당 4.70달러(또는 그 이상)에 GPU를 임대할 수 있음을 의미합니다.
계산에 따르면 이 가격으로 GPU를 계속 임대할 수 있다면 H100에 대한 투자 회수 기간(즉, 구매 비용을 회수하는 시간)은 1.5년 미만이 될 것입니다. 투자 회수 기간이 지나면 각 GPU는 연간 100,000달러 이상의 순 현금 흐름을 창출할 수 있습니다.
H100을 비롯한 고성능 GPU에 대한 수요가 지속적으로 증가함에 따라 GPU 팜의 투자자들은 엄청난 이윤을 보고 있기 때문에 이 비즈니스 모델에 동의할 뿐만 아니라 더 많은 수익을 얻기 위해 더 많은 GPU를 구입하기 위해 더 큰 투자를 하기도 합니다.
튤립의 어리석음(The Folly of Tulips ): 기록된 역사상 최초의 투기 거품의 여파로 작성된 튤립 가격은 1634년에 계속 상승하여 1637년 2월에 폭락했습니다.
인공지능과 빅데이터 처리 요구가 증가하면서 고성능 GPU(특히 NVIDIA의 H100)에 대한 기업의 수요가 급증했습니다. 이러한 컴퓨팅 집약적인 작업을 지원하기 위해 글로벌 기업은 초기에 하드웨어와 인프라에 약 6,000억 달러를 투자했습니다. 미국 달러는 GPU 구매, 데이터 센터 구축 등에 사용되어 컴퓨팅 성능을 향상시킵니다. 그러나 공급망 지연으로 인해 H100 가격은 구매자가 큰 보증금을 선불로 지불하지 않는 한 2023년 대부분 동안 시간당 4.70달러를 초과하여 높은 수준을 유지할 것입니다. 2024년 초까지 더 많은 공급업체가 시장에 진입하면서 H100의 임대 가격은 약 2.85달러로 떨어졌지만, 시장의 공급이 증가함에 따라 경쟁이 심화됨을 반영하는 다양한 프로모션 이메일을 받기 시작했습니다.
H100 GPU 임대 가격은 처음에는 시간당 8~16달러였지만, 2024년 8월에는 경매 방식의 임대 가격이 시간당 1~2달러로 떨어졌습니다. 시장 가격은 매년 40% 이상 하락할 것으로 예상되며, 이는 NVIDIA가 4년 내에 시간당 4달러를 유지할 것이라는 예측을 훨씬 뛰어넘는 수치입니다. 이러한 급격한 가격 하락은 임대를 통해 비용을 회수하지 못할 수도 있기 때문에 고가의 새 GPU를 구입하는 사람들에게는 재정적 위험을 초래합니다.
H100에 $50,000를 투자하면 자본 수익률은 얼마입니까?
H100의 구입 비용은 전력 및 냉각 비용을 고려하지 않을 때 약 50,000달러이며 예상 수명은 5년입니다. 임대는 일반적으로 단기 주문형 임대와 장기 예약의 두 가지 모델로 제공됩니다. 단기 임대는 비용이 더 많이 들지만 유연성이 뛰어나고, 장기 예약은 저렴하지만 안정적입니다. 다음으로, 이 기사에서는 이 두 모델의 이점을 분석하여 투자자가 5년 이내에 비용을 회수하고 수익을 낼 수 있는지 계산할 것입니다.
단기 주문형 임대
임대 가격 및 해당 소득:
>$2.85: 주식 시장 IRR을 능가하고 수익성을 달성합니다.
<$2.85: 수익은 주식 시장 투자 수익보다 낮습니다.
<$1.65: 예상 투자 손실.
'혼합 가격' 모델은 임대료가 향후 5년 내에 현재 가격의 50%까지 떨어질 수 있다고 예측합니다. 임대 가격이 시간당 $4.50로 유지되면 투자 수익률(IRR)은 20%를 초과하여 수익성이 있지만 가격이 시간당 $2.85로 떨어지면 IRR은 10%에 불과하고 수익률이 크게 줄어듭니다. 가격이 2.85달러 아래로 떨어지면 투자 수익은 주식 시장 수익보다 낮아질 수 있으며, 가격이 1.65달러 아래로 떨어지면 투자자, 특히 최근 H100 서버를 구입한 사람들의 경우 심각한 손실 위험에 직면하게 됩니다.
참고: '혼합 가격'은 H100의 임대 가격이 향후 5년 내에 현재 가격의 절반으로 점차 하락할 것이라는 가정입니다. 현재 시장 가격이 매년 40% 이상 하락하고 있어 가격 하락을 고려하는 것이 합리적이라는 점에서 이러한 추정치는 낙관적이라고 판단된다.
장기 예약 임대(3년 이상)
AI 붐 동안 과거 경험을 바탕으로 많은 기존 인프라 제공업체, 특히 암호화폐 초기 이더리움 PoW 시대에 GPU 임대 가격의 급격한 상승과 하락 사이클을 경험했기 때문에 2023년에는 3~5년 최고치를 기록했습니다. 가격 이익을 확보하기 위해 임대 계약을 선불로 지불합니다. 이러한 계약에서는 고객이 시간당 4달러 이상을 지불하거나 임대료의 50%~100%를 선불로 지불해야 하는 경우가 많습니다. 특히 이미지 생성 분야에서 AI에 대한 수요가 급증함에 따라 기본 모델 회사들은 시장 기회를 포착하고 최신 GPU 클러스터를 가장 먼저 사용하려고 노력하고 있습니다. 이러한 계약은 비용이 많이 들지만 신속하게 완료하려면 계약을 체결해야 합니다. 모델을 타깃으로 삼아 경쟁력을 강화합니다. 그러나 모델 훈련이 완료되면 이들 회사는 더 이상 이러한 GPU 리소스가 필요하지 않지만 계약 종속으로 인해 쉽게 종료할 수 없습니다. 손실을 줄이기 위해 임대한 GPU 리소스를 재판매하여 비용의 일부를 회수하는 방법을 선택합니다. . 이로 인해 시장에 재판매된 GPU 리소스가 많이 발생하고 공급이 증가하여 시장의 임대 가격과 수급 관계에 영향을 미쳤습니다.
현재 H100 가치 사슬
참고: 가치 사슬은 가치 사슬 분석, 가치 사슬 모델 등으로도 알려져 있습니다. 이는 마이클 포터(Michael Porter)가 1985년 그의 저서 "경쟁 우위(Competitive Advantage)"에서 제안한 것입니다. Porter는 기업이 고유한 경쟁 우위를 개발하고 제품과 서비스에 대해 더 높은 부가가치를 창출해야 한다고 지적했습니다. 비즈니스 전략은 기업의 비즈니스 모델을 일련의 부가가치 프로세스로 구성하는 것이며, 이러한 일련의 부가가치 프로세스는 " 가치 사슬".”.
하드웨어부터 AI 추론 모델까지 H100 가치 사슬에 참여하는 부분은 대략 다음과 같은 범주로 나눌 수 있습니다.
- Nvidia와 협력하는 하드웨어 공급업체
- 데이터 센터 인프라 제공업체 및 파트너
- 벤처캐피털 펀드, 대기업, 스타트업 : 기본 모델 구축 예정(또는 이미 모델 구축 완료)
- 용량 리셀러: Runpod, SFCompute, Together.ai, Vast.ai, GPUlist.ai 등
현재 H100 가치 사슬에는 하드웨어 공급업체부터 데이터 센터 제공업체, AI 모델 개발 회사, 용량 리셀러 및 AI 추론 서비스 제공업체에 이르는 여러 링크가 포함되어 있습니다. 시장에 대한 주요 압력은 사용되지 않는 H100 용량 리셀러가 유휴 리소스를 지속적으로 재판매하거나 임대하고 "충분히 좋은" 오픈 소스 모델(예: Llama 3)의 광범위한 사용으로 인해 H100에 대한 수요가 감소하는 데 있습니다. 이 두 가지 요인이 함께 작용하면 H100의 공급 과잉이 발생하고 이는 결국 시장 가격에 하락 압력을 가하게 됩니다.
시장 동향: 오픈 소스 가중치 모델의 부상
오픈소스 가중치 모델은 공식적인 오픈소스 라이선스는 없지만 가중치가 무료로 공개되어 상용분야에서 널리 사용되는 모델을 말한다.
이러한 모델 사용에 대한 수요는 주로 두 가지 주요 요인에 의해 주도됩니다. 하나는 GPT-4와 유사한 대규모 오픈 소스 모델(예: LLaMA3 및 DeepSeek-v2)의 출현이고 다른 하나는 소규모(80억 달러) 매개변수) 및 중형(700억 매개변수) 미세 조정 모델의 성숙도 및 광범위한 채택.
이러한 오픈 소스 모델의 성숙도가 높아짐에 따라 기업은 이를 쉽게 획득하고 사용하여 대부분의 AI 애플리케이션, 특히 추론 및 미세 조정의 요구 사항을 충족할 수 있습니다. 이러한 모델은 일부 벤치마크에서 독점 모델보다 성능이 약간 떨어질 수 있지만 성능은 대부분의 상업적 사용 사례를 처리하기에 충분합니다. 따라서 오픈소스 가중치 모델의 인기로 인해 추론 및 미세 조정에 대한 시장 수요가 빠르게 증가하고 있습니다.
오픈 소스 가중치 모델은 세 가지 주요 이점도 제공합니다.
첫째, 오픈 소스 모델은 유연성이 뛰어나 사용자가 특정 분야나 작업에 따라 모델을 미세 조정할 수 있으므로 다양한 애플리케이션 시나리오에 더 잘 적응할 수 있습니다. 둘째, 오픈 소스 모델은 일부 독점 모델처럼 예고 없이 모델 가중치가 업데이트되지 않으므로 업데이트로 인해 발생하는 일부 개발 문제를 피하고 모델에 대한 사용자의 신뢰를 높이기 때문에 신뢰성을 제공합니다. 마지막으로 보안과 개인 정보 보호도 보장하며, 기업은 메시지와 고객 데이터가 타사 API 엔드포인트를 통해 유출되지 않도록 보장하여 데이터 개인 정보 보호 위험을 줄일 수 있습니다. 특히 추론 및 미세 조정을 위한 오픈 소스 모델의 지속적인 성장과 광범위한 채택을 촉진하는 것은 바로 이러한 장점입니다.
중소 모델 크리에이터의 수요가 변화하고 있습니다.
중소 규모 모델 작성자는 대규모 기본 모델(예: 70B 매개변수 모델)을 처음부터 훈련할 능력이나 계획이 없는 기업 또는 스타트업을 말합니다. 오픈 소스 모델이 등장하면서 많은 기업에서는 기존 오픈 소스 모델을 미세 조정하는 것이 새로운 모델을 처음부터 교육하는 것보다 비용 효율적이라는 것을 깨달았습니다. 그 결과, 모델을 직접 교육하기보다는 모델을 미세 조정하는 방식을 선택하는 기업이 점점 더 많아지고 있습니다. 이는 H100과 같은 컴퓨팅 리소스의 필요성을 크게 줄여줍니다.
미세 조정은 처음부터 훈련하는 것보다 훨씬 저렴합니다. 기존 모델을 미세 조정하는 데는 기본 모델을 처음부터 훈련하는 것보다 훨씬 적은 계산 리소스가 필요합니다. 대규모 기본 모델을 훈련하려면 일반적으로 16개 이상의 H100 노드가 필요한 반면, 미세 조정에는 일반적으로 1~4개의 노드만 필요합니다. 이러한 업계 변화로 인해 중소기업을 위한 대규모 클러스터의 필요성이 줄어들고 H100 컴퓨팅 성능에 대한 의존도가 직접적으로 줄어듭니다.
또한 기본 모델 생성에 대한 투자도 줄어듭니다. 2023년에는 많은 중소기업이 새로운 기본 모델을 만들려고 노력하지만 오늘날에는 혁신(더 나은 아키텍처 또는 수백 가지 언어 지원 등)을 가져올 수 없으면 새로운 기본 모델이 거의 없을 것입니다. 이는 Llama 3와 같이 이미 시장에 충분히 강력한 오픈 소스 모델이 있어 소규모 기업이 새로운 모델을 만드는 것을 정당화하기 어렵기 때문입니다. 투자자의 관심과 자금도 모델을 처음부터 훈련하는 것이 아닌 미세 조정으로 전환되어 H100 리소스의 필요성이 더욱 감소되었습니다.
마지막으로 예약 노드의 과잉 용량도 문제이다. 많은 기업에서는 2023년 피크 기간 동안 H100 리소스를 장기 예약했지만 미세 조정으로의 전환으로 인해 이러한 예약 노드가 더 이상 필요하지 않으며 일부 하드웨어가 도착했을 때 더 이상 사용되지 않는다는 사실을 발견했습니다. 이러한 사용되지 않은 H100 노드는 이제 재판매되거나 임대되고 있어 시장의 공급이 더욱 증가하고 H100 리소스의 공급 과잉으로 이어집니다.
전반적으로 모델 미세 조정의 인기, 중소형 기본 모델 생성 감소, 예약 노드 과잉으로 인해 H100 시장 수요가 크게 감소하고 공급 과잉 상황이 심화되었습니다.
GPU 컴퓨팅 성능에 대한 공급 증가 및 수요 감소로 이어지는 기타 요인
대규모 모델 제작자는 오픈 소스 클라우드 플랫폼에서 벗어났습니다.
이것이 바로 Facebook, X.AI, OpenAI와 같은 대규모 AI 모델 제작자들이 점차 퍼블릭 클라우드 플랫폼에서 자체 구축 프라이빗 컴퓨팅 클러스터로 전환하고 있는 이유입니다. 첫째, 기존 퍼블릭 클라우드 리소스(예: 1,000노드 클러스터)는 더 이상 대규모 모델을 교육하는 데 필요한 요구 사항을 충족할 수 없습니다. 둘째, 재무적인 관점에서는 자체 클러스터를 구축하는 것이 더 유리합니다. 데이터센터, 서버 등 자산을 구입하면 기업의 가치가 올라갈 수 있지만, 퍼블릭 클라우드를 임대하는 것은 비용일 뿐 자산을 늘릴 수는 없기 때문입니다. 또한 이들 회사는 이러한 시스템을 구축하고 관리하는 데 도움이 되는 소규모 데이터 센터 회사를 인수할 만큼 충분한 리소스와 전문 팀을 보유하고 있습니다. 따라서 더 이상 퍼블릭 클라우드에 의존하지 않습니다. 이들 기업이 퍼블릭 클라우드 플랫폼에서 멀어짐에 따라 컴퓨팅 리소스에 대한 시장의 수요가 감소하고, 이로 인해 사용되지 않은 리소스가 시장에 다시 진입하여 공급이 늘어날 수 있습니다.
Vast.ai는 본질적으로 전 세계의 공급업체가 서로 경쟁하는 자유 시장 시스템입니다.
유휴 및 지연된 H100이 동시에 온라인 상태입니다.
유휴 상태와 지연된 H100 GPU가 동시에 온라인에 들어오면서 시장 공급이 늘어나 가격이 하락했습니다. Vast.ai와 같은 플랫폼은 글로벌 공급업체가 가격을 놓고 서로 경쟁하는 자유 시장 모델에서 운영됩니다. 2023년에는 H100 배송 지연으로 인해 많은 리소스가 제때에 온라인에 제공되지 못했습니다. 이제 이러한 지연된 H100 리소스가 새로운 H200 및 B200 장치와 함께 시장에 진입하기 시작하고 스타트업 및 기업을 위한 유휴 컴퓨팅 리소스가 시작됩니다. 중소 규모 클러스터의 소유자는 일반적으로 8~64개의 노드를 보유하지만 활용도가 낮고 자금이 고갈되어 저렴한 가격에 리소스를 임대하여 최대한 빨리 비용을 회수하는 것이 목표입니다. 이를 위해 그들은 고정 이자율, 경매 시스템 또는 자유 시장 가격, 특히 경매 및 자유 시장 모델을 통해 고객을 위해 경쟁하기로 선택합니다. 이는 공급업체가 자원 임대를 보장하기 위해 가격을 낮추기 위해 경쟁하게 하여 결국 상당한 손실을 초래합니다. 시장 전체의 가격 하락.
더 저렴한 GPU 대안
또 다른 주요 요인은 컴퓨팅 성능 비용이 예산을 초과하면 특히 소규모 모델을 실행하는 경우 AI 추론 인프라에 대한 대안이 많다는 것입니다. H100과 함께 Infiniband를 사용한다고 추가 비용을 지불할 필요가 없습니다.
엔비디아 시장 세분화
AI 추론 작업을 위한 H100 GPU에 대한 저렴한 대안의 출현은 H100에 대한 시장 수요에 직접적인 영향을 미칠 것입니다. 첫째, H100은 AI 모델을 훈련하고 미세 조정하는 데 탁월하지만 추론 분야(예: 모델 실행)에서는 특히 소형 모델의 요구 사항을 더 저렴한 GPU로 충족할 수 있습니다. 추론 작업에는 H100의 고급 기능(예: Infiniband 네트워킹)이 필요하지 않으므로 사용자는 보다 경제적인 대안을 선택하고 비용을 절감할 수 있습니다.
Nvidia 자체는 추론 시장에서 H100의 성능은 약 1/3이지만 가격은 1/5에 불과한 추론 전용 GPU인 L40S와 같은 대안을 제공합니다. L40S는 다중 노드 훈련에서 H100만큼 효과적이지는 않지만 단일 노드 추론과 소규모 클러스터의 미세 조정에는 충분히 강력하므로 사용자에게 보다 비용 효율적인 선택을 제공합니다.
H100 Infiniband 클러스터 성능 구성표(2024년 8월)
AMD 및 Intel 대체 공급업체
또한 AMD와 Intel은 AMD의 MX300, Intel의 Gaudi 3 등 저가형 GPU도 출시했습니다. 이러한 GPU는 추론 및 단일 노드 작업에서 우수한 성능을 발휘하고 H100보다 저렴하며 메모리와 컴퓨팅 성능이 더 뛰어납니다. 아직 대규모 다중 노드 클러스터 교육에서 완전히 검증되지는 않았지만 추론 작업에서는 H100의 강력한 대안이 될 만큼 충분히 성숙되었습니다.
이러한 저렴한 GPU는 대부분의 추론 작업, 특히 LLaMA 3과 같은 일반적인 모델 아키텍처에 대한 추론 및 미세 조정 작업을 처리할 수 있는 능력이 입증되었습니다. 따라서 사용자는 호환성 문제를 해결한 후 비용을 절감하기 위해 이러한 대체 GPU를 선택할 수 있습니다. 요약하면, 추론 영역의 이러한 대안은 특히 소규모 추론 및 미세 조정 작업에서 H100을 점차적으로 대체하고 있으며, 이로 인해 H100의 필요성이 더욱 줄어듭니다.
Web3 도메인의 GPU 사용량 감소
암호화폐 시장의 변화로 인해 암호화폐 채굴에 GPU의 사용이 감소하고, 많은 GPU가 클라우드 시장으로 유입되었습니다. 이러한 GPU는 하드웨어 제한으로 인해 복잡한 AI 훈련 작업을 수행할 수 없지만, 특히 예산이 제한된 사용자의 경우 더 작은 모델(예: 10B 매개변수 미만)을 처리할 때 비용이 많이 드는 단순한 AI 추론 작업에서는 잘 수행됩니다. 효과적인 옵션. 최적화된 이 GPU는 H100 노드를 사용하는 것보다 저렴한 비용으로 대규모 모델을 실행할 수도 있습니다.
AI 컴퓨팅 파워 렌탈 버블 이후, 현재 시장은 어떤가요?
현재 진입에 직면한 문제: 새로운 퍼블릭 클라우드 H100 클러스터는 시장에 늦게 진입하여 수익성이 없을 수 있으며 일부 투자자는 큰 손실을 입을 수 있습니다.
새로 시장에 진입한 H100 퍼블릭 클라우드 클러스터가 직면한 수익성 문제. 임대 가격을 너무 낮게 설정하면(US$2.25 미만) 운영 비용을 감당할 수 없어 손실이 발생할 수 있고, 너무 높게 설정하면(US$3 이상) 고객을 잃고 유휴 용량이 발생할 수 있습니다. 또한 나중에 시장에 진입한 클러스터는 초기 고가(시간당 4달러)를 놓쳐 비용 회수에 어려움을 겪었고, 투자자들은 수익을 내지 못할 위험에 직면했다. 이는 클러스터 투자를 매우 어렵게 만들고 심지어 투자자에게 상당한 손실을 초래할 수도 있습니다.
조기 진입자의 수익 상황: 조기 장기 임대 계약을 체결한 중대형 모델 창작자가 비용을 회수하고 수익성을 달성했습니다.
중견 및 대규모 모델 작성자는 이미 H100 컴퓨팅 리소스의 장기 임대를 통해 가치를 얻고 있으며, 해당 비용은 자금 조달 시 충당됩니다. 일부 컴퓨팅 리소스가 완전히 활용되지는 않지만 이들 회사는 현재와 미래의 모델 교육을 위한 금융 시장을 통해 이러한 클러스터에서 가치를 추출하고 있습니다. 미사용 자원이 있더라도 재판매나 임대를 통해 추가 수익을 얻을 수 있어 시장 가격을 낮추고 부정적인 영향을 줄이며 전체적으로 생태계에 긍정적인 영향을 미칩니다.
거품이 꺼진 후: 저렴한 H100은 오픈 소스 AI 채택 물결을 가속화할 수 있습니다.
저가형 H100 GPU의 등장은 오픈소스 AI 발전을 촉진할 것이다. H100의 가격이 떨어지면 AI 개발자와 애호가가 오픈 소스 가중치 모델을 실행하고 미세 조정하는 것이 더 저렴해져서 이러한 모델이 더 널리 채택될 것입니다. 폐쇄 소스 모델(예: GPT5++)이 향후 큰 기술적 혁신을 달성하지 못한다면, 오픈 소스 모델과 폐쇄 소스 모델 간의 격차가 줄어들어 AI 애플리케이션 개발이 촉진될 것입니다. AI 추론 및 미세 조정 비용이 감소함에 따라 AI 애플리케이션의 새로운 물결이 촉발되고 시장의 전반적인 발전이 가속화될 수 있습니다.
결론: 새로운 H100을 사지 마세요
지금 새로운 H100 GPU에 투자한다면 돈을 잃을 가능성이 높습니다. 그러나 프로젝트가 H100을 할인된 가격으로 구매할 수 있거나, 전기료가 저렴하거나, AI 제품이 시장에서 충분히 경쟁력이 있는 경우 등 특별한 상황에서만 투자하는 것이 합리적일 수 있습니다. 투자를 고려 중이라면 더 나은 수익률을 얻기 위해 돈을 다른 분야나 주식 시장에 투자하는 것이 좋습니다.