Multiverse, NVIDIA 아키텍처 기반 Pulsar 16B 추론 모델 출시
Yahoo Finance ·
Multiverse Computing이 NVIDIA (NVDA)와 협력해 개발한 오픈 추론 모델 Pulsar 16B를 발표했다. 16B 파라미터로 30B급 성능을 구현하며 Nemotron 아키텍처와 Multiverse의 CompactifAI 기술로 수학적 중복을 제거해 재학습 없이 활성 파라미터 3.1B를 달성했다. AIME·GPQA‑Diamond 등 주요 벤치마크에서 효율성이 개선됐고 NVIDIA Blackwell GPU에서는 시스템 처리량이 43% 증가하고 time‑to‑first‑token이 단축됐다. 모델은 Apache 2.0 라이선스로 Hugging Face에 공개돼 온프레미스·메모리 제약 환경의 고동시성·문서집약·저지연 배포에 적합하다.
AI 시장 분석
Multiverse Computing가 NVIDIA의 Nemotron 아키텍처를 활용한 Pulsar 16B 추론 모델을 공개했다. CompactifAI로 수학적 중복을 제거해 실제 활성 파라미터를 3.1B로 줄이면서도 30B급 성능을 발휘하고, Blackwell GPU에서 시스템 처리량이 43% 향상되는 등 지연과 비용을 대폭 절감한다. Hugging Face에 Apache 2.0으로 공개되어 고동시성·문서집중·저지연 환경에 적합하며 온프레미스 배포를 촉진해 기업의 보안·비용 요구를 충족시킨다. 이로 인해 NVDA 생태계와 경량화 솔루션 수요는 확대되나 클라우드 GPU 임대 수요와 초대형 모델 중심 사업자에는 구조적 압력이 발생할 가능성이 있다.
상승 영향
- 반도체(그래픽·AI 가속기, NVDA) — Pulsar 16B가 Nemotron 기반으로 Blackwell에서 43% 처리량 향상을 보여 NVDA GPU 활용도와 CUDA 생태계 의존성을 확대해 매출·데이터센터 수요에 호재.
- AI 소프트웨어/모델 경량화 — CompactifAI로 16B가 30B급 성능을 내며 연산·메모리 비용을 낮춰 기업 도입 장벽을 줄이고 추론 최적화·스타트업 혁신을 촉진해 수요를 확대.
- 온프레미스·엣지 인프라 — 메모리 제약 환경에서도 고성능 구동이 가능해져 기업의 내부 배포와 보안 요구 충족이 쉬워지고 온프레·엣지 하드웨어 및 솔루션 수요가 증가할 전망.
- 오픈소스 AI 플랫폼(Hugging Face 등) — Apache 2.0 공개로 기업·연구자가 자유롭게 모델을 채택·변형할 수 있어 에코시스템 확장과 커뮤니티 주도의 개선·상용화 속도가 빨라진다.
하락 영향
- 클라우드 데이터센터(인스턴스 GPU 임대) — 온프레 운용과 파라미터 경량화로 대규모 GPU 클라우드 임대 수요가 줄어들면 GPU 인스턴스 기반 수익과 데이터센터 부가서비스 매출에 하방 압력이 발생할 수 있다.
- 대형 파라미터 중심 LLM 공급자 — 16B급 경량 모델이 비용과 지연을 줄이며 동등 성능을 제공하면 30B 이상 초대형 모델에 대한 수요가 약화되고 대형 모델 중심 사업모델의 차별화가 어려워진다.
AI가 생성한 분석으로 투자 자문이 아닙니다.
DYAX 투자자 예측
상승(롱) 56% · 하락(숏) 44%
총 386명 참여