Multiverse、NVIDIAアーキテクチャ搭載の推論モデルPulsar 16Bを公開だ
Yahoo Finance ·
Multiverse ComputingはNVIDIA(NVDA)と協業して開発したオープン推論モデルPulsar 16Bを発表した。16Bのパラメータで30B級の性能を実現し、NemotronアーキテクチャとCompactifAIにより数学的冗長性を排除して再学習を要さずアクティブパラメータを3.1Bとした。AIMEやGPQA‑Diamondなどのベンチで効率性が向上し、NVIDIAのBlackwell GPU上ではシステムスループットが43%向上しtime‑to‑first‑tokenが短縮された。Apache 2.0でHugging Faceに公開され、オンプレミスやメモリ制約下の高同時処理・文書集約・低遅延用途に適している。
AI 시장 분석
Multiverse ComputingがNVIDIAのNemotronアーキテクチャを活用したPulsar 16B推論モデルを公開した。CompactifAIにより数学的重複を除去して実際のアクティブパラメータを3.1Bに削減しつつ30B級の性能を発揮し、Blackwell GPUでシステム処理量が43%向上するなどレイテンシとコストを大幅に削減する。Hugging FaceにApache 2.0で公開され、高同時実行・文書集中・低レイテンシ環境に適しており、オンプレミス展開を促進して企業のセキュリティ・コスト要件を満たす。これによりNVDAエコシステムと軽量化ソリューションの需要は拡大する一方、クラウドGPUレンタル需要や超大規模モデル中心の事業者には構造的な圧力が生じる可能性がある。
상승 영향
- 半導体(グラフィックス・AIアクセラレータ、NVDA) — NemotronベースのPulsar 16BがBlackwellで43%の処理量向上を示したことで、NVDA GPUの利用率とCUDAエコシステムへの依存が拡大し、NVDAの売上やデータセンター需要に追い風となる。
- AIソフトウェア/モデルの軽量化 — CompactifAIにより16Bが30B級の性能を発揮しつつ計算・メモリコスト(実アクティブパラメータを3.1Bに削減)を低減することで、企業の導入障壁を下げ、推論最適化やスタートアップの革新を促して需要を拡大する。
- オンプレミス・エッジインフラ — メモリ制約のある環境でも高性能で稼働可能になり、企業の内部展開やセキュリティ要件の充足が容易になって、オンプレ・エッジ向けハードウェアやソリューションの需要が増加する見込み。
- オープンソースAIプラットフォーム(Hugging Faceなど) — Apache 2.0での公開により企業や研究者が自由にモデルを採用・改変でき、エコシステムの拡大やコミュニティ主導の改善・商用化の速度が速まる。
하락 영향
- クラウドデータセンター(GPUインスタンスのレンタル) — オンプレ運用やパラメータの軽量化により大規模なクラウドGPUレンタルの需要が減少すると、GPUインスタンス基盤の収益やデータセンターの付加サービス売上に下押し圧力がかかる可能性がある。
- 大規模パラメータ中心のLLM提供者 — 16B級の軽量モデルが低コスト・低レイテンシで同等の性能を提供すると、30B以上の超大規模モデルへの需要が弱まり、大規模モデル中心の事業モデルの差別化が難しくなる。
AI가 생성한 분석으로 투자 자문이 아닙니다.
DYAX投資家予測
上昇(ロング) 56% · 下落(ショート) 44%
合計386人参加