← 返回文章列表

满血 DeepSeek V4 能搬进办公室了!超聚变 TokenBox 单机支持 1.6T 大模型,噪音低至 35dB

超聚变发布企业 Token 生产平台 TokenBox,单机支持 1.6T 满血 DeepSeek V4,并通过模块化 Pack、PCIe Fabric Gen6 和 FusionOne AI 实现本地部署与持续扩展。

超聚变发布企业 Token 生产平台 TokenBox,单机支持满血版 DeepSeek V4 1.6T 旗舰大模型,并将原本属于数据中心的超节点算力带进企业办公区。

产品介绍

TokenBox 是超聚变在 2026 年 5 月发布的一款企业级 AI 算力设备,官方将其定义为“企业 Token 生产平台”。

它主要解决传统企业部署大模型时遇到的几个问题:AI 工作站算力和内存有限,大型 GPU 集群又需要专业机房、散热系统、网络和运维团队。

TokenBox 将计算、内存、存储、互联以及模型管理软件整合到一台立式设备中,适合企业进行本地大模型推理、智能体部署和数字员工运行。

核心硬件配置

单机支持 1.6T 大模型

TokenBox 最大的亮点,是官方宣称单机可以支持满血版 DeepSeek V4 1.6T 旗舰大模型。

DeepSeek 官方目前提供 V4 Flash 和 V4 Pro 两种 API 模型。超聚变没有公开 TokenBox 与具体版本的完整对应关系,但从 1.6T 参数规模来看,它的目标显然不只是运行轻量版模型。

Pack 模块化架构

TokenBox 没有采用边界固定的传统整机设计,而是将核心硬件拆分为四种 Pack:

  • GPack:支持多种 AI 加速卡,并集成高性能液冷能力
  • CPack:提供 CPU 与内存高速互联
  • MPack:负责异构内存和 CXL 卸载
  • SPack:配置 U.2 SSD,提供大容量高速存储

企业可以根据模型规模和并发需求扩展不同模块,避免购买后无法升级。

PCIe Fabric Gen6 互联

单台 TokenBox 内部可以实现 4 个 Pack 的全互联,多台设备之间还能通过超聚变与博通联合打造的 TokenFabric 进行扩展。

该方案采用 PCIe Fabric Gen6,让 TokenBox 可以从单机继续扩展到多节点集群。

核心功能

新模型 Day 0 支持

TokenBox 配套的 ModelEver 能力包支持新模型自动适配、自动上线、一键部署和一键升级。

超聚变希望做到新模型发布当天即可在企业现场使用,减少等待厂商重新适配软硬件的时间。

FusionOne AI 推理加速

FusionOne AI 为 TokenBox 提供模型部署、推理加速、智能体执行、体验保障和运营管理能力。

其加速技术包括:

  • Smart Decoding:投机解码加速
  • Smart KVCache:缓存卸载加速
  • Smart KVSparse:智能稀疏加速
  • 异构混推:提升不同计算资源的利用率
  • CXL 卸载:将 KVCache 卸载到扩展内存
  • PCIe Fabric 组网:支持多节点高效互联

官方宣传资料给出的场景能力为 30 路 DeepSeek V4 并发,或连接 50 个数字员工与设备。实际表现仍取决于硬件配置、模型精度、上下文长度和业务负载。

可视化运维

TokenBox 内置 AI 管理能力,支持 PC、移动端和多端访问。

企业可以查看 Token 生成速度、资源利用率、缓存和设备状态,也可以通过内置智能体进行交互式运维,降低对专业 AI 运维人员的依赖。

散热与噪音

高性能 AI 设备通常需要放在专业机房,主要原因就是功耗、散热和噪音。

TokenBox 使用冷板、微通道冷排和三总线架构。超聚变称其在主流业务负载下噪音低至 35dB,接近图书馆环境,可以放入办公室或企业业务现场。

需要注意的是,35dB 是主流业务负载口径,并不代表设备在满负载状态下仍能保持这一噪音水平。

应用场景

TokenBox 比较适合以下企业场景:

  • 金融、医疗、制造等需要数据不出域的行业
  • 企业内部知识库和大模型问答系统
  • 多智能体和数字员工平台
  • 研发团队进行大型模型测试与推理
  • 网络条件有限、需要离线运行 AI 的业务现场
  • 希望长期建设私有 AI 基础设施的中小企业

如果企业只是偶尔调用大模型,云端 API 仍然更加灵活,也不需要承担硬件维护成本。

价格与可用性

TokenBox 已于 2026 年 5 月正式发布,但超聚变目前没有公开统一售价,也没有公布具体加速卡型号、满负载功耗和不同模型精度下的完整测试数据。

企业在采购前需要重点确认:

  • 运行 1.6T 模型时采用的精度和量化方案
  • 首 Token 延迟和持续输出速度
  • 不同上下文长度下的并发能力
  • 满负载功耗、噪音和散热要求
  • 模型升级、软件授权和售后服务费用

总结

TokenBox 的意义不只是“把 DeepSeek V4 跑起来”,而是尝试把数据中心级 AI 算力做成企业可以直接部署、持续升级和统一管理的产品。

如果后续公布的价格和实际性能合理,它有机会填补 AI 工作站与大型 GPU 集群之间的市场空白,让更多企业拥有自己的本地 Token Factory。


:本文内容基于超聚变和 DeepSeek 官方公开资料整理,具体产品配置与性能以厂商最终交付版本为准。

资料来源