满血 DeepSeek V4 能搬进办公室了!超聚变 TokenBox 单机支持 1.6T 大模型,噪音低至 35dB
超聚变发布企业 Token 生产平台 TokenBox,单机支持 1.6T 满血 DeepSeek V4,并通过模块化 Pack、PCIe Fabric Gen6 和 FusionOne AI 实现本地部署与持续扩展。
超聚变发布企业 Token 生产平台 TokenBox,单机支持满血版 DeepSeek V4 1.6T 旗舰大模型,并将原本属于数据中心的超节点算力带进企业办公区。
产品介绍
TokenBox 是超聚变在 2026 年 5 月发布的一款企业级 AI 算力设备,官方将其定义为“企业 Token 生产平台”。
它主要解决传统企业部署大模型时遇到的几个问题:AI 工作站算力和内存有限,大型 GPU 集群又需要专业机房、散热系统、网络和运维团队。
TokenBox 将计算、内存、存储、互联以及模型管理软件整合到一台立式设备中,适合企业进行本地大模型推理、智能体部署和数字员工运行。
核心硬件配置
单机支持 1.6T 大模型
TokenBox 最大的亮点,是官方宣称单机可以支持满血版 DeepSeek V4 1.6T 旗舰大模型。
DeepSeek 官方目前提供 V4 Flash 和 V4 Pro 两种 API 模型。超聚变没有公开 TokenBox 与具体版本的完整对应关系,但从 1.6T 参数规模来看,它的目标显然不只是运行轻量版模型。
Pack 模块化架构
TokenBox 没有采用边界固定的传统整机设计,而是将核心硬件拆分为四种 Pack:
- GPack:支持多种 AI 加速卡,并集成高性能液冷能力
- CPack:提供 CPU 与内存高速互联
- MPack:负责异构内存和 CXL 卸载
- SPack:配置 U.2 SSD,提供大容量高速存储
企业可以根据模型规模和并发需求扩展不同模块,避免购买后无法升级。
PCIe Fabric Gen6 互联
单台 TokenBox 内部可以实现 4 个 Pack 的全互联,多台设备之间还能通过超聚变与博通联合打造的 TokenFabric 进行扩展。
该方案采用 PCIe Fabric Gen6,让 TokenBox 可以从单机继续扩展到多节点集群。
核心功能
新模型 Day 0 支持
TokenBox 配套的 ModelEver 能力包支持新模型自动适配、自动上线、一键部署和一键升级。
超聚变希望做到新模型发布当天即可在企业现场使用,减少等待厂商重新适配软硬件的时间。
FusionOne AI 推理加速
FusionOne AI 为 TokenBox 提供模型部署、推理加速、智能体执行、体验保障和运营管理能力。
其加速技术包括:
- Smart Decoding:投机解码加速
- Smart KVCache:缓存卸载加速
- Smart KVSparse:智能稀疏加速
- 异构混推:提升不同计算资源的利用率
- CXL 卸载:将 KVCache 卸载到扩展内存
- PCIe Fabric 组网:支持多节点高效互联
官方宣传资料给出的场景能力为 30 路 DeepSeek V4 并发,或连接 50 个数字员工与设备。实际表现仍取决于硬件配置、模型精度、上下文长度和业务负载。
可视化运维
TokenBox 内置 AI 管理能力,支持 PC、移动端和多端访问。
企业可以查看 Token 生成速度、资源利用率、缓存和设备状态,也可以通过内置智能体进行交互式运维,降低对专业 AI 运维人员的依赖。
散热与噪音
高性能 AI 设备通常需要放在专业机房,主要原因就是功耗、散热和噪音。
TokenBox 使用冷板、微通道冷排和三总线架构。超聚变称其在主流业务负载下噪音低至 35dB,接近图书馆环境,可以放入办公室或企业业务现场。
需要注意的是,35dB 是主流业务负载口径,并不代表设备在满负载状态下仍能保持这一噪音水平。
应用场景
TokenBox 比较适合以下企业场景:
- 金融、医疗、制造等需要数据不出域的行业
- 企业内部知识库和大模型问答系统
- 多智能体和数字员工平台
- 研发团队进行大型模型测试与推理
- 网络条件有限、需要离线运行 AI 的业务现场
- 希望长期建设私有 AI 基础设施的中小企业
如果企业只是偶尔调用大模型,云端 API 仍然更加灵活,也不需要承担硬件维护成本。
价格与可用性
TokenBox 已于 2026 年 5 月正式发布,但超聚变目前没有公开统一售价,也没有公布具体加速卡型号、满负载功耗和不同模型精度下的完整测试数据。
企业在采购前需要重点确认:
- 运行 1.6T 模型时采用的精度和量化方案
- 首 Token 延迟和持续输出速度
- 不同上下文长度下的并发能力
- 满负载功耗、噪音和散热要求
- 模型升级、软件授权和售后服务费用
总结
TokenBox 的意义不只是“把 DeepSeek V4 跑起来”,而是尝试把数据中心级 AI 算力做成企业可以直接部署、持续升级和统一管理的产品。
如果后续公布的价格和实际性能合理,它有机会填补 AI 工作站与大型 GPU 集群之间的市场空白,让更多企业拥有自己的本地 Token Factory。
注:本文内容基于超聚变和 DeepSeek 官方公开资料整理,具体产品配置与性能以厂商最终交付版本为准。
资料来源