满血 DeepSeek V4 能搬进办公室了！超聚变 TokenBox 单机支持 1.6T 大模型，噪音低至 35dB

超聚变发布企业 Token 生产平台 TokenBox，单机支持满血版 DeepSeek V4 1.6T 旗舰大模型，并将原本属于数据中心的超节点算力带进企业办公区。

产品介绍

TokenBox 是超聚变在 2026 年 5 月发布的一款企业级 AI 算力设备，官方将其定义为“企业 Token 生产平台”。

它主要解决传统企业部署大模型时遇到的几个问题：AI 工作站算力和内存有限，大型 GPU 集群又需要专业机房、散热系统、网络和运维团队。

TokenBox 将计算、内存、存储、互联以及模型管理软件整合到一台立式设备中，适合企业进行本地大模型推理、智能体部署和数字员工运行。

TokenBox 最大的亮点，是官方宣称单机可以支持满血版 DeepSeek V4 1.6T 旗舰大模型。

DeepSeek 官方目前提供 V4 Flash 和 V4 Pro 两种 API 模型。超聚变没有公开 TokenBox 与具体版本的完整对应关系，但从 1.6T 参数规模来看，它的目标显然不只是运行轻量版模型。

TokenBox 没有采用边界固定的传统整机设计，而是将核心硬件拆分为四种 Pack：

企业可以根据模型规模和并发需求扩展不同模块，避免购买后无法升级。

单台 TokenBox 内部可以实现 4 个 Pack 的全互联，多台设备之间还能通过超聚变与博通联合打造的 TokenFabric 进行扩展。

该方案采用 PCIe Fabric Gen6，让 TokenBox 可以从单机继续扩展到多节点集群。

TokenBox 配套的 ModelEver 能力包支持新模型自动适配、自动上线、一键部署和一键升级。

超聚变希望做到新模型发布当天即可在企业现场使用，减少等待厂商重新适配软硬件的时间。

FusionOne AI 为 TokenBox 提供模型部署、推理加速、智能体执行、体验保障和运营管理能力。

其加速技术包括：

官方宣传资料给出的场景能力为 30 路 DeepSeek V4 并发，或连接 50 个数字员工与设备。实际表现仍取决于硬件配置、模型精度、上下文长度和业务负载。

TokenBox 内置 AI 管理能力，支持 PC、移动端和多端访问。

企业可以查看 Token 生成速度、资源利用率、缓存和设备状态，也可以通过内置智能体进行交互式运维，降低对专业 AI 运维人员的依赖。

高性能 AI 设备通常需要放在专业机房，主要原因就是功耗、散热和噪音。

TokenBox 使用冷板、微通道冷排和三总线架构。超聚变称其在主流业务负载下噪音低至 35dB，接近图书馆环境，可以放入办公室或企业业务现场。

需要注意的是，35dB 是主流业务负载口径，并不代表设备在满负载状态下仍能保持这一噪音水平。

TokenBox 比较适合以下企业场景：

如果企业只是偶尔调用大模型，云端 API 仍然更加灵活，也不需要承担硬件维护成本。

TokenBox 已于 2026 年 5 月正式发布，但超聚变目前没有公开统一售价，也没有公布具体加速卡型号、满负载功耗和不同模型精度下的完整测试数据。

企业在采购前需要重点确认：

TokenBox 的意义不只是“把 DeepSeek V4 跑起来”，而是尝试把数据中心级 AI 算力做成企业可以直接部署、持续升级和统一管理的产品。

如果后续公布的价格和实际性能合理，它有机会填补 AI 工作站与大型 GPU 集群之间的市场空白，让更多企业拥有自己的本地 Token Factory。

注：本文内容基于超聚变和 DeepSeek 官方公开资料整理，具体产品配置与性能以厂商最终交付版本为准。

资料来源