趋境·灵启 Spark：将数据中心级AI算力，放上你的桌面

目前AI大模型正以惊人速度重塑各行各业，无论是企业、个人或者团队，往往都面临着一个进退两难的尴尬局面：云端算力成本高昂、数据隐私风险难以把控、本地部署环境配置复杂，正是这样的背景之下，趋境·灵启 Spark应运而生！

简单来说，趋境·灵启 Spark在外表上仅仅是一个1.2kg的桌面盒子，大小和迷你主机基本一致，却将数据中心级的AI算力、开箱即用的AMaas模型管理平台和企业级知识库工具“智问”融为一体，精准符合AI开发者、数据敏感企业、高校科研、极客玩家等各类人群的需求，重点是搭建成本相对其他方式来说也低不少。

趋境·灵启 Spark内置由智谱AI推出的GLM-4.5-Air 106B大模型，总参数量达到1060亿，它采用灵活的混合推理模式，思考模式适用于复杂推理，并原生支持工具调用，非思考模式则是用于快速响应。

基于趋境和智谱AI联合深度定制，这款千亿级大模型仅在这个小盒子上就能流畅运行——单并发推理速度达30 tokens/s，预填速度2100 tokens/s，支持100K超长上下文。

核心硬件方面，趋境·灵启 Spark搭载强大的NVIDIA Grace Blackwell平台，在FP4低精度下能提供1000 AI TOPS超高算力，并统一128GB LPDDR5X内存，高带宽和大容量保障了千亿级大模型的运行效率。

有线和网络均为顶级配置：搭配10GbE网卡 (RJ-45) + WiFi 7，并结合了ConnectX-7 Smart NIC——这不仅是为了快，更是为多台设备集群化扩展铺平道路，满足未来增长需求。

产品整体尺寸为150mm x 150mm x 50.5mm，重量1.2kg，功耗仅170W——这意味着，以往需要占用半个机柜、功耗上千瓦（牵连复杂散热结构）、价值数十万元的服务器才能驱动的千亿级大模型，如今只需这个巴掌大的盒子就能在桌面安静运行。

针对本地部署环境配置复杂这个痛点，趋境·灵启 Spark完美做到了开箱即用和上手门槛低，预部署KLLM推理引擎框架，并内置了AMaaS模型管理平台，无需任何繁琐命令，呈现的是可完全直观化操作的图形界面，管理者5分钟内即可完成部署千万级大模型。AMaaS支持实时监控硬件资源&模型运行状态，可极大程度避免显存溢出情况确保稳定运行，另一方面通过模型启动参数调优和智能内存缓存管理，轻松实现资源利用率最大化。

除了深度定制的GLM-4.5-Air 106B千亿级大模型以外，AMaaS还内置了大量主流大模型，无需下载并支持云上更新，实现一站式模型管理，还提供私有模型导入功能，满足个性化需求之余，实现数据安全充分保障。对于进一步的研发需求来说，这款产品还支持多模型部署并行推理的模式，实现多模型对话对比、多场景测试框架等数种实验场景，达到扩展企业多样化AI业务的效果。

这款产品还内置了智问管理平台，这是一个基于本地大模型的安全智能问答与文档分析工具，支持上传企业内部的文档、代码、合同等资料，打造企业私有知识库。员工可以用自然语言进行提问，即刻获得基于企业内部知识的精准答案，且所有数据100%在本地处理，彻底杜绝泄密风险，是构建企业专属“AI大脑”的即装即用解决方案。针对企业不同业务需求，可动态灵活切换不同模型，最大程度保障答案精准性。

智问管理平台还提供了丰富的AI应用中心——无需代码就能快捷使用AI能力，覆盖会议纪要、月报、润色、翻译等企业员工常用需求，其中AI阅读、长文写作（生成内容概述、速读等）和会议助手（会议录音转换文字）是作为单独的模块功能。若不满足内置AI应用和功能，还可以扩展网页应用插件，比如OfficeAI、ChatExcel、AiPPT等实用AI工具。