清程极智发布全链路Token解决方案,推动中国AI产业从能用迈向好用
2026/05/28 11:40阅读量 2
清程极智推出以赤兔推理引擎、AI Ping评测路由平台、八卦炉智能软件栈为核心的全链路Token解决方案。赤兔引擎实现国产算力全国产化闭环,降低DeepSeek-V3部署硬件成本至150万元;AI Ping平台接入30余家服务商,通过智能路由使成本降低37%、吞吐提升90%。当前中国Token日均调用量激增约1400倍,突破140万亿,但推理环节长期依赖海外引擎,清程极智的方案试图打破这一瓶颈。
事件概述
清程极智团队系统构建了以赤兔推理引擎、AI Ping评测路由平台、八卦炉智能软件栈为核心的全链路Token解决方案。该公司成立于2023年12月,核心成员来自清华大学计算机系高性能计算所,已完成天使轮、PreA、PreA+三轮融资,投资方包括中科创星、中金资本、考拉基金、联想创投等。
核心信息
行业背景
- Token已成为AI时代核心生产要素。2024年初至2026年3月,中国Token日均调用量激增约1400倍,规模突破140万亿。
- 随着Agent智能体、多模态应用普及,Token从交互用量转向生产用量,对推理效率、部署成本、服务稳定性要求持续攀升。
- 国产算力与国产模型发展迅速,但推理环节长期依赖海外引擎,难以充分释放国产硬件性能,Token服务市场存在贵、慢、选型难等问题。
赤兔推理引擎
- 完全自主研发的国产推理引擎,构建“国产算力+国产引擎+国产模型”全国产化闭环。
- 针对昇腾、海光、沐曦、摩尔线程等国产芯片深度优化,实现标量向量计算、数据表达、硬件调度、卡间互联全维度适配。
- 通过软件方案在不具FP4/FP8硬件能力的设备上支持低位宽量化:FP8降低50%算力门槛,FP4降低75%算力门槛。
- 部署DeepSeek‑V3满血版仅需1台8卡910B服务器(原需4台8卡机),硬件成本从600万元降至150万元。
- 已在券商、能源央企等场景落地。某能源央企实现3500+员工全国产化算力稳定使用,算力效率提升近40%,相关案例获2025人工智能应用大赛铜奖。
AI Ping评测路由平台
- 国内首个集“信息汇总、客观评测、智能路由”于一体的Token服务枢纽。
- 已接入30余家主流服务商、600余个大模型服务,覆盖文本、图片、视频等全场景。
- 7×24小时多地域分布式监测,实时输出延迟、吞吐、可靠性、价格等核心指标。
- 智能路由算法以统一API接口自动匹配最优服务商,实现成本降低超37%、吞吐提升超90%、延迟降低超20%。
八卦炉智能软件栈
- 面向大模型训练、微调场景,提供高效Token生产与智能调度能力。
- 与赤兔推理引擎、AI Ping平台协同,覆盖AI“训练-推理-应用”全流程。
值得关注
清程极智通过“引擎+平台+软件栈”的完整产品矩阵,试图解决国产算力“能用不好用”的痛点,并降低Token服务的选择成本和部署成本。随着国家“人工智能+”行动的推进,其全栈自主可控方案有望在更多行业规模落地,加速中国AI产业从可用到好用的转变。
