手掌大小、300克的联想AI主机P7,如何实现122B模型本地运行?
2026/05/25 18:41阅读量 2
联想发布AI主机P7,仅手掌大小、300克、30W功耗,搭载后摩智能存算一体芯片M50,可实现190TOPS算力,支持本地运行122B参数大模型,推理速度达50 Tokens/s。该设备面向Agent时代长期在线、低功耗、小体积的终端需求,是存算一体架构在端侧落地的标志性产品。
事件概述
联想于近期推出AI主机P7,定位为“Agent Computer”,旨在满足AI Agent对7×24小时持续运行、低功耗、静音且具备本地大模型执行能力的终端需求。该设备重量约300克,尺寸为手掌大小,整机功耗控制在30W以内,噪音低于35分贝,可通过充电宝供电运行。
核心硬件与算力
- 异构AI算力:190TOPS,其中160TOPS来自后摩智能存算一体芯片“后摩漫界M50”(dNPU),30TOPS来自此芯P1 SoC。
- 内存与模型支持:最高80GB RAM,128K上下文窗口,支持本地部署千问、智谱、DeepSeek等122B参数模型,本地推理速度最高50 Tokens/s。
- 存算一体架构:后摩漫界M50采用SRAM+48GB LPDDR5方案,典型功耗10W,能效达传统架构芯片的5-10倍,通过减少数据搬运提升推理能效。
产品定位与设计逻辑
P7区别于传统AI PC和AI工作站,采用“一机双模”设计:智能体模式下本地运行天禧Claw,将复杂任务留在本地;大模型模式下通过开放API Key接入各类AI应用。联想与后摩智能联合团队经过十多个月的软硬件协同攻关,实现了在低功耗小体积设备上稳定运行千亿参数模型,并可支持新模型发布当天(Day0)适配。
行业背景与意义
Agent从一次性问答转向长期执行、自主拆解任务,对端侧算力的能效比和持续稳定性要求大幅提升。存算一体架构(如后摩智能M50)凭借高能效推理能力,正从云端训练场景向端侧、边缘推理节点迁移,成为Agent时代的新硬件标准之一。后摩智能已基于M50构建M.2卡、PCIe卡等产品矩阵,落地AI PC、桌面机器人、Agent Box等多元场景。
