手掌大小、300克的联想AI主机P7，如何实现122B模型本地运行？

2026/05/25 18:41阅读量 2

联想发布AI主机P7，仅手掌大小、300克、30W功耗，搭载后摩智能存算一体芯片M50，可实现190TOPS算力，支持本地运行122B参数大模型，推理速度达50 Tokens/s。该设备面向Agent时代长期在线、低功耗、小体积的终端需求，是存算一体架构在端侧落地的标志性产品。

事件概述

联想于近期推出AI主机P7，定位为“Agent Computer”，旨在满足AI Agent对7×24小时持续运行、低功耗、静音且具备本地大模型执行能力的终端需求。该设备重量约300克，尺寸为手掌大小，整机功耗控制在30W以内，噪音低于35分贝，可通过充电宝供电运行。

核心硬件与算力

异构AI算力：190TOPS，其中160TOPS来自后摩智能存算一体芯片“后摩漫界M50”（dNPU），30TOPS来自此芯P1 SoC。
内存与模型支持：最高80GB RAM，128K上下文窗口，支持本地部署千问、智谱、DeepSeek等122B参数模型，本地推理速度最高50 Tokens/s。
存算一体架构：后摩漫界M50采用SRAM+48GB LPDDR5方案，典型功耗10W，能效达传统架构芯片的5-10倍，通过减少数据搬运提升推理能效。

产品定位与设计逻辑

P7区别于传统AI PC和AI工作站，采用“一机双模”设计：智能体模式下本地运行天禧Claw，将复杂任务留在本地；大模型模式下通过开放API Key接入各类AI应用。联想与后摩智能联合团队经过十多个月的软硬件协同攻关，实现了在低功耗小体积设备上稳定运行千亿参数模型，并可支持新模型发布当天（Day0）适配。

行业背景与意义

Agent从一次性问答转向长期执行、自主拆解任务，对端侧算力的能效比和持续稳定性要求大幅提升。存算一体架构（如后摩智能M50）凭借高能效推理能力，正从云端训练场景向端侧、边缘推理节点迁移，成为Agent时代的新硬件标准之一。后摩智能已基于M50构建M.2卡、PCIe卡等产品矩阵，落地AI PC、桌面机器人、Agent Box等多元场景。

阅读原文详情

事件概述

核心硬件与算力

产品定位与设计逻辑

行业背景与意义

准备好启动您的定制项目了吗？