Jim Keller 解析 RISC-V 趋势:CPU 与 AI 融合重塑算力格局
Jim Keller 指出 RISC-V 凭借开源灵活特性,新设计数量已远超 ARM 和 Intel,正成为芯片行业创新的核心驱动力。其设计的 Ascalon 处理器通过激进架构参数展现高性能潜力,配合软件生态的成熟,标志着 RISC-V 从“可用”迈向“最优”。未来硬件将走向 CPU 与 AI 加速器异构融合路线,旨在降低算力成本并推动国产芯片自主可控。
事件概述
Jim Keller(前苹果、AMD、特斯拉芯片架构师,现任 Tenstorrent 高管)在内部技术分享中揭示了 RISC-V 架构的最新发展趋势。核心观点认为,RISC-V 凭借开源和灵活性正在颠覆传统芯片行业,未来的高性能计算将呈现 CPU 与 AI 加速器深度融合的异构架构形态。
核心事实与数据
- 创新活跃度对比:RISC-V 的新设计数量超过 20 个,分别是 ARM(5 个)的 4 倍、Intel(2 个)的 10 倍。Keller 强调:“你可以改变它,可以做你想做的,这就是创新发生的方式。”
- 四大核心优势:
- Open(开源):无 IP 限制,合作伙伴真正拥有架构控制权。
- Flexible(灵活):支持功能增减及架构修改。
- Accelerated(加速):结合现代架构与开放生态,适应快速迭代。
- Future Proof(面向未来):专为适应 AI 时代软硬件变化而设计。
Ascalon 处理器架构突破
Tenstorrent 正在开发的 Ascalon 处理器针对高性能服务器和 AI 场景,展示了 RISC-V 从“能用”到“最优”的跨越:
- 解码能力:高达 8 路解码(8-wide decode)。
- 计算单元:配备 6 个 ALU + 2 个分支单元,以及 2×256 位向量单元。
- 缓存与带宽:单集群 8 核共享 12MB 缓存,内存带宽达 230 GB/s。
软件生态里程碑
RISC-V 的软件短板已基本补齐,关键时间节点如下:
- 2017 年:GCC 7.0 与 Linux 4.15 开始支持。
- 2020 年:Rust 和 Go 语言添加 RISC-V 目标支持。
- 2022 年:Chromium V8 引擎合并支持,使 Chrome 浏览器运行成为可能。
- 2023 年:Google 启动 Android 官方移植项目。
硬件演进路线图:CPU 与 AI 融合
Keller 提出通用 CPU 与 AI 必须紧密协作的结论,明确了从独立 ML 处理器向异构融合的演进路径:
- 分工模式:CPU 负责系统控制、安全、虚拟化及调度;AI 加速器专注高算力输出。
- 时间线:
- 2021 年:Grayskull(纯 ML 处理器)
- 2022 年:Wormhole(独立 ML 计算机)
- 2023 年:Black Hole(集成 SiFive RISC-V X-280,异构计算)
- 2024 年:Grendel(CPU + ML chiplets 融合)
- 性价比表现:Tenstorrent 方案在 6 千瓦功耗下可提供 12 PFLOP 算力。
软件栈策略
为降低开发门槛,Tenstorrent 提供两条路径:
- BUDA:自上而下编译,自动分配资源,无需手动优化,支持从单卡到数千卡的扩展。
- ttMetal:底层低级库,提供直接硬件访问权限,供硬核开发者手动优化资源。
行业影响
- 打破垄断:更多厂商可参与芯片设计,不再受限于 ARM 和 Intel 的封闭生态。
- 成本下降:开源架构降低研发门槛,高性能芯片价格有望持续下行。
- 国产机遇:中国厂商可基于 RISC-V 实现自主可控的高性能芯片研发,摆脱供应链限制。
