设为首页
收藏本站
切换到窄版
地模论坛
BBS
登录
立即注册
地模论坛
»
地模论坛
›
高性能计算相关
›
高性能计算
›
CPU、GPU、NPU、TPU 有啥区别?看完这篇彻底弄懂 ...
返回列表
发布新帖
查看:
6
|
回复:
1
CPU、GPU、NPU、TPU 有啥区别?看完这篇彻底弄懂
[复制链接]
SGer
SGer
当前在线
积分
15
3
主题
1
回帖
15
积分
新手上路
新手上路, 积分 15, 距离下一级还需 35 积分
新手上路, 积分 15, 距离下一级还需 35 积分
积分
15
发消息
发表于
2 小时前
|
查看全部
|
阅读模式
https://mp.weixin.qq.com/s/x9_8AFhIle09ow37vump9A
原创 Serven 文观经技 2026年5月11日
作为一名国产EDA研发工程师,平时工作经常要
适配不同芯片架构
。很多人只知道CPU、GPU、NPU、TPU都是处理器,但完全分不清它们的来历、定位和区别。
为什么一台电脑要有CPU还要有GPU?手机里为什么凭空多出一颗NPU?TPU又是什么?今天我从从业者角度,简单直白梳理四款芯片的发展历史,再讲透它们的本质区别,全程不用晦涩术语,通俗易懂,看完彻底搞明白
异构计算
。
一、CPU:最早的计算核心,一切芯片的起点
CPU是资历最老的处理器,从上世纪70年代开始普及。早期计算机体积庞大,工程师最初的想法很简单:
只用一颗芯片搞定所有计算
,这就是CPU的由来。
CPU的设计逻辑偏向人脑,擅长逻辑判断、分支跳转、任务调度
。它的核心不多,但每一颗核心都设计得极其复杂,缓存、流水线、分支预测一应俱全,专门处理杂乱无章、没有固定规律的任务。操作系统、软件运行、程序调度,全部依赖CPU。
可以认为 CPU 是一名博士生, 理解能力非常强, 他什么都会, 加减乘除, 微积分,任何高大上的数学难题他都游刃有余, 如果用他来计算图形处理那种简单的加法, 那属实有点浪费。
从业内角度来讲,CPU追求的是
通用性、兼容性、逻辑处理能力
。哪怕到现在,无论GPU、AI芯片多强,CPU永远是主控,负责指挥调度其他芯片。它是整个电子设备的大管家,地位不可替代。
二、GPU:为游戏而生,意外成为AI基石
GPU诞生于90年代,初衷非常单纯:为了玩游戏。早期电脑画质差,画面像素计算量大,CPU并行能力弱,渲染画面卡顿严重。于是英伟达推出独立图形芯片,专门处理像素渲染、图像绘制,GPU就此诞生。
GPU和CPU设计逻辑完全相反。它放弃复杂逻辑,砍掉多余控制单元,堆砌成千上万简单计算核心,主打
并行、重复、大批量运算
。渲染游戏画面、处理贴图光影,对它来说轻而易举。
而真正让GPU封神的,是AI时代的到来。大模型需要海量矩阵乘法,这种枯燥、重复、大规模的运算,刚好契合GPU架构优势。原本为游戏而生的芯片,意外成为全球AI训练的核心算力底座。打个比方,
可以认为 GPU 是小学生, 他只会计算最简单的加法。一个 GPU 是由几千万个小学生同时在做加法, 效率非常高。
站在EDA研发角度,GPU版图设计难度极高,布线密集、功耗巨大,这也是高端GPU流片成本远超CPU的根本原因。
三、NPU:手机倒逼出来的轻量化AI芯片
2015年之后,人工智能开始普及,但当时存在一个明显痛点:手机端AI任务越来越多,拍照识别、智能抠图、语音处理,如果全部交给CPU、GPU处理,功耗高、发热大、续航崩盘。
行业急需一款低成本、低功耗、专门跑神经网络的芯片,NPU应运而生。华为、高通、联发科纷纷入局,把AI运算电路直接固化在芯片内部。
NPU不追求通用计算,也不做图形渲染,硬件架构完全针对卷积运算、矩阵运算优化。它只干一件事:
专门处理轻量化AI推理任务
。
现在手机的AI修图、实时翻译、智能降噪、端侧大模型,都是NPU在默默工作。它不像GPU算力强悍,胜在省电、体积小、针对性极强,是消费电子专属的AI辅助芯片。
四、TPU:谷歌自研,只为云端AI而生的专用芯片
TPU出现时间最晚,由谷歌在2016年推出。谷歌在搭建大模型时发现,通用GPU虽然好用,但冗余结构太多、成本高、功耗不理想。于是谷歌干脆自研芯片,砍掉无关功能,纯为张量运算、深度学习定制,TPU就此诞生。
TPU是纯粹的云端AI芯片,不对外售卖、不民用、不做消费级产品,只服务谷歌数据中心。相比于GPU,它在大模型训练、张量计算上效率更高、成本更低。
简单理解:
TPU就是极致简化、完全为AI量身定做的超级算力芯片
。
五、四款芯片核心区别,直白总结
一图总结四种芯片的核心区别:
CPU是全能管理者
。核心少、智商高,擅长复杂逻辑、调度控制,任何设备的主控大脑,通用性最强。
GPU是批量工人
。核心极多,无脑重复干活,擅长图形渲染、AI大模型训练,算力天花板最高。
NPU是轻量AI助手
。专为移动端AI设计,功耗极低,负责手机、智能家居的轻量化AI推理。
TPU是定制AI工厂
。谷歌专属,架构极致简化,只为云端大模型服务,效率高但不通用。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
回复
举报
SGer
SGer
当前在线
积分
15
3
主题
1
回帖
15
积分
新手上路
新手上路, 积分 15, 距离下一级还需 35 积分
新手上路, 积分 15, 距离下一级还需 35 积分
积分
15
发消息
楼主
|
发表于
2 小时前
|
查看全部
(接上篇)
六、从业视角:为什么不能合并成一颗芯片?
很多外行疑惑,为什么不把四种芯片整合在一起?从EDA设计角度,我实话实说:全能等于全不精。
CPU讲究逻辑,GPU讲究并行,NPU讲究低功耗,TPU讲究专用算力。四款芯片架构逻辑、电路设计、布线规则完全不同。强行整合只会导致面积过大、发热爆炸、功耗失控、成本飙升。
所以行业最终走向
异构计算
:CPU统筹调度,GPU扛重载算力,NPU负责端侧AI,TPU服务云端大模型。各司其职,互相配合,这才是最高效、最合理的硬件架构。
结尾总结
回顾发展历史:CPU为通用计算而生,GPU为游戏而生,NPU为移动端AI而生,TPU为云端大模型而生。四款芯片看似相似,出身、架构、用途完全不同。
随着AI持续爆发,异构计算会成为行业常态。未来不会再有单一万能芯片,而是多芯片协同工作。看懂这四款芯片,也就看懂了现代电子设备、服务器、AI算力集群的底层逻辑。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
回复
举报
返回列表
发布新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
环境、水文
八小时以外
地模论坛
© 2001-2026
Discuz! Team
. Powered by
Discuz!
W1.5
京ICP备14024088号
关灯
在本版发帖
返回顶部
快速回复
返回顶部
返回列表