NVIDIA 数据中心级显卡
Tesla系列(AI推理/计算)
| 型号 | 架构 | 显存(类型/容量/带宽) | 核心参数(工艺/核心数) | 算力性能 | 功耗 | 应用场景 | 类型 | 品牌 |
|---|---|---|---|---|---|---|---|---|
| Tesla P4 | Pascal | GDDR5 / 8GB / 192GB/s | 16nm / 2560 CUDA核心 | INT8:22 TOPS;FP16:5.5 TFLOPS | 75W | 边缘AI推理、视频分析 | 数据中心级 | NVIDIA |
| Tesla P100 12GB | Pascal | HBM2 / 12GB / 549GB/s | 16nm / 3584 CUDA核心 | FP64:5.3 TFLOPS;FP16:10.6 TFLOPS | 250W | 中小型AI训练、科学计算 | 数据中心级 | NVIDIA |
| Tesla P100 16GB | Pascal | HBM2 / 16GB / 732GB/s | 16nm / 3584 CUDA核心 | FP64:5.3 TFLOPS;FP16:10.6 TFLOPS | 250W | 大规模多卡AI训练 | 数据中心级 | NVIDIA |
| Tesla T4 | Turing | GDDR6 / 16GB / 320GB/s | 12nm / 2560 CUDA核心 | INT8:83 TOPS;FP16:26 TFLOPS | 70W | 云游戏、8K视频转码 | 数据中心级 | NVIDIA |
| Tesla T4L | Turing | GDDR6 / 16GB / 320GB/s | 12nm / 2560 CUDA核心 | INT8:83 TOPS;FP16:26 TFLOPS | 70W | 边缘计算、低功耗服务器 | 数据中心级 | NVIDIA |
高端计算卡(V100/A100/H系列)
| 型号 | 架构 | 显存(类型/容量/带宽) | 核心参数(工艺/核心数) | 算力性能 | 功耗 | 应用场景 | 类型 | 品牌 |
|---|---|---|---|---|---|---|---|---|
| V100(NVLink版) | Volta | HBM2 / 32GB / 900GB/s | 12nm / 5120 CUDA核心 | FP64:7.8 TFLOPS;DL:125 TFLOPS | 300W | 大规模AI训练、超算中心 | 数据中心级 | NVIDIA |
| V100(PCIe版) | Volta | HBM2 / 32GB / 1134GB/s | 12nm / 5120 CUDA核心 | FP64:7 TFLOPS;DL:112 TFLOPS | 250W | 企业级HPC、中小型AI训练 | 数据中心级 | NVIDIA |
| V100S | Volta | HBM2 / 32GB / 1134GB/s | 12nm / 5120 CUDA核心 | FP64:8.2 TFLOPS;DL:130 TFLOPS | 250W | 能效优化型AI训练 | 数据中心级 | NVIDIA |
| A100(40GB版) | Ampere | HBM2e / 40GB / 1935GB/s | 7nm / 6912 CUDA核心 | FP64:9.7 TFLOPS;INT8:624 TOPS | 300W | 企业级AI推理、科学计算 | 数据中心级 | NVIDIA |
| A100(80GB版) | Ampere | HBM2e / 80GB / 2039GB/s | 7nm / 6912 CUDA核心 | FP64:9.7 TFLOPS;INT8:624 TOPS | 300W | 千亿级LLM训练、显存密集型HPC | 数据中心级 | NVIDIA |
| A800 | Ampere | HBM2e / 80GB / 2039GB/s | 7nm / 6912 CUDA核心 | FP64:9.7 TFLOPS;FP16:19.5 TFLOPS | 300W | 国内AI训练、企业级HPC | 数据中心级 | NVIDIA |
| H100 | Hopper | HBM3 / 141GB / 3350GB/s | 4nm / 16896 CUDA核心 | FP16:335 TFLOPS;FP8:670 TFLOPS | 350W | GPT类大模型训练、超算顶级任务 | 数据中心级 | NVIDIA |
| H200 | Hopper | HBM3 / 141GB / 4800GB/s | 4nm / 16896 CUDA核心 | FP16:335 TFLOPS;FP8:670 TFLOPS | 350W | 大模型推理、实时AI服务 | 数据中心级 | NVIDIA |
NVIDIA 专业图形卡(工作站级)
| 型号 | 架构 | 显存(类型/容量) | 核心特性 | 功耗 | 主要用途 | 类型 | 品牌 |
|---|---|---|---|---|---|---|---|
| RTX 6000 | Ada Lovelace | GDDR6(ECC) / 48GB | 100+专业软件认证、光线追踪 | 300W | 工业设计、影视渲染 | 专业图形卡 | NVIDIA |
| RTX A6000 | Ampere | GDDR6(ECC) / 48GB | CUDA加速、多屏4K输出 | 300W | 科学仿真、建筑可视化 | 专业图形卡 | NVIDIA |
| RTX A5000 | Ampere | GDDR6(ECC) / 24GB | VR-ready、多应用加速 | 230W | 中端3D建模、VR内容创作 | 专业图形卡 | NVIDIA |
| RTX A4000 | Ampere | GDDR6(ECC) / 16GB | 多屏4K支持、ISV认证 | 140W | CAD设计、中端内容创作 | 专业图形卡 | NVIDIA |
| RTX 5000 | Turing | GDDR6(ECC) / 16GB | 实时光线追踪、AI增强渲染 | 230W | 影视后期、产品设计 | 专业图形卡 | NVIDIA |
| Quadro RTX 8000 | Turing | GDDR6 / 48GB | 专业图形优化、AI加速 | 260W | 专业图形设计、科学计算 | 专业图形卡 | NVIDIA |
| Quadro RTX 6000 | Turing | GDDR6 / 24GB | 实时光线追踪、AI增强 | 260W | 影视后期、产品设计 | 专业图形卡 | NVIDIA |
| T1000 | Turing | GDDR6 / 4GB/8GB | 低功耗、多屏办公 | 50W | 基础CAD设计、教育培训 | 专业图形卡 | NVIDIA |
NVIDIA 游戏显卡(消费级)
| 型号 | 架构 | 显存(类型/容量/带宽) | 核心参数(核心数/加速频率) | 关键特性 | 功耗 | 类型 | 品牌 |
|---|---|---|---|---|---|---|---|
| RTX 2080 Ti | Turing | GDDR6 / 11GB / 616GB/s | 4352 CUDA核心 / 1545MHz | 光线追踪、DLSS 2.0 | 300W | 游戏显卡 | NVIDIA |
| RTX 2080 Super | Turing | GDDR6 / 8GB / 496GB/s | 3072 CUDA核心 / 1815MHz | 光线追踪、DLSS 2.0 | 250W | 游戏显卡 | NVIDIA |
| RTX 3090 Ti | Ampere | GDDR6X / 24GB / 1008GB/s | 10752 CUDA核心 / 1860MHz | 8K游戏、NVLink互联 | 450W | 游戏显卡 | NVIDIA |
| RTX 3090 | Ampere | GDDR6X / 24GB / 936GB/s | 10496 CUDA核心 / 1725MHz | 4K高帧率、内容创作 | 350W | 游戏显卡 | NVIDIA |
| RTX 3080 Ti | Ampere | GDDR6X / 12GB / 912GB/s | 10240 CUDA核心 / 1710MHz | 4K光追、DLSS 2.0 | 320W | 游戏显卡 | NVIDIA |
| RTX 3080 | Ampere | GDDR6X / 10GB / 760GB/s | 8704 CUDA核心 / 1710MHz | 4K 60帧、DLSS 2.0 | 320W | 游戏显卡 | NVIDIA |
| RTX 3060 | Ampere | GDDR6 / 12GB / 360GB/s | 3584 CUDA核心 / 1777MHz | 1080P光追、DLSS 2.0 | 170W | 游戏显卡 | NVIDIA |
| RTX 4090 | Ada Lovelace | GDDR6X / 24GB / 1008GB/s | 16384 CUDA核心 / 2520MHz | DLSS 3、12K分辨率支持 | 450W | 游戏显卡 | NVIDIA |
| RTX 4080 | Ada Lovelace | GDDR6X / 16GB / 716GB/s | 9728 CUDA核心 / 2505MHz | DLSS 3、光线追踪优化 | 320W | 游戏显卡 | NVIDIA |
| RTX 5090 | Blackwell | GDDR7 / 32GB / 1280GB/s | 21760 CUDA核心 / 2850MHz | DLSS 4、光线追踪优化 | 570W | 游戏显卡 | NVIDIA |
AMD 显卡系列
专业图形卡
| 型号 | 架构 | 显存(类型/容量/带宽) | 核心参数(流处理器/频率) | 算力性能 | 功耗 | 应用场景 | 类型 | 品牌 |
|---|---|---|---|---|---|---|---|---|
| Radeon Pro W7900 | RDNA 3 | GDDR6 / 48GB / 576GB/s | 4608 流处理器 / 2500MHz | FP32:23.7 TFLOPS | 320W | 影视后期、工程仿真 | 专业图形卡 | AMD |
| Radeon Pro W6900X | RDNA 2 | GDDR6 / 32GB / 512GB/s | 5120 流处理器 / 2300MHz | FP32:23.0 TFLOPS | 300W | 3D建模、科学可视化 | 专业图形卡 | AMD |
| Radeon Pro VII | Vega | HBM2 / 16GB / 1024GB/s | 3840 流处理器 / 1800MHz | FP32:14.1 TFLOPS | 275W | 深度学习、专业可视化 | 专业图形卡 | AMD |
游戏显卡
| 型号 | 架构 | 显存(类型/容量/带宽) | 核心参数(流处理器/频率) | 关键特性 | 功耗 | 类型 | 品牌 |
|---|---|---|---|---|---|---|---|
| Radeon RX 7900 XTX | RDNA 3 | GDDR6 / 24GB / 819GB/s | 9600 流处理器 / 2525MHz | 光线追踪、FSR 3 | 355W | 游戏显卡 | AMD |
| Radeon RX 7900 XT | RDNA 3 | GDDR6 / 20GB / 672GB/s | 8192 流处理器 / 2450MHz | 光线追踪、FSR 3 | 315W | 游戏显卡 | AMD |
| Radeon RX 6950 XT | RDNA 2 | GDDR6 / 16GB / 576GB/s | 5120 流处理器 / 2310MHz | 光线追踪、FSR 2 | 335W | 游戏显卡 | AMD |
| Radeon RX 6800 XT | RDNA 2 | GDDR6 / 16GB / 512GB/s | 4608 流处理器 / 2250MHz | 光线追踪、FSR 2 | 300W | 游戏显卡 | AMD |
华为 GPU显卡
| 型号 | 架构 | 显存(类型/容量/带宽) | 算力性能 | 功耗 | 应用场景 | 类型 | 品牌 |
|---|---|---|---|---|---|---|---|
| Atlas 300I DUO | 自研GPU架构 | LPDDR4X(ECC) / 96GB / 408GB/s | INT8:80 TOPS;FP16:140 TFLOPS | 150W | 智慧城市、交通视频分析 | AI加速卡 | 华为 |
| 昇腾910B | 达芬奇架构 | HBM / 64GB / 400GB/s | FP16:376 TFLOPS;FP32:94 TFLOPS | 350W | 千亿级大模型训练、自动驾驶 | AI加速卡 | 华为 |
| 昇腾310 | 达芬奇架构 | LPDDR4 / 8GB / 128GB/s | INT8:16 TOPS;FP16:8 TFLOPS | 10-30W | 智能摄像头、工业质检 | AI加速卡 | 华为 |
| Atlas 800T A2 | 自研架构 | HBM2 / 32GB / 未披露 | FP16:256 TFLOPS | 400W | 大规模AI集群、超算中心 | 数据中心级 | 华为 |
其他国产GPU显卡
景嘉微系列
| 型号 | 架构 | 显存(类型/容量/带宽) | 算力性能 | 功耗 | 应用场景 | 类型 | 品牌 |
|---|---|---|---|---|---|---|---|
| JM9271 | 升级统一渲染架构 | HBM / 16GB / 512GB/s | FP32:8 TFLOPS(接近GTX 1080) | 200W | 车载AR-HUD、高端工业仿真 | 专业图形卡 | 景嘉微 |
| JM9231 | 统一渲染架构 | GDDR5 / 8GB / 256GB/s | FP32:2 TFLOPS | 150W | 高端图形渲染、中小型AI推理 | 专业图形卡 | 景嘉微 |
| JM7200 | 自研图形架构 | DDR3 / 4GB / 17GB/s | 像素填充率:5.2G Pixels/s | 10-40W | 工业设计、多屏办公 | 专业图形卡 | 景嘉微 |
| JH920 | 第三代自研架构 | 高带宽显存 / 未披露 / 96GB/s | FP32:1.2 TFLOPS | 未披露 | 高分辨率多屏显示 | 专业图形卡 | 景嘉微 |
AI加速卡系列
| 型号 | 厂商 | 架构 | 算力性能 | 功耗 | 应用场景 | 类型 | 品牌 |
|---|---|---|---|---|---|---|---|
| 天垓100 | 天数智芯 | 自研通用架构 | FP16/BF16:147 TFLOPS | 250W | 中大型AI模型训练 | AI加速卡 | 天数智芯 |
| 智铠100 | 天数智芯 | 自研通用架构 | 综合推理算力:200 TFLOPS | 150W | 安防视频分析、金融风控 | AI加速卡 | 天数智芯 |
| K100 AI版 | 海光 | 自研DCU架构 | 综合算力:196 TFLOPS(FP16) | 350W | 大模型推理、显存密集型训练 | AI加速卡 | 海光 |
| MLU590 | 寒武纪 | MLUv02扩展架构 | FP16:314 TFLOPS | 350W | 千亿级LLM训练、分布式推理 | AI加速卡 | 寒武纪 |
| 思元290 | 地平线 | BPU贝叶斯架构 | INT8:374 TOPS | 75W | 自动驾驶、边缘AI计算 | AI加速卡 | 地平线 |
消费级显卡
| 型号 | 厂商 | 架构 | 性能参数 | 功耗 | 应用场景 | 类型 | 品牌 |
|---|---|---|---|---|---|---|---|
| Lisuan eXtreme | 砺算科技 | TrueGPU天图架构 | FireStrike:26800分 | 未披露 | 1080P游戏、Blender渲染 | 游戏显卡 | 砺算科技 |
| JM10系列(待量产) | 景嘉微 | 第五代自研架构 | 性能对标RTX 3060 | 未披露 | 消费级游戏、车载智能座舱 | 游戏显卡 | 景嘉微 |