cpu-gpu-difference

CUDA 矩阵乘法终极优化指南

发表于2021年10月20日由管理员

单精度矩阵乘法（SGEMM）几乎是每一位学习 CUDA 的同学绕不开的案例，这个经典的计算密集型案例可以很好地展示 GPU 编程中常用的优化技巧，而能否写出高效率的 SGEMM Kernel，也是反映一位 CUDA 程序员对 GPU 体系结构的理解程度的优秀考题。

cuda uva

nvidia gpu中的Unified Memory

发表于2021年4月17日由管理员

说到Unified Memory，它其实只是一种在Pascal架构/Volta架构/Turing架构中存在的一种新型内存编程模型，即它不是一种物理上新型的gpu显存设计。

cpu-gpu-difference

CPU 和 GPU – 异构计算的演进与发展

发表于2021年4月15日由管理员

在计算领域中，CPU（Central Processing Unit）和 GPU（Graphics Processing Unit）分别是通用的和特定的方案，前者可以提供最基本的计算能力解决几乎所有问题，而后者在图形计算和机器学习等领域内表现优异。