关于 CUDA 的架构(SM、SP)
About CUDA's architecture (SM, SP)
我是一个刚刚开始 CUDA 编程的人。
似乎有一个SP SM和CUDA架构的概念。
我尝试运行 deviceQuery.cpp 示例源我认为什么有效,并且 SP SM 开发他们的环境,
已经不知道哪些项目SP是否是SM中的任何项目。
我认为项目"(14) 多处理器,(8) CUDA 内核/MP",这对 SP 和 SM 是正确的,但我会正确理解以下内容吗?
SM = 多处理器 = 14
SP = CUDA 核心/MP = 8
CUDA 核心 = 14 * 8 = 112
顺便说一下,deviceQuery.cpp的结果如下。
CUDA 设备查询(运行时 API)版本(CUDART 静态链接)
检测到 1 个支持 CUDA 的设备
设备 0:"GeForce GTS 240
CUDA 驱动程序版本/运行时版本 5.5/5.5
CUDA 功能主要/次要版本号:1.1
全局内存总量:1024 MB(1073741824 字节)
(14) 多处理器, ( 8) CUDA 内核/MP: 112 CUDA 内核
GPU 时钟速率:1620 兆赫 (1.62 GHz)
内存时钟速率:1100 MHz
内存总线宽度:256 位
最大纹理尺寸 (x,y,z) 1D=(8192), 2D=(65536, 32768), 3
D=(2048, 2048, 2048)
最大分层 1D 纹理大小,(数)层 1D=(8192),512 层
最大分层 2D 纹理大小,(数)层数 2D=(8192, 8192),512 层
常量内存总量:65536 字节
每个块的共享内存总量:16384 字节
每个块可用的寄存器总数:8192
经纱尺寸:32
每个多处理器的最大线程数:768
每个块的最大线程数:512
线程块的最大尺寸大小 (x,y,z): (512, 512, 64)
网格大小 (x,y,z) 的最大尺寸大小:(65535, 65535, 1)
最大内存间距:2147483647 字节
纹理对齐:256 字节
并发复制和内核执行:是,带 1 个复制引擎
内核的运行时间限制:是
集成 GPU 共享主机内存:否
支持主机页面锁定内存映射:是
曲面的对齐要求:是
设备具有 ECC 支持:已禁用
设备支持统一寻址 (UVA):否
设备 PCI 总线 ID/PCI 位置 ID: 9/0
计算模式:
<默认(多个主机线程可以使用>啧)
>
根据这一点,您是正确的:
SM = 流多处理器
SP = 流处理器 = CUDA 核心
总 SP/CUDA 核心数 = SM 数 * 每个 SM 的 SP/CUDA 核心数
- Arduino无法编译名为SP:"Expected ')' before '(' token"的变量
- 如何在拆分为多个文件的分层 SM 中退出子机器?(使用boost::MSM)
- 如何重置提升::sml::sm 实例
- 如何在 boost::msm 中实现可以访问状态机 (SM) 的后端/前端的"BaseState"
- 局部变量 'sp' 在被读取之前在所有路径中重新分配
- CMake + CUDA "invalid device function"即使使用正确的 SM 版本
- Microsoft Visual Studio 2008,版本9.0.30739.1 SP,DLL构建错误
- Converting Eigen::SparseMatrix<double> to deal.ii ::Sp
- 在 Win 7 SP 中创建 exe vcxproj:过程入口点<function>无法位于动态链接库中KERNAL32.dll
- 类似的函数,如sp.linalg.norm,sp.cross在C++
- 确定 Windows Server 2003 SP 1 是 32 位还是 64 位的正确方法是什么?
- 如何展开堆栈以获取指定堆栈指针(SP)的回溯
- SQL SP在SSMS中正常工作,但在VC++应用程序中失败
- CUDA nvlink 警告:未找到 SM 拱门("sm_35")
- NIST SP 800-56A 串联/单步密钥派生函数的现有实现
- 关于 CUDA 的架构(SM、SP)
- 什么是Microsoft Windows SDK for Windows 7和.NET Framework 3.5 SP
- c++正则表达式/flex++中的模式{sp}是什么意思
- 在安卓 NDK 中使用"sp"
- 为什么我不能使用 "const string* sp = 0" 在构造函数中初始化