使用 CMake 为 CUDA 进行多配置/多平台构建

Multi-config/multi-platform build for CUDA using CMake

本文关键字：配置平台构建 CMake CUDA 使用更新时间：2023-10-16

我最近与CMake发生了一些争执，试图让它在涉及Cuda的不同平台上为调试和发布目标生成项目文件。我使用的Cuda版本是Windows和Linux上的9.1。CMake 版本在 Windows 上是 3.9，在 Linux 上是 3.10。

问题实际上很简单，因为如果nvcc正确传递"-DEBUG"标志，我可以在 Windows 上生成构建。但是，我似乎无法通过配置自动正确传递标志。我尝试使用CMAKE_NVCC_FLAGS_CONFIG，CMAKE_CXX_FLAGS_CONFIGCUDA_PROPAGATE_HOST_FLAGS设置为ON/OFF，CUDA_HOST_COMPILATION_CPP切换到ON/OFF也没有帮助。使用表达式生成器设置标志以使用set_directory_property设置目录属性，或作为cuda_add_executable的选项也不起作用。

这是我的 cmake 脚本的要点：

# CMake entry point
cmake_minimum_required (VERSION 3.9.1)
set( APP_NAME example-CUDA )
find_package(XYZ)
find_package(CUDA)  # not required according to 1st-class status in CMake3 .8+
enable_language(CUDA)
set(CUDA_VERBOSE_BUILD ON)
set(SRC_EXAMPLE "main.cpp" "gj.cu"  "gj.cuh")
SOURCE_GROUP(Example FILES ${SRC_EXAMPLE})
set(SRC_BUILD_FILES ${SRC_EXAMPLE})
# note: similar stuff for linux ommitted..
if("${CMAKE_SYSTEM_NAME}" STREQUAL "Windows")
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} /MP")
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} /W4 /WX /sdl- -Zm256")
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} /MD")
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} /we4146 /we4308 /we4532 /we4533 /we4700 /we4703 /we4789 /we4995 /we4996")
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} /INCREMENTAL")
set(CMAKE_CXX_FLAGS_DEBUG "${CMAKE_CXX_FLAGS_DEBUG} /MP")
set(CMAKE_CXX_FLAGS_DEBUG "${CMAKE_CXX_FLAGS_DEBUG} /we4146 /we4308 /we4532 /we4533 /we4700 /we4703 /we4789 /we4995 /we4996")
set(CMAKE_CXX_FLAGS_DEBUG "${CMAKE_CXX_FLAGS_DEBUG} /W4 /WX /sdl- -Zm256")
set(CMAKE_CXX_FLAGS_DEBUG "${CMAKE_CXX_FLAGS_DEBUG} /Zi")
set(CMAKE_CXX_FLAGS_DEBUG "${CMAKE_CXX_FLAGS_DEBUG} /D_DEBUG" CACHE STRING "compile flags debug" FORCE)
endif()
# cuda 9 flags for max compatibility ( note: no more sm 20!)
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    "-arch=sm_30 -gencode=arch=compute_30,code=sm_30 -gencode=arch=compute_50,code=sm_50 -gencode=arch=compute_52,code=sm_52 -gencode=arch=compute_60,code=sm_60 -gencode=arch=compute_61,code=sm_61 -gencode=arch=compute_62,code=sm_62 -gencode=arch=compute_70,code=sm_70 -gencode=arch=compute_70,code=compute_70")
include_directories(SYSTEM  ${CUDA_TOOLKIT_INCLUDE} ${CMAKE_CURRENT_SOURCE_DIR})
#set(CUDA_HOST_COMPILATION_CPP ON) 
#set(CUDA_PROPAGATE_HOST_FLAGS ON)
#set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}   " -D_DEBUG ")             # works, but hadcoded config :(
set(CUDA_NVCC_FLAGS_DEBUG   ${CUDA_NVCC_FLAGS_DEBUG}    " -D_DEBUG ") # fails, not picked up..
#cuda_add_executable (${APP_NAME} ${SRC_EXAMPLE} OPTIONS $<$<CONFIG:Debug>:"-DEBUG">) #fails, generator not run
cuda_add_executable (${APP_NAME} ${SRC_EXAMPLE})
target_link_libraries (${APP_NAME} PUBLIC CUDA XYZ)

我在VS2015(我也使用2017)中遇到的错误是典型的不正确_ITERATOR_DEBUG_LEVEL，这意味着其中一个编译单元没有正确传递-DEBUG标志，链接器看到rebug和发布模块混合在一起。由 nvcc.exe 构建的模块在内部传递以供 cl.exe 针对非 cuda 代码位进行编译，只是缺少所有_DEBUG配置标志。我已经通读了FindCUDA.cmake，以找到一些有趣的东西，但几乎不可能分辨出什么是有效的，什么是无效的。

我显然错过了一些东西，但是呢？有什么解决方法吗？

更新 1：我还在 CMakeLists.txt层次结构中设置了以下方式：

project (MyLittleBigProject)
# Set default build type
set(PROJECT_CONFIGURATIONS      Debug Release               CACHE TYPE INTERNAL FORCE)
if(DEFINED CMAKE_BUILD_TYPE)
set(CMAKE_BUILD_TYPE ${CMAKE_BUILD_TYPE} CACHE STRING "Build configs: ${PROJECT_CONFIGURATIONS}")
else()
set(CMAKE_BUILD_TYPE Debug CACHE STRING "Build configs: ${PROJECT_CONFIGURATIONS}")
endif()

我对CUDA/NVCC一无所知，但是查看FindCUDA的文档，您可以尝试以下几件事：

通过CMAKE_C_FLAGS_DEBUG传递调试标志，因为CUDA_HOST_COMPILER的文档指出，默认情况下，使用CMAKE_C_COMPILER，而不是CMAKE_CXX_COMPILER，
通过cuda_add_executable()传递调试标志：文档指出它调用cuda_wrap_srcs()，您可以在其中传递带有OPTIONS DEBUG ...的特定标志

希望这有帮助。

有几件事共同造成了这个问题，最大的一件事是对VS2017的支持根本不存在。

也就是说，我仍然可以通过构建我自己的 Cmake 虚拟目标来包装所有 CUDA 库依赖项和构建设置，使其正确适用于其他编译器。我从我可以找到的 CUDA 的现有 Find_XXX CMake 脚本开始，并在宏之后添加了以下部分(我几乎在我的任何依赖项中使用了一个技巧)。这部分实际上并不是绝对必要的，因为 CMake 显然在幕后为你做同样的事情，但它也可以在该自动魔法出现问题的情况下起作用，好处是您可以完全控制正在发生的事情。

set(API "CUDA")
if(NOT TARGET "${API}")     
if (CUDA_cudart_static_LIBRARY)     # we assume at least cuda 5.5+
add_custom_target("Generate${API}" DEPENDS  "${CUDA_cudart_static_LIBRARY}" )        
add_library(            "${API}"            STATIC          IMPORTED                                GLOBAL )      
set_property(TARGET     "${API}"            PROPERTY        IMPORTED_LOCATION                       "${CUDA_cudart_static_LIBRARY}")
set_property(TARGET     "${API}"            PROPERTY        INTERFACE_LINK_LIBRARIES                "${CUDA_LIBRARIES}")        
set_property(TARGET     "${API}"            PROPERTY        INTERFACE_INCLUDE_DIRECTORIES           "${CUDA_INCLUDE_DIRS}"   )
set_property(TARGET     "${API}"            PROPERTY        FOLDER                                  "APIGenerators"     )
set_property(TARGET     "Generate${API}"    PROPERTY        FOLDER                                  "APIGenerators"     )
add_dependencies(       "${API}"            "Generate${API}")
else()
add_library(            "${API}"            INTERFACE       IMPORTED                                GLOBAL )
endif() 
endif()

因此，既然您已经准备好了自己的 CUDA Find_Package调用 CUDA，您可以继续设置一个 cmake 来创建您的项目，只需调用 find_package(CUDA)。CMake "自动"识别 CUDA，因此链接实际上是隐式的。以下是我为幕后调用的NVCC编译步骤设置一些变量的方法：

enable_language(CUDA)
set(CUDA_VERBOSE_BUILD ON)
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    "-I=${GLM_INCLUDE_DIR} ")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    "-I=${GLEW_INCLUDE_PATH} ")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    "-I=${YOUR_INCLUDE_DIRS} ")
# cuda 9 flags for max compatibility ( no more sm 20!)
if("${CMAKE_SYSTEM_NAME}" STREQUAL "Windows")
#set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}   "-arch=sm_30 -gencode=arch=compute_30,code=sm_30 -gencode=arch=compute_50,code=sm_50 -gencode=arch=compute_52,code=sm_52 -gencode=arch=compute_60,code=sm_60 -gencode=arch=compute_61,code=sm_61 -gencode=arch=compute_62,code=sm_62 -gencode=arch=compute_70,code=sm_70 -gencode=arch=compute_70,code=compute_70")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    "-arch=sm_30")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    " -gencode=arch=compute_30,code=sm_30")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    " -gencode=arch=compute_50,code=sm_50")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    " -gencode=arch=compute_52,code=sm_52")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    " -gencode=arch=compute_60,code=sm_60")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    " -gencode=arch=compute_61,code=sm_61")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    " -gencode=arch=compute_62,code=sm_62")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    " -gencode=arch=compute_70,code=sm_70")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    " -gencode=arch=compute_70,code=compute_70")
else()      
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    "-arch=sm_30")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    " -gencode=arch=compute_30,code=sm_30")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    " -gencode=arch=compute_50,code=sm_50")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    " -gencode=arch=compute_52,code=sm_52")
set(CUDA_NVCC_FLAGS   ${CUDA_NVCC_FLAGS}    " -std=c++11")
endif()

现在，您可以关闭包含主机标志的 CUDA 标志，因为您自己设置了它们，并指定一些在我的情况下所需的相关编译定义。

set(CUDA_HOST_COMPILATION_CPP OFF)
set(CUDA_PROPAGATE_HOST_FLAGS OFF)
target_compile_definitions(${APP_NAME} PRIVATE $<$<CONFIG:Debug>:"_DEBUG ">)
target_compile_definitions(${APP_NAME} PRIVATE "_MWAITXINTRIN_H_INCLUDED")
target_compile_definitions(${APP_NAME} PRIVATE "_FORCE_INLINES")
target_compile_definitions(${APP_NAME} PRIVATE "__STRICT_ANSI__")
set_target_properties(${APP_NAME} PROPERTIES COMPILE_FLAGS "-std=c++11")

最后但并非最不重要的一点是，切换到 C++11 编译，否则编译器可能会被所有<>类似模板的自动类型结构所混淆。

set_target_properties(${APP_NAME} PROPERTIES COMPILE_FLAGS "-std=c++11")

希望这对你们中的一些人有所帮助。如果您知道如何让它在VS2017上工作而不会有太多麻烦，请发表评论！