CUDA 环境变量 ¶

关于 CUDA 运行时环境变量的更多信息，请参阅 CUDA 环境变量。

PyTorch 环境变量

变量	描述
`PYTORCH_NO_CUDA_MEMORY_CACHING`	如果设置为 `1` ，将禁用 CUDA 中内存分配的缓存。这可能在调试时很有用。
`PYTORCH_CUDA_ALLOC_CONF`	关于此环境变量的更深入解释，请参阅内存管理。
`PYTORCH_NVML_BASED_CUDA_CHECK`	如果设置为 `1` ，在导入检查 CUDA 是否可用的 PyTorch 模块之前，PyTorch 将使用 NVML 来检查 CUDA 驱动程序是否功能正常，而不是使用 CUDA 运行时。这可能在分叉进程因 CUDA 初始化错误而失败时很有帮助。
`TORCH_CUDNN_V8_API_LRU_CACHE_LIMIT`	cuDNN v8 API 的缓存限制。这用于限制 cuDNN v8 API 使用的内存。默认值为 10000，假设每个 ExecutionPlan 为 200KiB，则大致相当于 2GiB。设置为 `0` 表示无限制或负值表示无缓存。
`TORCH_CUDNN_V8_API_DISABLED`	如果设置为 `1` ，则禁用 cuDNN v8 API。并将回退到 cuDNN v7 API。
`TORCH_ALLOW_TF32_CUBLAS_OVERRIDE`	如果设置为 `1` ，则强制启用 TF32，覆盖 `set_float32_matmul_precision` 设置。
`TORCH_NCCL_USE_COMM_NONBLOCKING`	如果设置为 `1` ，则启用 NCCL 中的非阻塞错误处理。
`TORCH_NCCL_AVOID_RECORD_STREAMS`	如果设置为 `0` ，则启用 NCCL 中基于记录流的同步行为的回退。
`TORCH_CUDNN_V8_API_DEBUG`	如果设置为 `1` ，则检查是否正在使用 cuDNN V8。

CUDA 运行时和库环境变量

变量	描述
`CUDA_VISIBLE_DEVICES`	以逗号分隔的 GPU 设备 ID 列表，这些设备 ID 应可供 CUDA 运行时使用。如果设置为 `-1` ，则不提供任何 GPU。
`CUDA_LAUNCH_BLOCKING`	如果设置为 `1` ，则使 CUDA 调用同步。这可能在调试时很有用。
`CUBLAS_WORKSPACE_CONFIG`	此环境变量用于设置每个分配的 cuBLAS 工作区配置。格式为 `:[SIZE]:[COUNT]` 。例如，默认每个分配的工作区大小为 `CUBLAS_WORKSPACE_CONFIG=:4096:2:16:8` ，指定总大小为 `2 * 4096 + 8 * 16 KiB` 。要强制 cuBLAS 避免使用工作区，请设置 `CUBLAS_WORKSPACE_CONFIG=:0:0` 。
`CUDNN_CONV_WSCAP_DBG`	与 `CUBLAS_WORKSPACE_CONFIG` 类似，此环境变量用于设置每个分配的 cuDNN 工作区配置。
`CUBLASLT_WORKSPACE_SIZE`	与 `CUBLAS_WORKSPACE_CONFIG` 类似，此环境变量用于设置 cuBLASLT 的工作区大小。
`CUDNN_ERRATA_JSON_FILE`	可设置为文件路径，用于传递给 cuDNN 的纠错过滤器，以避免特定的引擎配置，主要用于调试或硬编码自动调整。
`NVIDIA_TF32_OVERRIDE`	如果设置为 `0` ，将全局禁用 TF32，覆盖所有 PyTorch 设置。

文档