YAML Metadata
Warning:
empty or missing yaml metadata in repo card
(https://huggingface.co/docs/hub/model-cards#model-card-metadata)
🚀 RTX 50 系列显卡 AI 加速环境(Windows)
下载地址:
https://github.com/chenxqiyu/ai_cuda_wheel
适用场景:ComfyUI + Nunchaku + KJNodes
目标:在 RTX 50 系列显卡上,构建稳定、高性能的 AI 推理与加速环境 ,其他显卡需自行测试
✨ 环境特性
- ✅ CUDA 13.0
- ✅ PyTorch 2.9.1(cu130)
- ✅ xFormers(Blackwell 分支)
- ✅ SageAttention2 / SageAttention3
- ✅ Triton(Windows 版)
- ✅ Nunchaku INT4 推理引擎
- ✅ ComfyUI 工作流友好
🧩 基础环境
- 操作系统:Windows 10 / 11 x64
- Python:3.11(推荐)
- Visual Studio:VS 2022(含 C++ Build Tools)
- 显卡:RTX 50 系列
📦 PyTorch(CUDA 13.0)
pip install --pre torch==2.9.1+cu130 torchvision==0.24.1+cu130 torchaudio==2.9.1+cu130 --index-url https://download.pytorch.org/whl/cu130
⚡ 加速组件安装
xFormers
pip install xformers-0.0.33+5d4b92a.d20260121-cp39-abi3-win_amd64.whl
Triton(Windows)
pip install triton_windows-3.6.0-cp311-cp311-win_amd64.whl
SageAttention
pip install sageattention-2.2.0-cp311-cp311-win_amd64.whl
SageAttention3
pip install sageattn3-1.0.0-cp311-cp311-win_amd64.whl
Nunchaku
pip install nunchaku-1.2.0+torch2.9-cp311-cp311-win_amd64.whl
🧠 ComfyUI 扩展节点
Nunchaku
KJNodes
SageAttention3
🛠️ 编译与构建记录
编译环境
- 工具:x64 Native Tools Command Prompt for VS 2022
Git 长路径支持(必做)
git config --system core.longpaths true
相关源码仓库
Triton Windows 适配
https://github.com/woct0rdho/triton-windowsSageAttention
https://github.com/mengqin/SageAttentionxFormers(Blackwell)
https://github.com/LagPixelLOL/xformers/tree/blackwellNunchaku Core
https://github.com/nunchaku-ai/nunchaku
🧪 实践建议
- 🔹 优先验证
torch.cuda.is_available()与 CUDA 版本一致性 - 🔹 遇到
misaligned address,优先检查 attention kernel / dtype / head_dim - 🔹 SageAttention3 与 xFormers 不建议同时启用同一路径
- 🔹 INT4 推理建议搭配 Nunchaku + FP16 输入
📌 备注
本环境主要面向 RTX 50(Blackwell) 架构实验与高性能推理,
部分组件为 非官方 / 实验性构建,请自行评估稳定性。
使用sageattention3加速选其中一个就行
Enjoy Blackwell 🚀
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support