标签：量化

消费级显卡部署 Qwen3-32B（Q4_K_M）完全指南:显存测算、工具选择与国产卡适配

手把手在消费级显卡上本地部署 Qwen3-32B(Q4_K_M):显存怎么算(约20GB)、哪些 N 卡能跑(24GB偏紧/32GB舒服/16GB offload)、国产卡(摩尔线程/昇腾)怎么办、Olla...

2个月前

本地大模型深度入门:为什么本地跑、Ollama 五分钟上手、主流开源模型家族(Qwen/Llama/DeepSeek)怎么选、看懂量化(q4_K_M)、按 0.6GB/B 估显存、本地 API 接入...

2个月前