LLM 技术量化:减小模型大小 (zh)On this page量化:减小模型大小 (zh)训练后量化 (PTQ, Post-training quantization)对训练结束后的最终模型进行量化。感知量化 (QAT, Quantization-aware training)对预训练模型做量化。