量化 ¶
-
class torch.ao.quantization.quantize(model, run_fn, run_args, mapping=None, inplace=False)[source][source]
使用后训练静态量化对输入浮点模型进行量化。
首先它会为校准准备模型,然后调用 run_fn 函数执行校准步骤,之后我们将模型转换为量化模型。
- 参数:
模型 – 输入浮点模型
run_fn – 用于校准准备好的模型的校准函数
run_args – run_fn 的位置参数
原地执行 – 在原地执行模型转换,原始模块被修改
映射 - 原始模块类型与量化对应关系
- 返回值:
量化模型。