混合移动平均观测伪量化 ¶
- 定义一个用于观察张量的混合模块。类 torch.ao.quantization.fake_quantize.FusedMovingAvgObsFakeQuantize(observer=, quant_min=0, quant_max=255, **observer_kwargs)[source][source] ¶
定义一个用于观察张量的混合模块。
用于观察输入张量(计算最小/最大值)、计算缩放/零点并进行张量伪量化的融合模块。此模块使用类似 MovingAverageMinMaxObserver 的输入计算方法,以计算最小/最大值,从而计算缩放/零点。观察器中的 qscheme 输入用于区分对称/仿射量化方案。
此模块的输出由 x_out = (clamp(round(x/scale + zero_point), quant_min, quant_max)-zero_point)*scale 给出
与
FakeQuantize
类似,接受基类相同的属性。