QConfig¶
- class torch.ao.quantization.qconfig.QConfig(activation, weight)[source][source]¶
描述了如何通过为激活和权重分别提供设置(观察器类)来量化层或网络的一部分。
注意,QConfig 需要包含观察器类(如 MinMaxObserver)或一个在调用时返回实例的可调用对象,而不是具体的观察器实例本身。量化准备函数将为每个层实例化观察者多次。
观察器类通常具有合理的默认参数,但可以使用 with_args 方法(类似于 functools.partial)进行覆盖:
my_qconfig = QConfig( activation=MinMaxObserver.with_args(dtype=torch.qint8), weight=default_observer.with_args(dtype=torch.qint8))