• 文档 >
  • 量化 >
  • 量化 API 参考 >
  • 具有约束的 DType
快捷键

具有约束的 DType ¶

class torch.ao.quantization.backend_config.DTypeWithConstraints(dtype=None, quant_min_lower_bound=None, quant_max_upper_bound=None, scale_min_lower_bound=None, scale_max_upper_bound=None, scale_exact_match=None, zero_point_exact_match=None)[source][source]

用于指定给定数据类型的额外约束配置,例如量化值范围、缩放值范围和固定量化参数,用于在 DTypeConfig 中应用。

当前支持的约束有:

  • quant_min_lower_bound 和 quant_max_upper_bound:分别表示最小和最大量化值的下限和上限。如果 QConfig 的 quant_min 和 quant_max 超出此范围,则 QConfig 将被忽略。

  • scale_min_lower_bound 和 scale_max_upper_bound:分别表示最小和最大缩放值的下限和上限。如果 QConfig 的最小缩放值(目前以 eps 展示)低于下限,则 QConfig 将被忽略。注意,目前尚未强制执行上限。

  • scale_exact_match 和 zero_point_exact_match:用于具有固定量化参数(如 sigmoid 和 tanh)的操作符的缩放和零点精确匹配要求。如果 QConfig 中指定的观察者既不是 FixedQParamsObserver 也不是 FixedQParamsFakeQuantize,或者量化参数不匹配,则 QConfig 将被忽略。


© 版权所有 PyTorch 贡献者。

使用 Sphinx 构建,主题由 Read the Docs 提供。

文档

查看 PyTorch 的全面开发者文档

查看文档

教程

深入了解初学者和高级开发者的教程

查看教程

资源

查找开发资源并获得您的疑问解答

查看资源