• 文档 >
  • torch.nn >
  • FractionalMaxPool3d
快捷键

FractionalMaxPool3d ¬

class torch.nn.FractionalMaxPool3d(核大小, 输出大小=None, 输出比例=None, 返回索引=False, _random_samples=None)[源][源] ¬

在由多个输入平面组成的输入信号上应用 3D 分数最大池化。

分数最大池化在 Ben Graham 的论文《分数最大池化》中进行了详细描述

最大池化操作通过随机步长应用于 kT×kH×kWkT \times kH \times kW 区域,步长由目标输出大小确定。输出特征的数量等于输入平面的数量。

注意

output_sizeoutput_ratio 必须定义其中一个。

参数:
  • kernel_size(Union[int, tuple[int, int, int]])- 对窗口进行最大值操作的窗口大小。可以是单个数字 k(用于 k x k x k 的正方形核)或一个元组(kt x kh x kw)。

  • output_size (Union[int, tuple[int, int, int]]) – 目标输出图像大小,形式为 oT x oH x oW。可以是元组 (oT, oH, oW) 或单个数字 oH,表示正方形图像 oH x oH x oH

  • output_ratio (Union[float, tuple[float, float, float]]) – 如果希望输出大小为输入大小的比例,则可以使用此选项。此选项必须是范围在 (0, 1) 内的数字或元组

  • return_indices (bool) – 如果 True ,将返回索引和输出。对传递给 nn.MaxUnpool3d() 有用。默认: False

形状:
  • 输入: (N,C,Tin,Hin,Win)(N, C, T_{in}, H_{in}, W_{in})(C,Tin,Hin,Win)(C, T_{in}, H_{in}, W_{in})

  • Output: (N,C,Tout,Hout,Wout)(N, C, T_{out}, H_{out}, W_{out})(C,Tout,Hout,Wout)(C, T_{out}, H_{out}, W_{out}) ,其中 (Tout,Hout,Wout)=output_size(T_{out}, H_{out}, W_{out})=\text{output\_size}(Tout,Hout,Wout)=output_ratio×(Tin,Hin,Win)(T_{out}, H_{out}, W_{out})=\text{output\_ratio} \times (T_{in}, H_{in}, W_{in})

示例

>>> # pool of cubic window of size=3, and target output size 13x12x11
>>> m = nn.FractionalMaxPool3d(3, output_size=(13, 12, 11))
>>> # pool of cubic window and target output size being half of input size
>>> m = nn.FractionalMaxPool3d(3, output_ratio=(0.5, 0.5, 0.5))
>>> input = torch.randn(20, 16, 50, 32, 16)
>>> output = m(input)

© 版权所有 PyTorch 贡献者。

使用 Sphinx 构建,并使用 Read the Docs 提供的主题。

文档

PyTorch 的全面开发者文档

查看文档

教程

深入了解初学者和高级开发者的教程

查看教程

资源

查找开发资源并获得您的疑问解答

查看资源