火炬分布式弹性 ¶ 使分布式 PyTorch 具有容错性和弹性。 开始使用 ¶ 使用说明 快速入门 训练脚本 示例 文档 ¶ API torchrun(弹性启动) 弹性代理 多进程 错误传播 约会 过期计时器 指标 事件 子进程处理 控制平面 高级 自定义 插件 TorchElastic Kubernetes