2024 年 10 月 17 日

PyTorch 2.5 版本发布博客

我们非常高兴地宣布 PyTorch® 2.5(发布说明)的发布!本版本引入了新的 cuDNN 后端,为 SDPA 提供默认加速,适用于 H100s 或更新 GPU 的用户。此外,torch.compile 的区域编译提供了一种减少 torch.compile 冷启动时间的方法,允许用户编译重复的 nn.Module(例如LLM中的 transformer 层)而无需重新编译。最后,TorchInductor CPP 后端通过众多优化提供了稳定的性能加速。

阅读更多

2024 年 10 月 15 日

在 Windows CPU 上实现 PyTorch 性能提升的路径

与 Linux 相比,PyTorch 在 Windows 上 CPU 性能较低的问题一直是一个重大问题。导致这种性能差异的因素有很多。通过我们的调查,我们确定了导致 Windows 上 CPU 性能不佳的几个原因,其中两个主要问题已被确定:Windows 默认 malloc 内存分配器的低效以及 Windows 平台上缺乏 SIMD 进行向量化优化。在本文中,我们展示了如何通过 PyTorch CPU...

阅读更多

2024 年 10 月 08 日

PyTorch 基金会技术顾问委员会选举新领导

我们很高兴地宣布 PyTorch 基金会技术顾问委员会(TAC)的首任主席和副主席:Luca Antiga 担任主席,Jiong Gong 担任副主席。这两位领导人拥有丰富的经验和深厚的 PyTorch 社区承诺,他们将指导 TAC 在培养一个开放、多元和创新的 PyTorch 技术社区方面的使命。认识新领导 Luca Antiga 自 2022 年以来担任 Lightning AI 的 CTO。他是 P...

阅读更多

2024 年 10 月 02 日

PyTorch 2024 大会回顾:热情似火 🔥

2024 年的 PyTorch 大会在旧金山举行,汇聚了近 1,500 名 AI 研究人员、开发者和爱好者。在两天的时间里,大会举办了引人入胜的讨论、富有洞察力的主题演讲和专注于人工智能(AI)以及 PyTorch(领先的开放源代码机器学习框架)的进步的实战环节。与会者深入探讨了生成式 AI、大型语言模型(LLMs)的未来,以及开源技术在推动 AI 创新中的关键作用。以下是...

阅读更多

2024 年 9 月 26 日

PyTorch 原生架构优化:torchao

我们很高兴正式推出 torchao,这是一个 PyTorch 原生库,通过利用低比特数据类型、量化和稀疏性,使模型更快更小。torchao 是一个易于使用的工具包,其中的技术(大部分)是用易于阅读的 PyTorch 代码编写的,涵盖了推理和训练。这篇博客将帮助您选择对您的工作负载重要的技术。我们在 LLama 3 和扩散模型等流行的 GenAI 模型上对技术进行了基准测试,并观察到准确率下降很小。除非……

阅读更多

2024 年 9 月 18 日

PyTorch 多设备集成中的挑战和努力:兼容性、可移植性和集成效率

引言随着对各种硬件加速器的需求增长,对强大且适应性强的深度学习框架的需求也日益迫切。在处理集成过程中,PyTorch 生态系统中出现了几个挑战,可能会影响各种硬件供应商。本文旨在突出这些问题,并提出解决方案,以增强 PyTorch 在不同硬件平台上的适应性、可移植性和弹性。提高用户代码的可移植性……

阅读更多

2024 年 9 月 12 日

Arm 加入 PyTorch 基金会成为高级会员

PyTorch 基金会是一个中立的家,为深度学习社区提供一个协作的开源 PyTorch 框架和生态系统的平台,今天宣布 Arm 已加入成为高级会员。Arm 设计了一种高性能、低功耗的计算平台,具有无与伦比的扩展性,支持从所有主要云服务提供商提供的 Arm 实例到智能手机、笔记本电脑、软件定义的虚拟机等,涵盖了一个广泛的开发者生态系统,这些开发者正在边缘和云端部署人工智能。

阅读更多