在 Google Colab 中运行教程 ¶
当你在 Google Colab 中运行教程时,可能会有额外的要求和依赖项需要满足,以便教程能够正常运行。本节包含有关如何配置各种设置以成功运行 PyTorch 教程的说明。
PyTorch 版本在 Google Colab 中
当你运行需要最新发布的 PyTorch 版本的教程时,该版本可能尚未在 Google Colab 中提供。要检查你是否已安装所需的 torch
和兼容的域库,请运行 !pip list
。
如果已安装的 PyTorch 版本低于所需版本,请运行以下命令卸载并重新安装:
!pip3 uninstall --yes torch torchaudio torchvision torchtext torchdata
!pip3 install torch torchaudio torchvision torchtext torchdata
在 Colab 中使用 Google Drive 中的教程数据
我们为教程添加了一个新功能,允许用户在 Google Colab 中打开与教程关联的 notebook。您可能需要将数据复制到您的 Google Drive 账户中,以便更复杂的教程能够运行。
在本例中,我们将演示如何将 Colab 中的 notebook 更改为与聊天机器人教程一起工作。为此,您首先需要登录到 Google Drive。(有关如何在 Colab 中访问数据的完整说明,您可以在此查看他们的示例 notebook。)
要开始,请在浏览器中打开聊天机器人教程。
在页面顶部点击 Google Colab 中的运行。
文件将在 Colab 中打开。
如果您选择“运行时”,然后选择“运行所有”,您将得到一个错误,因为找不到该文件。
为了解决这个问题,我们将把所需的文件复制到我们的 Google Drive 账户中。
登录 Google Drive。
在 Google Drive 中,创建一个名为
data
的文件夹,并在其中创建一个名为cornell
的子文件夹。访问 Cornell 电影对白语料库并下载电影语料库 ZIP 文件。
在您的本地计算机上解压文件。
将文件
utterances.jsonl
复制到您在 Google Drive 中创建的data/cornell
文件夹中。
现在我们需要编辑 Colab 中的文件,使其指向 Google Drive 上的文件。
在 Colab 中,将以下内容添加到代码部分的顶部,在以 corpus\_name
开头的行上方:
from google.colab import drive
drive.mount('/content/gdrive')
修改接下来的两行:
将
corpus\_name
的值更改为"cornell"
。将以
corpus
开头的行进行修改:
corpus = os.path.join("/content/gdrive/My Drive/data", corpus_name)
现在我们指向了我们上传到 Drive 的文件。
当您点击代码部分的运行单元格按钮时,您将需要授权 Google Drive,并获取一个授权码。将此代码粘贴到 Colab 中的提示中,您应该就可以设置了。
从“运行”/“运行全部”菜单命令重新运行笔记本,您将看到它正在处理。(请注意,本教程运行时间较长。)
希望这个例子能为您运行 Colab 中的一些更复杂的教程提供一个良好的起点。随着我们在 PyTorch 教程网站上对 Colab 的使用不断进化,我们将探讨如何让用户使用起来更加方便。
启用 CUDA
一些教程需要 CUDA(NVIDIA GPU)启用设备,这涉及到在执行教程之前更改运行时类型。要在 Google Colab 中更改运行时,在顶部下拉菜单中选择“运行时”,然后选择“更改运行时类型”。在“硬件加速器”下选择“ T4 GPU
”,然后点击“ Save
”。