PyTorch數據集

在本章中,將更多地關注torchvision.datasets及其各種類型。PyTorch包括以下數據集加載器 -

  • MNIST
  • COCO (字幕和檢測)

數據集包括以下兩種函數 -

  • transform - 一種接收圖像並返回標準內容的修改版本的函數。這些可以與變換一起組合。
  • target_transform - 獲取目標並對其進行轉換的函數。例如,接受標題字串並返回索引張量。

MNIST

以下是MNIST數據集的示例代碼 -

dset.MNIST(root, train = TRUE, transform = NONE,
target_transform = None, download = FALSE)

參數如下 -

  • root - 存在已處理數據的數據集的根目錄。
  • train - True =訓練集,False =測試集
  • download - True =從互聯網下載數據集並將其放入根目錄。

COCO

需要安裝COCO API。以下示例用於演示使用PyTorch的數據集的COCO實現 -

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ' dir where images are', annFile = 'json annotation file', transform = transforms.ToTensor())

print('Number of samples: ', len(cap))
print(target)

上面程式代碼輸出結果如下:

Number of samples: 82783
Image Size: (3L, 427L, 640L)

上一篇: PyTorch遞歸神經網路 下一篇: PyTorch Convents簡介