开发手册 欢迎您!
软件开发者资料库

PyTorch 数据集(dataset)

本文主要介绍PyTorch中,torchvision.datasets及其各种类型。PyTorch包括以下数据集加载器:MNIST和COCO(字幕和检测)

数据集包括下面给出的两种类型的大部分函数:

Transform:一个接收图像并返回标准内容的修改版本的函数。它们可以与转换组合在一起。

Target_transform:一个接受目标并对其进行转换的函数。例如,获取标题字符串并返回世界索引的张量。

1、MNIST

以下是Mnist DataSet的示例代码:

dset.MNIST(root, train = TRUE, transform = NONE, target_transform = None, download = FALSE)

参数如下:

  • root:已处理数据所在的数据集的root目录。
  • train:True =训练集,False =测试集。
  • download:True =从互联网上下载数据集并将其放在root目录中。

2、COCO

这需要安装COCO API。下面的示例用于演示使用PyTorch的数据集的COCO实现:

import torchvision.dataset as dsetimport torchvision.transforms as transformscap = dset.CocoCaptions(root = ‘ dir where images are’, annFile = ’json annotation file’,transform = transforms.ToTensor())print(‘Number of samples: ‘, len(cap))print(target)

实现的输出如下:

Number of samples: 82783Image Size: (3L, 427L, 640L)