dataset和dataloader的详解及使用
创始人
2024-11-17 17:37:08
0

dataset和dataloader是离不开的,dataset就像是一盒扑克牌,而dataloader就是发牌。下面让我们来学习dataset和dataloader吧

dataset

dataset常见的参数

datasets.训练所用的数据原名称(root,train,transform,download)

  • root:是数据源的文件所在位置
  • train:表示是否为训练后的数据源
  • transform:是对数据源中每一个数据的标准化处理
  • dowload:表示是否从官网下载该数据源

举例

import torchvision  dataset_transform=torchvision.transforms.Compose([torchvision.transforms.ToTensor()]) train_set=torchvision.datasets.CIFAR10(root="./dataset",transform=dataset_transform,train=True,download="True") test_set=torchvision.datasets.CIFAR10(root="./dataset",transform=dataset_transform,train=False,download="True")   

其中第四行是进行训练的数据源;
第五行是没有进行训练的数据源;
第三行是将数据源中的每一个数据转成tensor形式

dataset返回值

dataset返回的是一个大列表,每个列表的元素为一个小列表,小列表即为每个元素的信息,每个小列表包含两个元素,分别是图片和目标,可用以下方式接收

import torchvision  dataset_transform=torchvision.transforms.Compose([torchvision.transforms.ToTensor()]) train_set=torchvision.datasets.CIFAR10(root="./dataset",transform=dataset_transform,train=True,download="True") test_set=torchvision.datasets.CIFAR10(root="./dataset",transform=dataset_transform,train=False,download="True")  img,target=test_set[0] print(img) print(target)  writer.close() 

其中第7行为第1个数据的图片和期望的接收

dataloader

dataloader常见的参数

DataLoader(root,batch_size,shuffle,num_workers,drop_last)

  • root:数据原所在的文件地址(相当于扑克牌)
  • batch_size:每次分发几份数据(每次发几张牌)
  • shuffle:是否将数据打乱(是否要把牌打乱)
  • drop_last:是否删除多余的部分(有101张牌,每次分10张,是否删除最后多余的一张)
  • num_workers:几个进程

举例

import torchvision from torch.utils.data import DataLoader  dataset_transform=torchvision.transforms.ToTensor() test_dataset=torchvision.datasets.CIFAR10(root="./dataset",train=False,transform=dataset_transform) test_loader=DataLoader(test_dataset,10,False,num_workers=0,drop_last=True) 

其中第5行为dataset的使用,引入数据源
第6行为dataloader的使用,数据源为test_dataset,batch_size=10,shuffle=False
,每次发10张牌不打乱

返回值

返回一个大列表,大列表有(总数量除batch_size)个元素,每个元素是不同的数据的集合,即中列表,中列表有两个元素,一个是图片集和目标集,可用如下方式接受。

import torchvision from torch.utils.data import DataLoader from torch.utils.tensorboard import SummaryWriter  dataset_transform=torchvision.transforms.ToTensor() test_dataset=torchvision.datasets.CIFAR10(root="./dataset",train=False,transform=dataset_transform) test_loader=DataLoader(test_dataset,10,False,num_workers=0,drop_last=True)  # img,target=test_dataset[0] # print(img) # print(target)  writer=SummaryWriter("./DataLoader") step=0 for data in test_loader:     imgs,targets=data     writer.add_images("loader",imgs,step)     step+=1 writer.close() 

其中第16行为元素的接收。

相关内容

热门资讯

详细了解!玉海楼辅助器(辅助)... 详细了解!玉海楼辅助器(辅助)永乐跑胡子都是真的是有辅助挂(哔哩哔哩)1、许多玩家不知道玉海楼辅助器...
揭露了解!福建宁德麻将辅助软件... 揭露了解!福建宁德麻将辅助软件(辅助)安喜好像是有辅助插件(哔哩哔哩)福建宁德麻将辅助软件是不是有人...
关于了解!新永和源代码(辅助)... 关于了解!新永和源代码(辅助)芒杏儿小盒总是有挂辅助app(哔哩哔哩)1、新永和源代码免费辅助多个强...
推荐了解!新西楚有挂吗(辅助)... 推荐了解!新西楚有挂吗(辅助)云月晋善麻将好像是真的辅助器(哔哩哔哩)暗藏猫腻,小编详细说明新西楚有...
普及了解!大唐撸麻雀辅助(辅助... 普及了解!大唐撸麻雀辅助(辅助)红十棋牌其实存在有辅助脚本(哔哩哔哩)1、任何大唐撸麻雀辅助透视是真...
专业了解!微乐小程序脚本辅助(... 专业了解!微乐小程序脚本辅助(辅助)同城上饶确实真的有辅助安装(哔哩哔哩)1、微乐小程序脚本辅助破解...
解谜了解!邯郸胡乐辅助脚本下载... 解谜了解!邯郸胡乐辅助脚本下载(辅助)东阳四副牌原来是有辅助挂(哔哩哔哩)暗藏猫腻,小编详细说明邯郸...
了解了解!心悦透视辅助器免费(... 了解了解!心悦透视辅助器免费(辅助)云端总是真的是有辅助软件(哔哩哔哩)1、心悦透视辅助器免费破解器...
辅助了解!四川微乐微信麻将小程... 辅助了解!四川微乐微信麻将小程序辅助(辅助)纸蛙竞技麻将一直有挂辅助器(哔哩哔哩)一、四川微乐微信麻...
解密了解!雀神广东麻将提高胜率... 解密了解!雀神广东麻将提高胜率(辅助)中至新余真是真的是有辅助软件(哔哩哔哩)1、完成雀神广东麻将提...