成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

模型訓(xùn)練之?dāng)?shù)據(jù)集操作:矩陣變換

人工智能
在神經(jīng)網(wǎng)絡(luò)模型中,數(shù)據(jù)格式主要采用張量(tensor)來(lái)表示,而具體的載體就是多維數(shù)組(n>=1),也就是多維矩陣。

對(duì)神經(jīng)網(wǎng)絡(luò)技術(shù)有所了解的人應(yīng)該都知道,要想訓(xùn)練一個(gè)高性能的神經(jīng)網(wǎng)絡(luò)模型,除了神經(jīng)網(wǎng)絡(luò)本身的設(shè)計(jì)之外,還一個(gè)非常重要的前提就是數(shù)據(jù)集的質(zhì)量問(wèn)題;因此,打造一個(gè)高質(zhì)量的數(shù)據(jù)集就是一個(gè)必不可少的過(guò)程。

但具體怎么才能開(kāi)發(fā)一個(gè)合格的數(shù)據(jù)集,這時(shí)就離不開(kāi)對(duì)數(shù)據(jù)集的各種操作;而由于在神經(jīng)網(wǎng)絡(luò)中,數(shù)據(jù)的主要載體是多維數(shù)組,也就是矩陣;因此一般情況下,數(shù)據(jù)集的數(shù)據(jù)格式也會(huì)以矩陣的形式存在。

而學(xué)會(huì)對(duì)矩陣的操作就是一個(gè)必不可少的技能之一;下面我們就以MINST數(shù)據(jù)集為例,來(lái)簡(jiǎn)單介紹一下對(duì)數(shù)據(jù)集的操作過(guò)程。

數(shù)據(jù)集操作

MINST數(shù)據(jù)集是一個(gè)經(jīng)典的數(shù)據(jù)集,其內(nèi)容是一個(gè)手寫(xiě)數(shù)字識(shí)別的數(shù)據(jù)集;對(duì)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)技術(shù)的人來(lái)說(shuō),手寫(xiě)數(shù)字識(shí)別就相當(dāng)于編程入門(mén)中的Hello World。

因此,了解MINST數(shù)據(jù)集也是學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)技術(shù)的入門(mén)課程之一。

關(guān)于MINST數(shù)據(jù)集的下載方式,基本有兩種選擇;一種是自己手動(dòng)下載,另一種是從pytorch官網(wǎng)下載,使用PyTorch的數(shù)據(jù)集API即可下載。

from torchvision import datasets
# 執(zhí)行以下代碼即可從pytorch官網(wǎng)下載minst數(shù)據(jù)集到本地data目錄
datasets.MNIST(root='data', train=True, download=True)

MINST數(shù)據(jù)集主要有四個(gè)壓縮文件組成,分別由train開(kāi)頭的圖片數(shù)據(jù)(images)和標(biāo)簽數(shù)據(jù)(labels);以及t10k開(kāi)頭的測(cè)試圖片數(shù)據(jù)(t10k-images)和標(biāo)簽數(shù)據(jù)(t10k-labels)組成。

MNIST數(shù)據(jù)集的具體內(nèi)容是由0?9手寫(xiě)數(shù)字圖片和數(shù)字標(biāo)簽所組成的,由60000個(gè)訓(xùn)練樣本和10000個(gè)測(cè)試樣本組成,每個(gè)樣本都是一張28 * 28像素的灰度手寫(xiě)數(shù)字圖片。如下圖所示。

由于下載的MINST數(shù)據(jù)集文件是已經(jīng)處理好的矩陣格式,并且用二進(jìn)制格式存儲(chǔ),因此無(wú)法直接使用文本工具打開(kāi)。

而我們可以使用python提供的numpy工具包,或者pytorch提供的工具包來(lái)讀取數(shù)據(jù)。

import numpy as np
import gzip


with gzip.open("./MNIST/train-images-idx3-ubyte.gz", 'rb') as f:    
  x_train = np.frombuffer(f.read(), np.uint8, offset=16)    
  print("MINST數(shù)據(jù)集信息打印, 數(shù)據(jù)集內(nèi)容:%s, 類型: %s, 長(zhǎng)度: %s, 矩陣數(shù)據(jù)類型: %s, 形狀: %s, 大小:%s, 維度: %s" % (x_train, type(x_train), len(x_train), x_train.dtype, x_train.shape, x_train.size, x_train.ndim))

以上代碼輸出結(jié)果如下,可以明顯看出讀取結(jié)果是一個(gè)一維數(shù)組;并且長(zhǎng)度為47040000;不是說(shuō)數(shù)據(jù)集是六萬(wàn)個(gè)28*28的手寫(xiě)數(shù)字圖片嗎?為什么會(huì)是一個(gè)47040000長(zhǎng)度的一維數(shù)組。

原因就在于此數(shù)據(jù)集是經(jīng)過(guò)處理之后的數(shù)據(jù)集,為了存儲(chǔ)方便使用一維數(shù)組最簡(jiǎn)單;因此,在使用過(guò)程中需要把數(shù)據(jù)變換成一個(gè)三維矩陣,也就是升維的操作;47040000 / (28 * 28) = 60000。

import numpy as np
import gzip
with gzip.open("./MNIST/train-images-idx3-ubyte.gz", 'rb') as f:
    x_train = np.frombuffer(f.read(), np.uint8, offset=16)
    print("MINST數(shù)據(jù)集信息打印, 數(shù)據(jù)集內(nèi)容:%s, 類型: %s, 長(zhǎng)度: %s, 矩陣數(shù)據(jù)類型: %s, 形狀: %s, 大小:%s, 維度: %s" % (x_train, type(x_train), len(x_train),
        x_train.dtype, x_train.shape, x_train.size, x_train.ndim))    
    # 矩陣變換
    x_train = x_train.reshape(-1, 28, 28)
    print("MINST數(shù)據(jù)集信息變換之后打印, 數(shù)據(jù)集內(nèi)容:%s, 類型: %s, 長(zhǎng)度: %s, 矩陣數(shù)據(jù)類型: %s, 形狀: %s, 大小:%s, 維度: %s" % (    x_train, type(x_train), len(x_train),    x_train.dtype, x_train.shape, x_train.size, x_train.ndim))

結(jié)果如下圖所示:

經(jīng)過(guò)變換之后,打印矩陣并顯示圖片:

import numpy as np
import gzip
from PIL import Image
with gzip.open("./MNIST/train-images-idx3-ubyte.gz", 'rb') as f:
    x_train = np.frombuffer(f.read(), np.uint8, offset=16)    
    print("MINST數(shù)據(jù)集信息打印, 數(shù)據(jù)集內(nèi)容:%s, 類型: %s, 長(zhǎng)度: %s, 矩陣數(shù)據(jù)類型: %s, 形狀: %s, 大小:%s, 維度: %s" % (x_train, type(x_train), len(x_train),          x_train.dtype, x_train.shape, x_train.size, x_train.ndim))    
    x_train = x_train.reshape(-1, 28, 28)    
    print("MINST數(shù)據(jù)集信息變換之后打印, 數(shù)據(jù)集內(nèi)容:%s, 類型: %s, 長(zhǎng)度: %s, 矩陣數(shù)據(jù)類型: %s, 形狀: %s, 大小:%s, 維度: %s" % (    x_train, type(x_train), len(x_train),    x_train.dtype, x_train.shape, x_train.size, x_train.ndim))    
    print(len(x_train), x_train[0])    
    # 轉(zhuǎn)換為圖片 并顯示    
    pil_img = Image.fromarray(np.uint8(x_train[0]))    
    pil_img.show()

執(zhí)行以上代碼 用戶即可輸出手寫(xiě)數(shù)字圖片。

責(zé)任編輯:趙寧寧 來(lái)源: AI探索時(shí)代
相關(guān)推薦

2025-03-07 08:00:00

數(shù)據(jù)數(shù)據(jù)集集神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)預(yù)處理

2024-01-03 18:53:13

語(yǔ)言模型LLM

2025-05-14 08:51:00

2022-09-20 23:42:15

機(jī)器學(xué)習(xí)Python數(shù)據(jù)集

2023-11-10 07:11:02

OpenAIAI

2023-04-20 11:30:12

2024-11-04 00:24:56

2024-11-26 09:33:44

2024-12-26 00:46:25

機(jī)器學(xué)習(xí)LoRA訓(xùn)練

2024-08-07 15:27:50

2024-09-14 13:50:00

AI訓(xùn)練

2024-07-01 12:55:50

2024-04-25 09:25:33

2022-12-29 08:35:13

變換矩陣計(jì)算機(jī)圖形學(xué)

2025-06-19 10:09:55

2025-06-24 03:00:00

2024-05-23 12:57:59

2023-07-11 15:30:08

GPT-4架構(gòu)

2016-01-07 11:25:12

數(shù)據(jù)模型訓(xùn)練數(shù)據(jù)

2023-10-07 08:05:17

數(shù)據(jù)分析模型行為分析
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 日韩精品区 | 成人欧美一区二区三区1314 | 日韩久久久久 | av电影一区二区 | 亚洲精品电影在线观看 | 国产黄a一级 | 99精品电影 | 欧美日韩精品久久久免费观看 | 99久久久久 | 久久久久国产成人精品亚洲午夜 | 爱爱小视频 | 欧美在线国产精品 | 精品久久久久久亚洲精品 | 欧美黄色片 | 国产精品九九 | 免费美女网站 | 国产二区视频 | 99精品观看 | 最新国产精品视频 | 国产三级电影网站 | 五月婷婷导航 | 中文字幕精品一区二区三区精品 | 涩涩操 | 亚洲高清一区二区三区 | 成人高清在线视频 | 国产午夜精品一区二区 | 黄篇网址 | 久草网址 | 精品日韩欧美一区二区 | 毛片一级片 | 国产精品a级 | 国产91丝袜在线18 | 网络毛片 | 久久国产成人午夜av影院武则天 | 视频一区在线 | 精品一区二区在线看 | 成人免费在线观看 | 日韩欧美精品在线 | 国产精品一区在线观看 | 亚洲成av人片在线观看 | www.成人在线视频 |