Fashion MNISTデータのダウンロード

Fashion MNISTとは、28x28ピクセルの10種類のファッションカテゴリの白黒画像である。ラベルは以下の通り。

0 Tシャツ/トップス
1 ズボン
2 プルオーバー
3 ドレス
4 コート
5 サンダル
6 シャツ
7 スニーカー
8 バッグ
9 アンクルブーツ

以下のリンクからダウンロードできる。

mnist_train.csv

mnist_test.csv

MNISTの場合と同様に、上のcsvファイルをダウンロードして適当なフォルダに置いたら、以下のようにして読み込むことが出来る。

In [12]:
#このセルの内容はライブラリのインポートと関数load_csvの定義をもう一回行っているだけで、多くの場合必要ではない。
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

def load_csv(csv):
    xx=np.array(pd.read_csv(csv))
    x_data=xx[:,1:].astype('float32') / 255
    y_data=xx[:,0]
    
    return x_data, y_data
In [13]:
pixel_size=28

xf_train, yf_train=load_csv('./fashion_mnist_train.csv')
xf_test, yf_test=load_csv('./fashion_mnist_test.csv')

MNISTの数字のデータと区別するために、仮にxf_train, yf_trainなどと「f」を付けておく。間違えなければ何でも良い。

In [14]:
n=int(xf_train.shape[0]/10)
xf_train2=xf_train[:n,]
yf_train2=yf_train[:n]

n=int(xf_test.shape[0]/10) 
xf_test2=xf_test[:n,]
yf_test2=yf_test[:n]

MNISTの場合と同様に、データの最初のいくつかを表示してみる。

In [15]:
x_img=xf_train.reshape([xf_train.shape[0],pixel_size,pixel_size])
fig = plt.figure(figsize=(12,10))
for i in range(0,25):
    axes = fig.add_subplot(5, 5, i%25+1)
    axes.imshow(x_img[i,:,:],cmap='gray')