彩色影像辨識：Google Cifar-10－小木屋

真實世界的圖片大部分是彩色影像。相對於灰階的黑白影像，彩色影像只有在色彩上比灰階多了紅綠藍三原色的顏色。也因此，在辨識精確度上就有很高的不確定性。本文紀錄 Google 資料集裡的彩色影像 Cifar-10的識別紀錄。

1. 資料讀取

在 Google 資料集裡面，只要一行指令就可以讀取 Cifar-10 資料

(x_train, y_train), (x_test, y_test) = tf.keras.datasets.cifar10.load_data()

如果以前都沒抓取過 Cifar-10 資料，第一次讀取會從國外網站抓取。大約花費 10 幾分鐘的時間。

接下來我們可以看一下資料的分佈形狀
print(x_train.shape)
print(y_train.shape)
print(x_test.shape)
print(y_test.shape)

Python 裡面資料型態是筆數，寬度，長度，位元數目。圖片是彩色資料，因此在最後一筆的位元數目有 3 個數字，分別代表 R(紅色) G(綠色) 和 B(藍色)。

如果還不清楚，利用 debugger 來看資料內部就更清楚了：

縱軸是某一個圖素(pixel)，而橫軸則代表那個圖素(pixel)的R(紅色) G(綠色) 和 B(藍色)數值。

這和我們以前看到純黑白的影像不大一樣：以前是一個圖素(pixel)只有一個灰階的數值

2.資料顯示

由於資料量 50000 過大，不可能顯示出每一筆資料。這裡就簡單顯示訓練資料的前9筆資料。

import matplotlib.pyplot as plt
num=0
for num in range(0,9):
plt.subplot(3,3,num+1)
plt.title('[%d]->%d'% (num, y_train[num]))
plt.imshow(x_train[num])
plt.show()

看過這些資料，我會有以下的感想：
1. 顏色分佈不一致，而且差異性很高。這些都會提高以後訓練的困難度。而驗證時精確度也會降低。

2. 物體在圖中的位置和大小都不一致，這也會造成驗證精確度的下降。

3. 圖片資料轉換成訓練資料
x_train = (50000, 32, 32, 3)
對於圖形資料，這樣的資料放置很正常。但對於未來的深度學習的訓練資料，就需要做一些修改。訓練資料中資料的型態是(筆數，特徵)。因此我們需要將 32*32 的二維圖片資料轉換為一整筆一維的特徵資料。二維轉換為一維的資料，那就成為 32*32 = 1024。再加上 RGB 三種原色的資料，最後大小是：1024*3=3072。程式可以這樣寫：

eachsize=32*32*3
X_train=x_train.reshape(x_train.shape[0],eachsize)

再來看轉換後的結果：
print('x_train after reshape:', x_train.shape)

x_train after reshape: (50000, 3072)

已經從原本的 (50000, 32, 32, 3) 轉成(50000, 3072) 了！

資料展開內容：