2.4 圖片資料夾載入
影像分類最常見的資料格式,是用資料夾名稱代表類別。本篇示範如何使用 tf.keras.utils.image_dataset_from_directory 從資料夾建立 train/validation dataset。
1. 學習目標
這篇處理的是自己的圖片資料集如何載入 TensorFlow。只要資料夾結構清楚,Keras 可以自動讀取圖片、建立 label 並輸出 tf.data.Dataset。
2. 建議資料夾格式
資料夾名稱會成為類別名稱。
3. 載入時要設定什麼?
常見參數包含 image_size、batch_size、validation_split、subset、seed 與 label_mode。若要可重現,train/validation 必須使用相同 seed。
4. 實作流程
Notebook 會先建立一個小型示範圖片資料夾,分成 vertical 與 horizontal 兩個類別,再用 image_dataset_from_directory 載入。最後接一個簡單 CNN,不是為了追求影像模型表現,而是確認資料夾、label、batch shape 與訓練流程都能接起來。
5. 如何套用自己的資料?
把 DATASET_DIR 改成自己的圖片根目錄,確認每個子資料夾是一個類別,再依照任務調整圖片大小與 batch size。若類別資料夾數量很多,建議先印出 class_names 並抽幾個 batch 檢查圖片與 label 是否對得上。
6. 小結
image_dataset_from_directory 是影像 cookbook 的基礎入口。當圖片已依類別放好資料夾時,它能快速建立標準 TensorFlow 資料管線。