Home AI在建築中的應用 YOLO 建築圖面實驗筆記|05:門窗圖例偵測與資料集尺度

YOLO 建築圖面實驗筆記|05:門窗圖例偵測與資料集尺度

# 建築圖面物件偵測 × YOLO 影像辨識的實務實驗紀錄 # 小圖訓練與大圖預測

圖層化分類物件—以門窗圖為例

YOLO如何應用於建築圖自動化?AI物件偵測的可行性與挑戰 這篇文章中有提到:

當一張建築圖紙中同時存在多種比例、尺度、線條等相互交疊的圖樣時,會導致AI 模型難以準確區分各類物件,但若透過圖層化分類訓練或許是一個解方。

今天本篇文章選用較為常見的建築元素—門窗,來作建築圖面物件偵測實驗的案例。

實驗結果觀察

遷移學習預測結果

門窗元素在建築中,呈現方式可以分為平面圖例與外觀立面兩種。今天想實測:

YOLO是否能在建築立面圖中,正確的找出門窗在圖面中的所在位置呢?

因此資料集皆採建築立面圖進行標註與訓練,並先以官方的預訓練模型進行遷移學習(Transfer learning),預測結果如下:

遷移學習訓練過程快照
初步訓練後模型之預測輸出結果

從上面初步的實測可以發現,經過遷移學習後的模型,模型在局部圖紙的門窗圖例預測已經具有一定的辨識能力。
接下來希望進一步確認:

資料集尺度對於結果的影響

門窗圖例的細緻程度與資料集尺度,是否會影響模型在完整建築圖中的預測效果?

因此,在後續實驗中,對資料集進行不同方式的前處理,將原始圖面以三種策略建立資料集。此方式除了可比較不同資料處理方法對模型表現的影響外,也能同時擴增資料量,降低建築圖面資料蒐集不易所帶來的限制。

  1. 網格切割(Grid)
    將整張圖面依固定區塊切割。
  2. ROI 切割(Region of Interest)
    以門窗圖例為中心擷取局部區域。
  3. 混合資料集
    同時包含網格切割與 ROI 切割的圖像。
ROI 局部物件辨識良好
ROI 整體物件辨識不良
保留一定整體資訊的模型效果較佳

實驗結果顯示,如果資料集中過度集中於 ROI 小圖,模型雖然在局部物件辨識上表現良好,但在完整圖面的預測時,反而容易出現誤判或遺漏。相較之下,保留一定比例的整體圖面資訊(例如網格切割所保留的背景與線條干擾),模型在大圖預測時表現更為穩定。

這顯示在建築圖辨識任務中,資料集並不只需要「乾淨的物件圖例」,適度保留圖面的背景與干擾訊息,反而有助於模型理解實際圖面的結構環境。

延伸閱讀

若你也是非本科背景,想系統性了解 YOLO 從 0 建立環境、準備資料集到實際應用的流程,可以參考我整理的基礎流程教學課程: (本課程為流程教學導向,並非本系列實驗文章之方法或結果重現。)

👉 課程連結(PressPlay Acadmey):【線上課程】零基礎一次搞懂! 用YOLO打造自己的 AI 辨識工具

You may also like