# 建築圖面物件偵測 × YOLO 影像辨識的實務實驗紀錄 # 小圖訓練與大圖預測
圖層化分類物件—以門窗圖為例
在 YOLO如何應用於建築圖自動化?AI物件偵測的可行性與挑戰 這篇文章中有提到:
當一張建築圖紙中同時存在多種比例、尺度、線條等相互交疊的圖樣時,會導致AI 模型難以準確區分各類物件,但若透過圖層化分類訓練或許是一個解方。
今天本篇文章選用較為常見的建築元素—門窗,來作建築圖面物件偵測實驗的案例。
實驗結果觀察
遷移學習預測結果
門窗元素在建築中,呈現方式可以分為平面圖例與外觀立面兩種。今天想實測:
YOLO是否能在建築立面圖中,正確的找出門窗在圖面中的所在位置呢?
因此資料集皆採建築立面圖進行標註與訓練,並先以官方的預訓練模型進行遷移學習(Transfer learning),預測結果如下:


從上面初步的實測可以發現,經過遷移學習後的模型,模型在局部圖紙的門窗圖例預測已經具有一定的辨識能力。
接下來希望進一步確認:
資料集尺度對於結果的影響
門窗圖例的細緻程度與資料集尺度,是否會影響模型在完整建築圖中的預測效果?
因此,在後續實驗中,對資料集進行不同方式的前處理,將原始圖面以三種策略建立資料集。此方式除了可比較不同資料處理方法對模型表現的影響外,也能同時擴增資料量,降低建築圖面資料蒐集不易所帶來的限制。
- 網格切割(Grid)
將整張圖面依固定區塊切割。 - ROI 切割(Region of Interest)
以門窗圖例為中心擷取局部區域。 - 混合資料集
同時包含網格切割與 ROI 切割的圖像。



實驗結果顯示,如果資料集中過度集中於 ROI 小圖,模型雖然在局部物件辨識上表現良好,但在完整圖面的預測時,反而容易出現誤判或遺漏。相較之下,保留一定比例的整體圖面資訊(例如網格切割所保留的背景與線條干擾),模型在大圖預測時表現更為穩定。
這顯示在建築圖辨識任務中,資料集並不只需要「乾淨的物件圖例」,適度保留圖面的背景與干擾訊息,反而有助於模型理解實際圖面的結構環境。
延伸閱讀
若你也是非本科背景,想系統性了解 YOLO 從 0 建立環境、準備資料集到實際應用的流程,可以參考我整理的基礎流程教學課程: (本課程為流程教學導向,並非本系列實驗文章之方法或結果重現。)
👉 課程連結(PressPlay Acadmey):【線上課程】零基礎一次搞懂! 用YOLO打造自己的 AI 辨識工具