YOLO 建築圖面實驗筆記｜05：門窗圖例偵測與資料集尺度

2026-03-12

# 建築圖面物件偵測 × YOLO 影像辨識的實務實驗紀錄 # 小圖訓練與大圖預測

圖層化分類物件—以門窗圖為例

當一張建築圖紙中同時存在多種比例、尺度、線條等相互交疊的圖樣時，會導致AI 模型難以準確區分各類物件，但若透過圖層化分類訓練或許是一個解方。

今天本篇文章選用較為常見的建築元素—門窗，來作建築圖面物件偵測實驗的案例。

門窗元素在建築中，呈現方式可以分為平面圖例與外觀立面兩種。今天想實測：

YOLO是否能在建築立面圖中，正確的找出門窗在圖面中的所在位置呢？

因此資料集皆採建築立面圖進行標註與訓練，並先以官方的預訓練模型進行遷移學習(Transfer learning)，預測結果如下：

從上面初步的實測可以發現，經過遷移學習後的模型，模型在局部圖紙的門窗圖例預測已經具有一定的辨識能力。
接下來希望進一步確認：

門窗圖例的細緻程度與資料集尺度，是否會影響模型在完整建築圖中的預測效果？

因此，在後續實驗中，對資料集進行不同方式的前處理，將原始圖面以三種策略建立資料集。此方式除了可比較不同資料處理方法對模型表現的影響外，也能同時擴增資料量，降低建築圖面資料蒐集不易所帶來的限制。

實驗結果顯示，如果資料集中過度集中於 ROI 小圖，模型雖然在局部物件辨識上表現良好，但在完整圖面的預測時，反而容易出現誤判或遺漏。相較之下，保留一定比例的整體圖面資訊（例如網格切割所保留的背景與線條干擾），模型在大圖預測時表現更為穩定。

這顯示在建築圖辨識任務中，資料集並不只需要「乾淨的物件圖例」，適度保留圖面的背景與干擾訊息，反而有助於模型理解實際圖面的結構環境。