微調YOLOv11：實用指南【詳細過程與代碼】

作者：二旺 2025-01-03 16:17:08

開發

本指南旨在引導您為自身任務微調YOLOv11。我將分享我個人認為有效的步驟，附帶詳細代碼、真實案例及實用建議。

一、引言

本指南旨在引導您為自身任務微調YOLOv11。我將分享我個人認為有效的步驟，附帶詳細代碼、真實案例及實用建議。內容包括：

如何專業地設置您的環境。
準備數據集的確切步驟（因為格式至關重要）。
關鍵配置與訓練策略，以實現最佳性能。
通過試錯積累的故障排除技巧。

二、前提條件與設置

要讓YOLOv11運行起來，您需要以下內容：

Ultralytics YOLOv11：我們將使用的框架。相信我，它的簡潔與靈活性使其成為游戲規則改變者。
Python 3.8+：雖然YOLOv11支持更新的版本，但為了兼容性，我建議使用Python 3.8或3.9。
PyTorch（1.7.0或更高版本）：YOLOv11依賴PyTorch，因此擁有正確的版本至關重要。
GPU支持：您需要一個支持CUDA的GPU。我個人使用NVIDIA GPU與CUDA 11.x，它們在訓練中表現出色。

安裝依賴項 - 安裝Ultralytics包：

pip install ultralytics

三、準備數據集

數據集格式應如下所示：

/dataset
├── images
│   ├── train
│   ├── val
├── labels
│   ├── train
│   ├── val

images文件夾中的每個圖像必須在labels文件夾中有一個對應的.txt文件。這些.txt文件應包含YOLO格式的注釋：class_id x_center y_center width height，其中值已歸一化（0到1）。以下是將注釋從COCO格式轉換為YOLO格式的Python代碼片段：

import json
import os

def convert_coco_to_yolo(coco_file, output_dir):
    with open(coco_file) as f:
        data = json.load(f)
    
    for image in data['images']:
        annotations = [ann for ann in data['annotations'] if ann['image_id'] == image['id']]
        label_file = os.path.join(output_dir, f"{image['file_name'].split('.')[0]}.txt")
        with open(label_file, 'w') as f:
            for ann in annotations:
                category_id = ann['category_id'] - 1  # YOLO classes are 0-indexed
                bbox = ann['bbox']
                x_center = (bbox[0] + bbox[2] / 2) / image['width']
                y_center = (bbox[1] + bbox[3] / 2) / image['height']
                width = bbox[2] / image['width']
                height = bbox[3] / image['height']
                f.write(f"{category_id} {x_center} {y_center} {width} {height}\n")

我在多個項目中使用過這個腳本，效果非常好。只需更新coco_file和output_dir路徑以匹配您的數據集。

1. 數據增強技術

數據增強有時比收集更多數據更能提升模型性能。多年來，我發現像Mosaic和CutMix這樣的高級技術是游戲規則改變者，尤其是對于較小的數據集。對于YOLOv11，我喜歡使用Albumentations。以下是我個人使用的增強管道示例：

import albumentations as A
from albumentations.pytorch import ToTensorV2

transform = A.Compose([
    A.RandomCrop(width=640, height=640),
    A.HorizontalFlip(p=0.5),
    A.RandomBrightnessContrast(p=0.2),
    A.HueSaturationValue(p=0.2),
    ToTensorV2()
])

通過這種方式，您不僅翻轉或裁剪圖像，還在教模型處理現實世界中可能遇到的變化。

2. 分割數據集

許多人在處理不平衡數據時，尤其是在訓練-驗證-測試分割方面遇到困難。我個人使用sklearn自動化此步驟，以確保可重復性。以下是我通常使用的Python代碼：

from sklearn.model_selection import train_test_split
import os
import shutil

def split_dataset(images_dir, labels_dir, output_dir, test_size=0.2, val_size=0.2):
    images = [f for f in os.listdir(images_dir) if f.endswith('.jpg')]
    train_images, test_images = train_test_split(images, test_size=test_size, random_state=42)
    train_images, val_images = train_test_split(train_images, test_size=val_size, random_state=42)

    for subset, subset_images in [('train', train_images), ('val', val_images), ('test', test_images)]:
        os.makedirs(f"{output_dir}/images/{subset}", exist_ok=True)
        os.makedirs(f"{output_dir}/labels/{subset}", exist_ok=True)
        for image in subset_images:
            shutil.copy(f"{images_dir}/{image}", f"{output_dir}/images/{subset}/{image}")
            label_file = image.replace('.jpg', '.txt')
            shutil.copy(f"{labels_dir}/{label_file}", f"{output_dir}/labels/{subset}/{label_file}")

運行此腳本，您的數據集將被整齊地分割為訓練集、驗證集和測試集。我一直使用這種方法，它非常可靠。

專業提示：在格式化和增強數據集后，始終可視化一些樣本。標簽或增強中的簡單錯誤可能導致模型性能不佳。像cv2.imshow或matplotlib這樣的工具可以快速輕松地完成此操作。

四、配置YOLOv11進行微調

微調YOLOv11需要精確性，這就是配置文件的作用。我了解到理解這些文件中的參數至關重要——一個被忽視的設置可能會嚴重影響性能。讓我們來看看在為您項目配置YOLOv11時真正重要的內容。

關鍵配置參數

YOLOv11使用YAML配置文件來定義數據集路徑、類別和其他關鍵設置。以下是一個簡單但有效的示例：

path: ../datasets  # Path to dataset root directory
train: images/train  # Path to training images
val: images/val  # Path to validation images
nc: 3  # Number of classes
names: ['class1', 'class2', 'class3']  # Class names

path：確保此路徑指向數據集的根文件夾。一次數據集放錯位置讓我花費了數小時調試！
nc和names：仔細檢查這些。類別數量與標簽不匹配會導致訓練失敗。
其他參數：在訓練腳本中試驗img_size、epochs和batch size等設置，因為這些不能直接在YAML文件中定義。

以下是一個額外的YAML參數，如果您使用自定義數據集，可能需要它：

test: images/test  # Optional: Test dataset path

五、訓練YOLOv11模型

訓練YOLOv11是樂趣的開始。我仍然記得第一次加載預訓練模型時，看到它僅通過幾次調整就能很好地泛化。以下是您可以開始的確切方法：

1. 加載預訓練權重

YOLOv11模型在COCO上預訓練，使其成為極好的起點。加載模型非常簡單：

from ultralytics import YOLO

model = YOLO('yolov8n.pt')  # Load YOLOv8 Nano pretrained weights

我建議從yolov11n.pt或yolov11s.pt開始進行快速實驗，尤其是如果您使用像RTX 3060這樣的標準GPU。

2. 訓練模型

一旦您的數據集和配置文件準備就緒，就可以開始訓練了。以下是一個簡單的訓練腳本：

model.train(data='custom_dataset.yaml',  # Path to YAML config
            epochs=50,                  # Number of epochs
            imgsz=640,                  # Image size
            batch=16,                   # Batch size
            device=0)                   # GPU device index

專業提示：從較少的epoch開始，并盡早評估結果。根據我的經驗，迭代比盲目進行長時間訓練更好。

3. 高級訓練參數

微調以下參數可以顯著提升性能：

學習率：YOLOv11默認使用OneCycleLR調度，但您可以通過lr0調整最大學習率。
優化器：堅持使用默認的SGD，或嘗試AdamW以獲得更平滑的收斂。
增強：YOLOv11默認應用基本增強，但您可以通過augment=True啟用高級技術。

示例：

model.train(data='custom_dataset.yaml',
            epochs=50,
            imgsz=640,
            lr0=0.01,  # Starting learning rate
            optimizer='AdamW',
            augment=True)

4. 監控訓練

以下是您可以實時監控訓練的方法：

TensorBoard：它內置于YOLOv11。只需添加project和name參數：

model.train(data='custom_dataset.yaml',
            project='YOLOv8-Experiments',
            name='run1',
            exist_ok=True)

運行tensorboard --logdir YOLOv11-Experiments以可視化損失曲線、指標等。

Weights and Biases (wandb)：如果您像我一樣喜歡詳細的實驗跟蹤，將YOLOv11連接到wandb：

pip install wandb

然后，登錄wandb并啟用跟蹤：

model.train(data='custom_dataset.yaml', 
            project='YOLOv8-Wandb', 
            name='run1',
            wandb=True)

提示：密切關注您的mAP（平均平均精度）值。訓練期間突然下降通常表明過擬合或增強問題。通過這種方法，您將為順利的訓練體驗做好準備。我個人發現，花時間調整參數和監控進度在最終結果中會帶來巨大的回報。

六、評估模型

1. 驗證模型

一旦訓練完成，評估您的微調模型就像運行.val()函數一樣簡單：

results = model.val()
print(results)

YOLOv11提供了多個指標，但您需要關注的兩個是：

mAP@0.5：IoU閾值為0.5時的平均平均精度。
mAP@0.5:0.95：跨多個IoU閾值的平均精度。

根據我的經驗，強大的mAP@0.5:0.95分數表明您的模型泛化良好。例如，在最近的一個項目中，調整增強管道使該分數提高了7%——這是一個巨大的勝利！

2. 可視化性能

數字很好，但視覺效果講述真實的故事。YOLOv11在驗證期間生成預測，使您能夠輕松發現模型表現出色（或掙扎）的地方。使用這些可視化來識別：

錯誤分類的對象。
重疊的邊界框。

生成混淆矩陣：

model.val(conf=True)

我個人總是先檢查混淆矩陣。這是快速識別模型是否混淆相似類別的簡單方法——在像COCO這樣的數據集中，對象可能在上下文上相似（例如，叉子和勺子），這是一個常見問題。

七、模型優化部署

您已經訓練了一個出色的模型，但真正的考驗在于部署。無論是減少邊緣設備的延遲還是優化移動設備，YOLOv11都有工具可以幫助。讓我分享對我有效的方法。

1. 量化

量化可以大幅減少推理時間，而不會顯著降低準確性。我曾用它將模型部署在像Raspberry Pi這樣的資源受限設備上，效果非常好。以下是如何量化您的YOLOv11模型：

model.export(format='torchscript', optimize=True)

通過optimize=True，YOLOv11在導出期間自動處理量化。

2. 剪枝

有時一個更精簡的模型就是您所需要的。我曾通過剪枝將模型大小減少50%，同時保持準確性。YOLOv11使這變得簡單：

model.prune(amount=0.5)  # Prune 50% of parameters

過于激進的剪枝可能會損害準確性。我建議從較小的百分比（例如20%）開始，并測試性能。

3. ONNX/TorchScript轉換

將模型導出為ONNX或TorchScript是部署到實際應用中的必備步驟。我曾無數次這樣做，將YOLOv11模型集成到API、移動應用，甚至NVIDIA TensorRT以用于邊緣設備。以下是將模型導出為ONNX的示例：

model.export(format='onnx')

如果您在TensorRT上部署，此ONNX導出可以是第一步。我發現它在交通監控等實時應用中非常有用。

提示：優化后始終對模型進行基準測試。像Python中的timeit或NVIDIA的TensorRT分析器這樣的工具可以幫助確保您的模型滿足部署要求。通過專注于這些步驟，您將能夠高效地部署YOLOv11模型，無論是在云平臺、移動設備還是邊緣硬件上。我個人發現，這些優化在實現低延遲、高精度的應用中起到了至關重要的作用。

責任編輯：趙寧寧來源：小白玩轉Python

YOLOv11 代碼 Python

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微調YOLOv11：實用指南 【詳細過程與代碼】