檢測路在何方？YOLOv8終極指南

作者：極市平臺 2024-01-29 09:29:02

人工智能智能汽車

文章深入探討了YOLOv8在計算機視覺領域的重要性，將其與其他類似模型在準確性方面進行比較，并討論YOLOv8 GitHub倉庫的最新變化。

本文經自動駕駛之心公眾號授權轉載，轉載請聯(lián)系出處。

YOLOv8是計算機視覺領域的最新發(fā)展，它是一種用于目標檢測、實例分割和分類的最新先進模型。除了對模型架構本身的改進之外，YOLOv8通過一個用于使用YOLO模型的PIP包為開發(fā)者提供了一個新的友好界面。

在這篇文章中，我們將深入探討YOLOv8在計算機視覺領域的重要性，將其與其他類似模型在準確性方面進行比較，并討論YOLOv8 GitHub倉庫的最新變化。

本文來源：https://blog.roboflow.com/whats-new-in-yolov8/

為適合中文閱讀習慣，閱讀更有代入感，原文翻譯后有刪改。您也可以查看原文。

1. YOLOv8是什么？

YOLOv8是最新的YOLO模型，可用于目標檢測、圖像分類和實例分割任務。YOLOv8由Ultralytics開發(fā)，該公司還創(chuàng)建了具有影響力和產業(yè)定義性的YOLOv5模型。與YOLOv5相比，YOLOv8包含許多架構和開發(fā)者體驗的改變和改進。

截至本文寫作時，YOLOv8仍在積極開發(fā)中，Ultralytics正在開發(fā)新功能并響應社區(qū)的反饋。確實，當Ultralytics發(fā)布一個模型時，它會得到長期的支持：該組織與社區(qū)合作，使模型達到最佳狀態(tài)。

2. YOLO是如何發(fā)展成為YOLOv8的？

YOLO（You Only Look Once）系列模型在計算機視覺領域變得非常有名。YOLO之所以著名，是因為它在保持小型模型尺寸的同時具有相當高的準確性。YOLO模型可以在單個GPU上進行訓練，這使其適用于廣泛的開發(fā)者。機器學習從業(yè)者可以在邊緣硬件或云中以低成本部署它。

自2015年Joseph Redmond首次發(fā)布以來，YOLO一直受到計算機視覺社區(qū)的關注。在早期版本（版本1-4）中，YOLO是在Redmond編寫的稱為Darknet的自定義深度學習框架中以C代碼維護的。

YOLOv8作者Glenn Jocher在Ultralytics工作，他在PyTorch（來自Facebook的深度學習框架）中追隨了YOLOv3倉庫。隨著影子倉庫中訓練的改進，Ultralytics最終推出了自己的模型：YOLOv5。

由于其靈活的Pythonic結構，YOLOv5迅速成為世界上最先進的倉庫。這種結構允許社區(qū)發(fā)明新的建模改進，并迅速通過具有類似PyTorch方法的存儲庫分享它們。

除了強大的模型基礎之外，YOLOv5的維護人員一直致力于支持模型周圍的健康軟件生態(tài)系統(tǒng)。隨著社區(qū)的需求，他們積極修復問題并推動存儲庫的能力。

在過去的兩年里，各種模型從YOLOv5 PyTorch存儲庫分支出來，包括Scaled-YOLOv4、YOLOR和YOLOv7。其他模型也在世界各地以其基于PyTorch的實現(xiàn)而涌現(xiàn)，如YOLOX和YOLOv6。在這過程中，每個YOLO模型都帶來了新的SOTA技術，不斷推動模型的準確性和效率。

在過去的六個月中，Ultralytics一直在研究YOLO的最新SOTA版本，即YOLOv8。YOLOv8于2023年1月10日發(fā)布。

3. 我為什么要使用YOLOv8？

以下是考慮在下一個計算機視覺項目中使用YOLOv8的幾個主要原因：

YOLOv8在Microsoft COCO和Roboflow 100上測得的準確性很高。
YOLOv8帶有許多開發(fā)者便利功能，從易于使用的CLI到良好結構化的Python包。
YOLO周圍有一個龐大的社區(qū)，YOLOv8模型周圍的社區(qū)也在不斷增長，這意味著計算機視覺領域的許多人可能在你需要指導時提供幫助。

YOLOv8在COCO上取得了強大的準確性。例如，YOLOv8m模型（中型模型）在COCO上測得50.2%的mAP。在Roboflow 100上進行評估時，這是一個專門評估模型在各種特定任務領域的性能的數(shù)據(jù)集，YOLOv8比YOLOv5得分要好得多。本文后面提供了更多關于此的性能分析信息。

此外，YOLOv8中的開發(fā)者便利功能也很顯著。與其他模型不同，其中任務分散在許多不同的Python文件中，您可以執(zhí)行這些文件，YOLOv8提供了一個CLI，使模型訓練更加直觀。除此之外，它還提供了一個Python包，提供比先前模型更無縫的編碼體驗。

在考慮使用模型時，YOLO周圍的社區(qū)是引人注目的。許多計算機視覺專家了解YOLO及其工作原理，有很多關于實際使用YOLO的在線指導。盡管YOLOv8在本文撰寫時是新的，但已有許多在線指南可供參考。

以下是我們自己的學習資源，可幫助您深入了解YOLO：

如何使用YOLOv8檢測對象
如何在視頻上運行YOLOv8檢測
YOLOv8模型概述（在Roboflow Models上）
如何在自定義數(shù)據(jù)集上訓練YOLOv8模型
如何將YOLOv8模型部署到Raspberry Pi
用于訓練YOLOv8目標檢測模型的Google Colab筆記本
用于訓練YOLOv8分類模型的Google Colab筆記本
用于訓練YOLOv8分割模型的Google Colab筆記本
使用YOLOv8和ByteTRACK跟蹤和計數(shù)車輛

讓我們深入探討YOLOv8的架構，以及它與先前YOLO模型的不同之處。

4. YOLOv8架構：深入解析

目前尚無YOLOv8的發(fā)表論文，因此我們缺乏對其創(chuàng)建過程中的研究方法和削減研究的直接了解。盡管如此，我們分析了存儲庫和有關該模型的信息，開始記錄YOLOv8中的新特性。

如果你希望自行查看代碼，請查看YOLOv8存儲庫，并查看此代碼差異以了解一些研究是如何進行的。

這里我們提供了對影響深遠的建模更新的快速摘要，然后我們將看一下模型的評估，這些評估已經說明了問題。

由GitHub用戶RangeKing制作的以下圖片顯示了網絡架構的詳細可視化。

YOLOv8 架構，GitHub 用戶 RangeKing 制作的可視化作品

4.1 無錨檢測

YOLOv8是一種無錨模型。這意味著它直接預測對象的中心，而不是相對于已知錨框的偏移量。

在YOLO中錨框的可視化

錨框曾經是早期YOLO模型中棘手的一部分，因為它們可能代表目標基準框的分布，但不代表自定義數(shù)據(jù)集的分布。

YOLOv5的檢測頭

無錨檢測減少了框預測的數(shù)量，從而加速了非最大抑制（NMS, Non-Maximum Suppression），這是一種復雜的后處理步驟，用于在推理后篩選候選檢測。

YOLOv8的檢測頭

4.1 新的卷積

干部的第一個6x6卷積被3x3卷積替代，主要的構建塊發(fā)生了變化，C2f替代了C3。該模塊在下圖中進行了總結，其中“f”是特征數(shù)，“e”是擴展率，CBS是由Conv、BatchNorm和SiLU組成的塊。

在C2f中，來自Bottleneck（這是兩個帶有殘差連接的3x3卷積的花哨名稱）的所有輸出都被串聯(lián)在一起。而在C3中，僅使用了最后一個Bottleneck的輸出。

新的YOLOv8 C2f模塊

Bottleneck與YOLOv5中的相同，但第一個卷積的核大小從1x1更改為3x3。從這些信息中，我們可以看到YOLOv8開始恢復到2015年定義的ResNet塊。

在neck中，特征直接串聯(lián)而不強制要求相同的通道維度。這減少了參數(shù)數(shù)量和張量的總體大小。

4.2 結束鑲嵌增強

深度學習研究往往側重于模型架構，但YOLOv5和YOLOv8的訓練過程是它們成功的重要組成部分。

YOLOv8在在線訓練期間對圖像進行增強。在每個時代，模型看到了提供的圖像的稍微不同的變化。

其中一種增強稱為鑲嵌增強。這涉及將四個圖像拼接在一起，迫使模型學習在新位置、部分遮擋和不同周圍像素的對象。

棋盤照片的馬賽克增強然而，經驗表明，如果在整個訓練過程中執(zhí)行此增強，性能會下降。因此，在最后十個訓練時代中關閉它是有益的。

這種變化是YOLO建模在YOLOv5存儲庫和YOLOv8研究中隨著時間的推移所受到的慎重關注的典范。

5. YOLOv8準確性改進

YOLOv8的研究主要受到對COCO基準的經驗性評估的推動。隨著網絡和訓練例程的每個部分的微調，運行新實驗以驗證這些變化對COCO建模的影響。

5.1 YOLOv8 COCO準確性

COCO（上下文中的常見對象）是評估目標檢測模型的行業(yè)標準基準。在COCO上比較模型時，我們看的是mAP值和推理速度的FPS測量。模型應在相似的推理速度下進行比較。

下圖顯示了使用Ultralytics團隊收集并在YOLOv8 README中發(fā)布的數(shù)據(jù)，YOLOv8在COCO上的準確性：

YOLOv8 COCO評測

截至本文寫作時，YOLOv8在COCO上的準確性在相似的推理延遲條件下是最先進的。

5.2 RF100準確性

在Roboflow，我們從Roboflow Universe中抽取了100個樣本數(shù)據(jù)集，這是一個擁有超過100,000個數(shù)據(jù)集的存儲庫，用于評估模型對新領域的泛化能力。我們的基準由Intel的支持下開發(fā)，是為計算機視覺從業(yè)者設計的基準，旨在更好地回答問題：“這個模型在我的自定義數(shù)據(jù)集上表現(xiàn)如何？”

我們在我們的RF100基準上評估了YOLOv8，與YOLOv5和YOLOv7一起，下圖顯示了每個模型的mAP@.50的箱線圖。

我們對每個模型的小版本進行了100個時代的運行，我們使用單個種子運行了一次，因此由于梯度抽簽，請以謹慎的態(tài)度對待這個結果。

下圖的箱線圖告訴我們YOLOv8的異常值較少，而在Roboflow 100基準上的mAP總體上更好。

YOLO 相對于 RF100 的 mAP@.50

下面的條形圖顯示了每個RF100類別的平均mAP@.50。同樣，YOLOv8勝過所有先前的模型。

YOLO 相對于 RF100 類別的平均 mAP@.50

與YOLOv5評估相比，YOLOv8模型在每個數(shù)據(jù)集上產生了類似的結果，或者顯著改善了結果。

6. YOLOv8存儲庫和PIP包

YOLOv8代碼存儲庫旨在成為社區(qū)使用和迭代模型的地方。由于我們知道該模型將持續(xù)改進，我們可以將初始YOLOv8模型結果作為基線，并期待隨著發(fā)布新的迷你版本而進行的未來改進。

我們希望的最好結果是研究人員開始在Ultralytics存儲庫的基礎上開發(fā)他們的網絡。在YOLOv5的分支中一直在進行研究，但如果在一個地方制作模型并最終合并到主線中，將會更好。

6.1 YOLOv8存儲庫布局

YOLOv8模型使用與YOLOv5類似的代碼，其中分類、實例分割和目標檢測任務類型的支持采用相同的代碼例程。

模型仍然使用相同的YOLOv5 YAML格式初始化，并且數(shù)據(jù)集格式也保持不變。

6.2 YOLOv8 CLI

Ultralytics軟件包配備了一個CLI。這對許多YOLOv5用戶來說是熟悉的，因為核心訓練、檢測和導出交互也是通過CLI完成的。

yolo task=detect mode=val model={HOME}/runs/detect/train/weights/best.pt data={dataset.location}/data.yaml

你可以在task中傳遞 [detect, classify, segment]，在mode中傳遞 [train, predict, val, export]，模型可以是未初始化的.yaml文件，也可以是先前訓練過的.pt文件。

6.3 YOLOv8 Python包

除了可用的CLI工具外，YOLOv8現(xiàn)在還作為一個PIP包進行分發(fā)。這使得本地開發(fā)稍顯困難，但解鎖了將YOLOv8融入你的Python代碼的所有可能性。

from ultralytics import YOLO  
  
# 加載模型  
model = YOLO("yolov8n.yaml")  # 從頭開始構建一個新模型  
model = YOLO("yolov8n.pt")  # 加載預訓練模型（推薦用于訓練）  
  
# 使用模型  
results = model.train(data="coco128.yaml", epochs=3)  # 訓練模型  
results = model.val()  # 評估模型在驗證集上的性能  
results = model("https://ultralytics.com/images/bus.jpg")  # 對圖像進行預測  
success = YOLO("yolov8n.pt").export(format="onnx")  # 將模型導出為ONNX格式

7. YOLOv8注釋格式

YOLOv8使用YOLOv5 PyTorch TXT注釋格式，這是Darknet注釋格式的修改版本。

查看Roboflow Convert工具，了解如何轉換數(shù)據(jù)以在新的YOLOv8模型中使用。
https://roboflow.com/formats/yolov8-pytorch-txt?ref=blog.roboflow.com

8. YOLOv8標注工具

YOLOv8的創(chuàng)建者和維護者Ultralytics已經與Roboflow合作，成為YOLOv8項目中建議的標注和導出工具。使用Roboflow，我們可以為YOLOv8支持的所有任務（目標檢測、分類和分割）標注數(shù)據(jù)，并導出數(shù)據(jù)以便在YOLOv8 CLI或Python包中使用。

9. 開始使用YOLOv8

要開始將YOLOv8應用于我們自己的用例，請查看我們關于如何在自定義數(shù)據(jù)集上訓練YOLOv8的指南。

要了解其他人如何使用YOLOv8，請在Roboflow Universe上瀏覽其他YOLOv8模型、數(shù)據(jù)集和靈感。

對于將模型投入生產并使用主動學習策略不斷更新模型的從業(yè)者，我們添加了一個路徑，可以部署YOLOv8模型，將其用于我們的推理引擎，并用于數(shù)據(jù)集的標簽輔助。或者，可以使用Roboflow Inference在設備上部署YOLOv8，這是一個開源推理服務器。

責任編輯：張燕妮來源：自動駕駛之心

計算機視覺模型

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看