成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

有了這個(gè)工具,不執(zhí)行代碼就可以找PyTorch模型錯(cuò)誤

新聞 前端
近日,來自韓國首爾大學(xué)的研究者們提出了另一種靜態(tài)分析器 PyTea,它可以自動檢測 PyTorch 項(xiàng)目中的張量形狀錯(cuò)誤。

  [[441832]]

幾秒鐘掃完代碼,比訓(xùn)練一遍再找快多了。

張量形狀不匹配是深度神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)過程中會出現(xiàn)的重要錯(cuò)誤之一。由于神經(jīng)網(wǎng)絡(luò)訓(xùn)練成本較高且耗時(shí),在執(zhí)行代碼之前運(yùn)行靜態(tài)分析,要比執(zhí)行然后發(fā)現(xiàn)錯(cuò)誤快上很多。

由于靜態(tài)分析是在不運(yùn)行代碼的前提下進(jìn)行的,因此可以幫助軟件開發(fā)人員、質(zhì)量保證人員查找代碼中存在的結(jié)構(gòu)性錯(cuò)誤、安全漏洞等問題,從而保證軟件的整體質(zhì)量。

相比于程序動態(tài)分析,靜態(tài)分析具有不實(shí)際執(zhí)行程序;執(zhí)行速度快、效率高等特點(diǎn)而廣受研究者青睞,目前,已有許多分析工具可供研究使用,如斯坦福大學(xué)開發(fā)的 Meta-Compilation(Coverity)、利物浦大學(xué)開發(fā)的 LDRA Testbed 等。

近日,來自韓國首爾大學(xué)的研究者們提出了另一種靜態(tài)分析器 PyTea,它可以自動檢測 PyTorch 項(xiàng)目中的張量形狀錯(cuò)誤。在對包括 PyTorch 存儲庫中的項(xiàng)目以及 StackOverflow 中存在的張量錯(cuò)誤代碼進(jìn)行測試。結(jié)果表明,PyTea 可以成功的檢測到這些代碼中的張量形狀錯(cuò)誤,幾秒鐘就能完成。

有了這個(gè)工具,不執(zhí)行代碼就可以找PyTorch模型錯(cuò)誤
  • 論文地址:https://arxiv.org/pdf/2112.09037.pdf
  • 項(xiàng)目地址:https://github.com/ropas/pytea

幾秒就能查找張量形狀錯(cuò)誤的 PyTea

PyTea 工具可以靜態(tài)地掃描 PyTorch 程序并檢測可能的形狀錯(cuò)誤。PyTea 通過額外的數(shù)據(jù)處理和一些庫(例如 Torchvision、NumPy、PIL)的混合使用來分析真實(shí)世界 Python/PyTorch 應(yīng)用程序的完整訓(xùn)練和評估路徑。

PyTea 的工作原理是這樣的:給定輸入的 PyTorch 源,PyTea 靜態(tài)跟蹤每個(gè)可能的執(zhí)行路徑,收集路徑張量操作序列所需的張量形狀約束,并決定約束滿足與否(因此可能發(fā)生形狀錯(cuò)誤)。

具體來說:如下圖所示, PyTea 首先將原始 Python 代碼翻譯成一種內(nèi)核語言,即 PyTea 內(nèi)部表示(PyTea IR)。然后,它跟蹤轉(zhuǎn)換后的 IR 的每個(gè)可能執(zhí)行路徑,并收集有關(guān)張量形狀的約束,這些約束規(guī)定了代碼在沒有形狀錯(cuò)誤的情況下運(yùn)行的條件。 PyTea 將收集到的約束集提供給 SMT(Satisfiability Modulo Theories)求解器 Z3,以判斷這些約束對于每個(gè)可能的輸入形狀都是可滿足的。根據(jù)求解器的結(jié)果,PyTea 會得出結(jié)論,哪條路徑包含形狀錯(cuò)誤。如果 Z3 的約束求解花費(fèi)太多時(shí)間,PyTea 會停止并發(fā)出「don’t know」提示。

有了這個(gè)工具,不執(zhí)行代碼就可以找PyTorch模型錯(cuò)誤

PyTea 的整體結(jié)構(gòu)。

PyTea 由兩個(gè)分析器組成,在線分析器:node.js (TypeScript / JavaScript);離線分析器:Z3 / Python。

  • 在線分析器:查找基于數(shù)值范圍的形狀不匹配和 API 參數(shù)的濫用。如果 PyTea 在分析代碼時(shí)發(fā)現(xiàn)任何錯(cuò)誤,它將停在該位置并將錯(cuò)誤和違反約束通知用戶;
  • 離線分析器:生成的約束傳遞給 Z3 。Z3 將求解每個(gè)路徑的約束集并打印第一個(gè)違反的約束(如果存在)。

我們先來看下結(jié)果展示,在線分析器發(fā)現(xiàn)錯(cuò)誤:

有了這個(gè)工具,不執(zhí)行代碼就可以找PyTorch模型錯(cuò)誤

離線分析器發(fā)現(xiàn)錯(cuò)誤:

有了這個(gè)工具,不執(zhí)行代碼就可以找PyTorch模型錯(cuò)誤

為了更好的理解 PyTea 執(zhí)行靜態(tài)分析過程,下面我們介紹一下主要的技術(shù)細(xì)節(jié),包括 PyTorch 程序結(jié)構(gòu)、張量形狀錯(cuò)誤、PyTea IR 等,以便讀者更好的理解執(zhí)行過程。

首先是 PyTorch 程序結(jié)構(gòu),PyTorch、TensorFlow 和 Keras 等現(xiàn)代機(jī)器學(xué)習(xí)框架需要使用 Python API 來構(gòu)建神經(jīng)網(wǎng)絡(luò)。使用此類框架訓(xùn)練神經(jīng)網(wǎng)絡(luò)大多遵循如下四個(gè)階段的標(biāo)準(zhǔn)程序。

有了這個(gè)工具,不執(zhí)行代碼就可以找PyTorch模型錯(cuò)誤

在 PyTorch 中,常規(guī)神經(jīng)網(wǎng)絡(luò)訓(xùn)練代碼的結(jié)構(gòu)。

訓(xùn)練模型需要先定義網(wǎng)絡(luò)結(jié)構(gòu),圖 2 為一個(gè)簡化的圖像分類代碼,取自官方的 PyTorch MNIST 分類示例:

有了這個(gè)工具,不執(zhí)行代碼就可以找PyTorch模型錯(cuò)誤

在這里,上述代碼首先定義一系列神經(jīng)網(wǎng)絡(luò)層,并使它們成為單一的神經(jīng)網(wǎng)絡(luò)模塊。為了正確組裝層,前一層的返回張量必須滿足下一層的輸入要求。網(wǎng)絡(luò)使用超參數(shù)的初始化參數(shù)進(jìn)行實(shí)例化,例如隱藏層的數(shù)量。接下來,對輸入數(shù)據(jù)集進(jìn)行預(yù)處理并根據(jù)網(wǎng)絡(luò)的要求進(jìn)行調(diào)整。從該階段開始,每個(gè)數(shù)據(jù)集都被切成較小的相同大小的塊(minibatch)。最后,主循環(huán)開始,minibatch 按順序輸入網(wǎng)絡(luò)。一個(gè) epoch 是指將整個(gè)數(shù)據(jù)集傳遞到網(wǎng)絡(luò)的單個(gè)循環(huán),并且 epoch 的數(shù)量通常取決于神經(jīng)網(wǎng)絡(luò)的目的和結(jié)構(gòu)。除了取決于數(shù)據(jù)集大小的主訓(xùn)練循環(huán)之外,包括 epoch 數(shù)在內(nèi),訓(xùn)練代碼中的迭代次數(shù)在大多數(shù)情況下被確定為常數(shù)。

在構(gòu)建模型時(shí),網(wǎng)絡(luò)層之間輸入、輸出張量形狀的不對應(yīng)就是張量形狀錯(cuò)誤。通常形狀錯(cuò)誤很難手動查找,只能通過使用實(shí)際輸入運(yùn)行程序來檢測。下圖就是典型的張量形狀錯(cuò)誤(對圖 2 的簡單修改),如果不仔細(xì)查看,你根本發(fā)現(xiàn)不了錯(cuò)誤:

有了這個(gè)工具,不執(zhí)行代碼就可以找PyTorch模型錯(cuò)誤

對于張量形狀錯(cuò)誤(如上圖的錯(cuò)誤類型),PyTea 將原始 Python 代碼翻譯成 PyTea IR 進(jìn)行查找,如下圖是 PyTea IR 示例:

有了這個(gè)工具,不執(zhí)行代碼就可以找PyTorch模型錯(cuò)誤

上面提到,PyTea 會跟蹤轉(zhuǎn)換后的 IR 的每個(gè)可能執(zhí)行路徑,并收集有關(guān)張量形狀約束。其實(shí)約束是 PyTorch 應(yīng)用程序所需要的條件,以便在沒有任何張量形狀誤差的情況下執(zhí)行它。例如,一個(gè)矩陣乘法運(yùn)算的兩個(gè)操作數(shù)必須共享相同的維數(shù)。下圖顯示了約束的抽象語法:

有了這個(gè)工具,不執(zhí)行代碼就可以找PyTorch模型錯(cuò)誤

約束的抽象語法部分截圖

如何使用 PyTea

首先,安裝環(huán)境要求:node.js >= 12.x,python >= 3.8,z3-solver >= 4.8。

安裝和使用可參考以下代碼:

  1. # install node.js 
  2. sudo apt-get install nodejs 
  3. # install python z3-solver 
  4. pip install z3-solver 
  5. # download pytea 
  6. wget https://github.com/ropas/pytea/releases/download/v0.1.0/pytea.zip 
  7. unzip pytea.zip 
  8. # run pytea 
  9. python bin/pytea.py path/to/source.py 
  10. # run example file 
  11. python bin/pytea.py packages/pytea/pytest/basics/scratch.py 

編譯代碼:

  1. # install dependencies 
  2. npm run install:all 
  3. pip install z3-solver 
  4. # build 
  5. npm run build 

網(wǎng)友紛紛表示:這個(gè)工具絕對是必要的!

有了這個(gè)工具,不執(zhí)行代碼就可以找PyTorch模型錯(cuò)誤
 

 

 

責(zé)任編輯:張燕妮 來源: 機(jī)器之心Pro
相關(guān)推薦

2024-01-07 16:56:59

Python人工智能神經(jīng)網(wǎng)絡(luò)

2015-07-10 11:18:19

2020-11-19 08:00:03

打工人離職工作

2021-02-23 12:30:21

VS CodeGithub代碼

2009-03-17 08:46:57

Windows 7微軟發(fā)布

2020-03-08 13:52:58

編碼應(yīng)用程序開發(fā)

2023-03-26 01:00:48

模型編程語言

2021-02-23 07:01:24

js小游戲技術(shù)

2022-10-17 07:16:08

SQL機(jī)器學(xué)習(xí)AI

2020-10-06 19:02:11

代碼機(jī)器學(xué)習(xí)igel

2009-07-09 15:43:26

2018-07-19 06:07:22

物聯(lián)網(wǎng)安全物聯(lián)網(wǎng)IOT

2020-03-27 12:12:02

CarKeyiPhone汽車鑰匙

2021-04-13 10:20:13

Edge Canary瀏覽器微軟

2022-07-14 10:54:15

Python代碼Matplotlib

2022-07-06 08:32:35

Python代碼Matplotlib

2017-02-13 09:33:32

2022-02-28 17:57:44

云遷移云計(jì)算

2022-02-28 22:58:04

云遷移IT開發(fā)

2018-11-27 09:21:41

負(fù)載均衡機(jī)器Session
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产欧美一级二级三级在线视频 | 精品伦精品一区二区三区视频 | 一级黄色录像片子 | 国产精品久久久久久久久久免费看 | 色免费在线视频 | 91伊人| 日韩人体视频 | 爱草视频 | 二区中文 | 91精品国产综合久久久密闭 | 国产精品免费大片 | 国产成人精品一区 | 中文字幕高清在线 | 国产一级视屏 | 欧美片网站免费 | 久久夜视频 | 青青久在线视频 | 国产成人精品久久二区二区91 | 国产日韩免费观看 | 亚洲综合视频 | 色综合色综合色综合 | 精品一区二区三区在线观看国产 | 欧美久久影院 | 特级丰满少妇一级aaaa爱毛片 | 精品日韩一区 | 亚洲人成人网 | 亚洲欧美激情网 | 激情在线视频网站 | 国产精品123区 | 韩日免费视频 | 伊色综合久久之综合久久 | 成人av高清在线观看 | 天天插日日操 | 中文二区 | 久久天堂网 | 日韩欧美一区二区在线播放 | 久国产| 国产精品日本一区二区不卡视频 | 久久久久一区二区三区 | 日韩一区中文字幕 | 国产精品久久久乱弄 |