成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何使用GNU Parallel提高Linux命令行執行效率

系統 Linux
GNU Parallel 是一個 shell 工具,可以并行執行任務。它可以解析多種輸入,讓你可以同時在多份數據上運行腳本或命令。你終于可以使用全部的 CPU 了!

[[232002]]

將您的計算機變成一個多任務的動力室。

你是否有過這種感覺,你的主機運行速度沒有預期的那么快?我也曾經有過這種感覺,直到我發現了 GNU Parallel。

GNU Parallel 是一個 shell 工具,可以并行執行任務。它可以解析多種輸入,讓你可以同時在多份數據上運行腳本或命令。你終于可以使用全部的 CPU 了!

如果你用過 xargs,上手 Parallel 幾乎沒有難度。如果沒有用過,這篇教程會告訴你如何使用,同時給出一些其它的用例。 

安裝 GNU Parallel

GNU Parallel 很可能沒有預裝在你的 Linux 或 BSD 主機上,你可以從軟件源中安裝。以 Fedora 為例:

  1. $ sudo dnf install parallel

對于 NetBSD:

  1. # pkg_add parallel

如果各種方式都不成功,請參考項目主頁。 

從串行到并行

正如其名稱所示,Parallel 的強大之處是以并行方式執行任務;而我們中不少人平時仍然以串行方式運行任務。

當你對多個對象執行某個命令時,你實際上創建了一個任務隊列。一部分對象可以被命令處理,剩余的對象需要等待,直到命令處理它們。這種方式是低效的。只要數據夠多,總會形成任務隊列;但與其只使用一個任務隊列,為何不使用多個更小規模的任務隊列呢?

假設你有一個圖片目錄,你希望將目錄中的圖片從 JEEG 格式轉換為 PNG 格式。有多種方法可以完成這個任務。可以手動用 GIMP 打開每個圖片,輸出成新格式,但這基本是最差的選擇,費時費力。

上述方法有一個漂亮且簡潔的變種,即基于 shell 的方案:

  1. $ convert 001.jpeg 001.png
  2. $ convert 002.jpeg 002.png
  3. $ convert 003.jpeg 003.png
  4. ... ...

對于初學者而言,這是一個不小的轉變,而且看起來是個不小的改進。不再需要圖像界面和不斷的鼠標點擊,但仍然是費力的。

進一步改進:

  1. $ for i in *jpeg; do convert $i $i.png ; done

至少,這一步設置好任務執行,讓你節省時間去做更有價值的事情。但問題來了,這仍然是串行操作;一張圖片轉換完成后,隊列中的下一張進行轉換,依此類推直到全部完成。

使用 Parallel:

  1. $ find . -name "*jpeg" | parallel -I% --max-args 1 convert % %.png

這是兩條命令的組合:find 命令,用于收集需要操作的對象;parallel 命令,用于對象排序并確保每個對象按需處理。

  • find . -name "*jpeg" 查找當前目錄下以 jpeg 結尾的所有文件。
  • parallel 調用 GNU Parallel。
  • -I% 創建了一個占位符 %,代表 find 傳遞給 Parallel 的內容。如果不使用占位符,你需要對 find 命令的每一個結果手動編寫一個命令,而這恰恰是你想要避免的。
  • --max-args 1 給出 Parallel 從隊列獲取新對象的速率限制。考慮到 Parallel 運行的命令只需要一個文件輸入,這里將速率限制設置為 1。假如你需要執行更復雜的命令,需要兩個文件輸入(例如 cat 001.txt 002.txt > new.txt),你需要將速率限制設置為 2。
  • convert % %.png 是你希望 Parallel 執行的命令。

組合命令的執行效果如下:find 命令收集所有相關的文件信息并傳遞給 parallel,后者(使用當前參數)啟動一個任務,(無需等待任務完成)立即獲取參數行中的下一個參數(LCTT 譯注:管道輸出的每一行對應 parallel 的一個參數,所有參數構成參數行);只要你的主機沒有癱瘓,Parallel 會不斷做這樣的操作。舊任務完成后,Parallel 會為分配新任務,直到所有數據都處理完成。不使用 Parallel 完成任務大約需要 10 分鐘,使用后僅需 3 至 5 分鐘。 

多個輸入

只要你熟悉 findxargs (整體被稱為 GNU 查找工具,或 findutils),find 命令是一個***的 Parallel 數據提供者。它提供了靈活的接口,大多數 Linux 用戶已經很習慣使用,即使對于初學者也很容易學習。

find 命令十分直截了當:你向 find 提供搜索路徑和待查找文件的一部分信息。可以使用通配符完成模糊搜索;在下面的例子中,星號匹配任何字符,故 find 定位(文件名)以字符 searchterm 結尾的全部文件:

  1. $ find /path/to/directory -name "*searchterm"

默認情況下,find 逐行返回搜索結果,每個結果對應 1 行:

  1. $ find ~/graphics -name "*jpg"
  2. /home/seth/graphics/001.jpg
  3. /home/seth/graphics/cat.jpg
  4. /home/seth/graphics/penguin.jpg
  5. /home/seth/graphics/IMG_0135.jpg

當使用管道將 find 的結果傳遞給 parallel 時,每一行中的文件路徑被視為 parallel 命令的一個參數。另一方面,如果你需要使用命令處理多個參數,你可以改變隊列數據傳遞給 parallel 的方式。

下面先給出一個不那么實際的例子,后續會做一些修改使其更加有意義。如果你安裝了 GNU Parallel,你可以跟著這個例子操作。

假設你有 4 個文件,按照每行一個文件的方式列出,具體如下:

  1. $ echo ada > ada ; echo lovelace > lovelace
  2. $ echo richard > richard ; echo stallman > stallman
  3. $ ls -1
  4. ada
  5. lovelace
  6. richard
  7. stallman

你需要將兩個文件合并成第三個文件,后者同時包含前兩個文件的內容。這種情況下,Parallel 需要訪問兩個文件,使用 -I% 變量的方式不符合本例的預期。

Parallel 默認情況下讀取 1 個隊列對象:

  1. $ ls -1 | parallel echo
  2. ada
  3. lovelace
  4. richard
  5. stallman

現在讓 Parallel 每個任務使用 2 個隊列對象:

  1. $ ls -1 | parallel --max-args=2 echo
  2. ada lovelace
  3. richard stallman

現在,我們看到行已經并合并;具體而言,ls -1 的兩個查詢結果會被同時傳送給 Parallel。傳送給 Parallel 的參數涉及了任務所需的 2 個文件,但目前還只是 1 個有效參數:(對于兩個任務分別為)“ada lovelace” 和 “richard stallman”。你真正需要的是每個任務對應 2 個獨立的參數。

值得慶幸的是,Parallel 本身提供了上述所需的解析功能。如果你將 --max-args 設置為 2,那么 {1}{2} 這兩個變量分別代表傳入參數的***和第二部分:

  1. $ ls -1 | parallel --max-args=2 cat {1} {2} ">" {1}_{2}.person

在上面的命令中,變量 {1} 值為 adarichard (取決于你選取的任務),變量 {2} 值為 lovelacestallman。通過使用重定向符號(放到引號中,防止被 Bash 識別,以便 Parallel 使用),(兩個)文件的內容被分別重定向至新文件 ada_lovelace.personrichard_stallman.person

  1. $ ls -1
  2. ada
  3. ada_lovelace.person
  4. lovelace
  5. richard
  6. richard_stallman.person
  7. stallman
  8.  
  9. $ cat ada_*person
  10. ada lovelace
  11. $ cat ri*person
  12. richard stallman

如果你整天處理大量幾百 MB 大小的日志文件,那么(上述)并行處理文本的方法對你幫忙很大;否則,上述例子只是個用于上手的示例。

然而,這種處理方法對于很多文本處理之外的操作也有很大幫助。下面是來自電影產業的真實案例,其中需要將一個目錄中的視頻文件和(對應的)音頻文件進行合并。

  1. $ ls -1
  2. 12_LS_establishing-manor.avi
  3. 12_wildsound.flac
  4. 14_butler-dialogue-mixed.flac
  5. 14_MS_butler.avi
  6. ...略...

使用同樣的方法,使用下面這個簡單命令即可并行地合并文件:

  1. $ ls -1 | parallel --max-args=2 ffmpeg -i {1} -i {2} -vcodec copy -acodec copy {1}.mkv 

簡單粗暴的方式

上述花哨的輸入輸出處理不一定對所有人的口味。如果你希望更直接一些,可以將一堆命令甩給 Parallel,然后去干些其它事情。

首先,需要創建一個文本文件,每行包含一個命令:

  1. $ cat jobs2run
  2. bzip2 oldstuff.tar
  3. oggenc music.flac
  4. opusenc ambiance.wav
  5. convert bigfile.tiff small.jpeg
  6. ffmepg -i foo.avi -v:b 12000k foo.mp4
  7. xsltproc --output build/tmp.fo style/dm.xsl src/tmp.xml
  8. bzip2 archive.tar

接著,將文件傳遞給 Parallel:

  1. $ parallel --jobs 6 < jobs2run

現在文件中對應的全部任務都在被 Parallel 執行。如果任務數量超過允許的數目(LCTT 譯注:應該是 --jobs 指定的數目或默認值),Parallel 會創建并維護一個隊列,直到任務全部完成。 

更多內容

GNU Parallel 是個強大而靈活的工具,還有很多很多用例無法在本文中講述。工具的 man 頁面提供很多非常酷的例子可供你參考,包括通過 SSH 遠程執行和在 Parallel 命令中使用 Bash 函數等。YouTube 上甚至有一個系列,包含大量操作演示,讓你可以直接從 GNU Parallel 團隊學習。GNU Paralle 的主要維護者還發布了官方使用指導手冊,可以從 Lulu.com 獲取。

GNU Parallel 有可能改變你完成計算的方式;即使沒有,也會至少改變你主機花在計算上的時間。馬上上手試試吧! 

責任編輯:龐桂玉 來源: Linux中國
相關推薦

2009-08-16 20:24:59

linux命令行登陸linux命令行linux命令

2014-01-22 10:21:55

Linux命令行

2010-03-05 13:00:39

Ubuntu命令

2018-08-29 20:00:11

Linux命令行命令行別名

2018-04-25 10:46:05

Linux命令行日歷

2020-04-22 09:04:27

Linux命令行搜索工具

2010-06-01 19:14:53

SVN命令行

2014-01-24 09:09:32

Linux命令行網速

2018-02-10 17:30:41

Linux命令

2018-09-10 09:30:25

Linux命令應用

2019-08-15 15:00:31

Linux命令行PDF

2018-01-24 16:30:43

Linux命令Wifi

2014-06-16 09:28:08

Linux命令行

2016-12-15 08:30:02

Linux命令

2024-03-06 15:57:56

ShellLinux

2016-11-08 17:56:37

Linux命令行密碼

2020-05-07 19:46:18

LinuxMySQLMariaDB

2009-08-11 09:11:06

linux打開瀏覽器命linux命令行瀏覽器linux命令行

2018-03-14 14:27:00

2020-12-10 16:16:08

工具代碼開發
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产日韩欧美在线观看 | 久久中文字幕一区 | 国产女人与拘做受免费视频 | 一级毛片色一级 | 毛片一级片 | 国产精品免费小视频 | 日韩区| 成人在线观看免费 | 一区二区在线不卡 | 在线免费观看亚洲 | 美女爽到呻吟久久久久 | www.47久久青青 | 亚洲精品视频免费观看 | 国产91久久久久蜜臀青青天草二 | 久久久久国产精品 | 在线观看日韩精品视频 | 拍真实国产伦偷精品 | 国产一区 | 在线观看av不卡 | 91视频在线观看 | 久久久精品黄色 | 91中文视频 | 伊人网站 | 欧美精品一区二区三区在线播放 | 国产精品久久久久久久久图文区 | 国产视频一区二区 | 成人精品鲁一区一区二区 | 国产精品区一区二区三区 | 欧美色专区 | 免费三级网| 久久精品视频网站 | 国产精品影视在线观看 | 亚洲国产aⅴ精品 | 日韩中文一区二区 | 天天干天天操天天看 | 超碰97人人人人人蜜桃 | 黄a大片 | 国产精品完整版 | 欧美国产日韩在线观看 | 综合久久综合久久 | 久久久久综合 |