成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Julia、Delta Lake榜上有名!2019年優秀開源軟件獎公布

新聞 開源
近日,2019 年 InfoWorld Bossie 榜單正式公布,在今年的獲獎名單中,大家不僅能夠找到全球最出色的開源軟件,它們同時也代表著目前軟件行業的高水準。

如今,軟件開發、云計算、分析、機器學習以及幾乎所有新興領域中最重要的軟件幾乎都擁有開源身份。有時候,甚至存在多家彼此激烈競爭,且各自皆擁有雄厚實力的技術企業在支持這些開源軟件項目的發展,希望利用它們解決企業計算中存在的重大難題,并進一步重塑企業級基礎設施與應用程序的新面貌。

十多年以來,InfoWorld 一直致力于評選 InfoWorld Bossies 年度優秀開源大獎,旨在發現那些最有趣、具有創新性的開源項目。在剛剛開始評選時,獲獎開源項目往往體量很小,而且一般只為企業開發人員以及 IT 部門所熟知(除了 Linux 或者 BIND 等少數例外情況)。然而,其仍然具有極高的實用度,而且完全免費。

近日,2019 年 InfoWorld Bossie 榜單正式公布,在今年的獲獎名單中,大家不僅能夠找到全球最出色的開源軟件,它們同時也代表著目前軟件行業的較高水準。 

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

BPF Compiler Collection

擴展 Berkeley 數據包過濾器(簡稱 eBPF)在 Linux 世界上可謂聲名顯赫,它正在逐步取代 iptables 等網絡支持工具,并以更實用且更安全的方式降低觀察工具在內核空間中的運行劇本。

BPF Compiler Collection 以高效觀察作為設計的核心目標,這套集合包含由 Python 或 Lua 語言創建并運行的一組 eBPF 代碼編譯器工具。該項目中還提供大量示例程序,可面向代碼內存分配以及 HTTP 數據包等任務運行跟蹤及全域篩選。

Netflix 公司主內核性能工程師 Brendan Gregg 的新書《BPF 性能工具(BPF Performance Tools)》即將出版,相信屆時又將掀起新一波 eBPF 人氣飆升。因此,推薦大家在這波浪潮來臨之前搶先一步學習了解。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Wasmer

WebAssembly——簡稱 Wasm——承諾帶來閃電般的啟動速度以及極低的占用空間,這也使其成為無服務器架構與物聯網邊緣設備的理想選擇。Wasmer 在 WebAssembly 服務器運行時領域居于領先地位,其主要優勢體現在接近原生水平的執行速度。事實上,單憑速度這一點,Wasmer 就足以技壓群雄。

Wasmer 將各種獨立的運行時與工具包結合起來,用于編譯并定位 WebAssembly 二進制代碼——包括嵌入至現有代碼中的 WWebAssembly 模塊、CLI 可執行應用以及二進制庫等等。類似于 Node.js 之于 JavaScript,Wasmer 允許 WebAssembly 實現在廣泛平臺上的隨處運行。

Wasmer 以 Cranelift 代碼生成器為基礎,提供涵蓋 Go、C/C++、C#、Python、R、Rust、Ruby 以及 PHP 的語言集成選項,同時支持 Linux、Mac 與 Windows 運行時(在 Windows 平臺上采用 Emscripten 實現,因此尚處于實驗階段)。Wasmer 的類 NPM 工具包管理器 WAPM 同樣表現出色,負責利用經過認證且可立即運行的各類庫為產品帶來進一步完善。

2019 年當中,Wasmer 進一步向 Cranelift 添加了兩套補充性后端(包括通過優化提供執行速度更快的 LLVM 運行時),同時為 WASI(WebAssembly 系統接口)與 SIMD 并行性提供支持。WASI 正是應用程序跨操作系統可移植性的實現關鍵,而 SIMD 支持將為加密及視頻處理等數學密集型應用帶來巨大的性能提升。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Language Server Protocol

近年來,軟件領域中又出現了不少卓越的工具鏈創新成果,其中的 LLVM 編譯器框架就是一套用于實現各類編譯器的出色庫選項。而來自微軟的 Language Server Protocol 就為軟件開發人員提供了另一個強大的工具市場,能夠在編譯器或者語言工具鏈與用于創建代碼的 IDE 或編輯器之間建立起順暢的雙向通道。

開發人員要求自己的編碼工具能夠提供實時反饋——除了對標準庫函數進行靜態查找之外,還應當包含與所編寫代碼相關的交互式詳細信息。Language Server Protocol 通過用于開發工具與語言服務器間通信的 JSON-RPC 標準很好地完成了這一目標,該標準提供語言記錄以及會話編輯自動補全等多種實用功能。

從 Ada 到 YANG,目前 Language Server Protocol 已經為數十種語言提供實現方案。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Serverless Framework

在降低運營開銷方面,沒有什么能夠在效果上與無服務器架構相匹敵。但遺憾的是,降低開銷通常也伴隨著架構復雜性的提升以及云供應商鎖定等問題。Serverless Framework 在無服務器應用程序與各類高人氣云實現方案(包括 Amazon Web Services、微軟 Azure、Google Cloud Platform 以及 Kubernetes)之間帶來了具有供應商中立性的抽象解決方案。

Serverless Framework 不僅允許用戶自由選擇不同的部署目標,同時也能幫助大家更快更輕松地對事件驅動型函數即服務應用程序進行測試、部署以及管理。在創建函數、定義端點并指定目標云環境之后,Serverless Framework 即可對你的代碼、安全性要求、資源要素以及云部署 YAML 進行打包,從而順利完成項目部署。另外,該框架內置的自動檢測功能也會立即開始監控并捕捉各項指標,從而提供開箱即用的通知功能。

該項目背后的開發人員們今年主要致力于通過實時監控、安全性與集成測試對 Serverless Framework 進行增強,從而確保其有能力深入整合至應用程序生命周期管理當中。新的規則允許用戶管理憑證及訪問策略,從而增強安全性并以可編程方式對這些資源加以利用。新的即插即用組件集合(目前仍處于 beta 測試階段)則為從靜態網站到全棧 Web 應用程序的多種常見用例帶來顯著的功能補充。

總而言之,Serverless Framework 為開發人員帶來無縫化使用體驗,從而消除了構建無服務器應用程序中的多種常見難題與陷阱。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Istio

微服務架構能夠簡化開發流程,但隨著服務數量的爆炸式增長,對各服務間通信的管理也變得愈發復雜。植根于 Kubernetes 生態的 Istio 通過將發現、負載均衡、訪問控制、加密、流量管理以及監控等功能集成至基礎設施層級的解決方案當中,顯著減輕了開發人員的服務間通信負擔。換言之,開發人員將無需手動在服務當中應用這些管理邏輯。

Istio 立足一整套 Kubernetes 集群(常被稱為「服務網格」)對各容器與編排服務加以管理。其利用 Envoy 代理“邊車”充當服務網格當中各服務間所有通信的代理機制。用戶可以通過高級抽象對集群中的網絡進行隨意變更,而后逐步推出,并在發現問題之后立即回滾。Istio 還能夠生成與流量活動相關的統計信息,幫助大家快速獲得符合需要的服務性能。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Envoy

作為 Kubernetes 的標準服務代理,Envoy 一直在不斷發展壯大。在成為首個云原生計算基金會項目(甚至早于 Prometheus 與 Kubernetes)之后,Envoy 快速進入 Istio 與 AWS App Mesh 等服務網格的核心,并成為大部分 Kubernets 設置中不可或缺的組成部分。足以與 Reddit 比肩的大規模生產部署,也在客觀層面證明了 Envoy 出色的規?;\作能力。

過去一年,我們迎來了 Envoy Mobile,該版本將 Envoy 的諸多優勢(包括斷路、重試處理、可觀察性與一致性等)引入 iOS 與 Android 統一跨平臺庫當中。盡管尚處于早期發布階段,我們對于 Envoy Mobile 在 2020 年的表現已經充滿期待。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Kong

如果大家的主要工作是構建 API,那么速率限制、負載均衡、身份驗證、日志記錄等功能完全不需要重新實現。Kong 由 Mashape(即現在的 Kong 有限公司)于 2015 年推向開源,其能夠提供這里提到以及沒有提到的豐富功能。此外,該公司還提供 Kong Enterprise,一套基于開源內核構建的企業級 API 平臺。

Kong 以開箱即用方式為我們提供應用程序堆棧內 API 集所需要的大部分功能。除了之前提到的主要功能之外,其還包含斷路器、運行狀態檢查、OAuth、轉換、緩存、地理位置復制等功能。即使未能默認提供,大家也完全可以通過 Kong Hub 從數十款插件中找到自己需要的其它小眾功能。

Kong 還能夠與各類云原生工具協同合作。希望將 Kong 與自己集群緊密集成的 Kubernetes 用戶,可以使用 Kubernetes Ingress Controller for Kong,從而快速享受大量現成且成熟的功能。Kong Enterprise 版本不僅擁有更強大的支持能力,同時也提供專業級的自動化與可見性工具。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Pulumi

一般來講,IT 基礎設施要么需要以手動方式拼湊起來(非常費力),要么是通過需要調用數十個 API 的腳本組裝在一起(極為復雜),或者是通過 Terraform 等工具執行配置文件(高度專用化)。Pulumi 提供了一種與眾不同、通用度高且基本思路非常簡單的方案,能夠幫助我們輕松解決各類集成過程中的常見問題。大家不必勉力使用令人困惑的新工具或笨拙舊工具的組合,而可以選擇你最熟悉且喜愛的常規編程語言以編程方式進行基礎設施聲明。是的,完全無需 YAML!

最重要的是,Pulumi 允許大家以相同的方式在全部主流云服務(Amazon、Azure、Google)以及一切 Kubernetes 系統當中實現基礎設施的配置與管理。將云對象模型、運行時評估以及所需狀態相結合,Pulumi 允許大家跨云配置并管理各類資源,包括無服務器代碼片段、靜態網站以及各類常見的應用程序或應用模式。

Pulumi 代碼可以使用 JavaScript、TypeScript、Python 以及 Go 語言進行編寫,其中涵蓋絕大多數企業用例。另外,項目的示例庫中也包含多種能夠直接使用或者擴展的常用模式。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Sysdig

Kubernetes 與 Cloud Foundry 等云原生技術已經非常復雜,而一旦將微服務架構引入這套組合,那么監控工作的難度將提升到新的水平。Sysdig 為我們提供一組工具,不僅可以用于了解基于容器的應用程序的實際性能,同時也可幫助大家及時發現各類異常狀況與安全威脅。

Sysdig Inspect 能夠立足內核層級進行容器狀態捕捉,幫助大家及時發現性能問題、跟蹤趨勢,并在發生嚴重性能瓶頸之前進行故障排查。而利用 Sysdig Falco,你可以為容器定義“常規”活動,Falco 基于規則的過濾引擎將在檢測到異常行為時觸發警報,甚至可以根據預設執行規定操作。Sysdig Prometheus 則結合了幾乎涵蓋所有指標的檢測功能,可提供極為輕松的查詢與實時可視化能力,用以匯總來自分布式容器、應用程序以及服務的運行時數據。

過去一年來,該項目對警報自定義與觸發器做出改進,同時提升了儀表板的深度與細粒度水平(增加了諸如 CPU/ 內存使用率以及容量閾值等信息),同時增強了安全策略編輯器中顯示的抬頭規則。

容器化應用程序帶來了獨特的性能挑戰與漏洞。Sysdig 工具無疑能夠幫助我們更為嚴密地觀察容器性能與安全性表現。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Kraken

大規模容器部署總是與大量 Docker 鏡像傳輸密不可分,這意味著我們必須面對由此帶來的延遲峰值與擴展挑戰,特別是在需要跨多個區域的數據中心進行鏡像提取的場景之下。我們該如何應對這一難題?對 Uber 的工程團隊來說,答案就是 Kraken。

Kraken  是一套面向 Docker 注冊表的高可擴展性對等緩存與分發層,能夠在幾秒鐘之內完成 TB 級鏡像數據的提取。Kraken 的核心為包含三大主要組件的自我修復型 torrent 種子架構。源種子節點緩存首先從可插拔的后端 Blob 存儲(例如 Amazon S3 或者 HDFS)當中提取鏡像數據。跟蹤器節點隨后創建所有可用對等方與發種方的內存全局視圖。對等方負責實現 Docker 注冊表接口并自主執行鏡像 pull 請求。

各對等節點并行工作,可在幾秒鐘之內組裝出成千上萬個 GB 級別大小的 Blob,這樣的速度表現比傳統集中式注冊表高出數個量級。Kraken 還提供良好的優化與調整參數,以避免造成網絡過載。如果你已經用盡一切傳統方法嘗試緩解 Docker 啟動延遲,那么 Kraken 可能會為你帶來新的希望。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Anaconda

Anaconda Distribution 是一套經過精心設計且完全開源的 Python(與 R)軟件包集合,專門面向各類機器學習與數據科學需求。Anaconda 與其他發行版之間最大的區別,在于 Anaconda Navigator(用于啟動應用程序與管理軟件包的圖形化桌面環境)以及 Anaconda 的本地軟件包管理器 Conda。

由于大多數軟件包都包含針對特定版本的依賴性,因此如果沒有 Conda 的幫助,我們將很難避免其安裝沖突并保證所有軟件包的及時更新。Conda 負責管理 Anaconda 公開庫以及第三方渠道當中所有的依賴關系與更新。Pip 為 Pythonr 原生軟件包管理器,擁有強大的 Python 軟件包安裝與管理能力;但 Conda 不僅能夠處理 Python 軟件包,同時也能夠承擔起 Python 生態系統之外的各類依賴關系管理工作。

Anaconda 今年為 Conda 帶來了用戶們期待已久的性能提升。由于其中安裝大量庫,因此其更新的下載與安裝變得異常緩慢。幸運的是,自 Conda 4.7 于今年夏季發布以來,我們發現軟件包的管理體驗變得更輕、更快。

作為適用于 Linux、Windows 以及 MacOS 的全平臺項目,Anaconda Distribution 無疑是一套一流的機器學習與數據科學生態系統,支持 GPU 訓練并提供強大的作業調度程序。另外,遵循 BSD 許可也讓該項目對于開發人員擁有著極大的吸引力。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Kotlin

號稱為“完美版 Java”的 Kotlin 語言由 JetBrans 公司所創建。該公司還開發出針對 Java 的 IntelliJ ID。Kotlin 語言的 beta 版本最初發布于 2011 年,它能夠像 Java 一樣在 JVM 上運行,并能夠與 Java 庫無縫實現互操作。但是,它也消除了 Java 當中的大量冗余細節,增加了強大的函數編程能力,同時以更優雅的方式解決了空指針異常等安全問題。此外,谷歌目前也已經將 Kotlin 指定為創建 Android 應用程序的首選語言,這意味著即使轉投 Kotlin 懷抱,各位 Java 開發者也不用擔心失去 Android 這一巨大的應用開發市場。

Kotlin 的一大基本發展方針,在于只采用部分 Java 實現思路并將其作為語言與工具鏈中的主要部分。Kotlin 1.3 版本于 2018 年末發布,增加了直接將 Kotlin 編譯為平臺本機代碼的功能——這也解決了長期以來 Java 一直未能實現的重大難題(只能通過商業插件實現)。另一項與之相關的功能為 contracts,這是一種利用函數對編譯器工作方式進行描述的方法?,F在,Kotlin 標準庫中的所有函數都已經使用到 contracts。Kotlin 項目的長期計劃不再是克隆 Java,而是全面實現超越。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Julia

隨著數據科學的突飛猛進,市場對快速便捷數值計算工具的需求也在不斷增長。Julia 語言正是為此設計而成,旨在帶來與 Python 相當的便捷性、與 C 相當的速度表現以及與 Fortran、R 乃至 Matlab 相當的友好上手感受。結果就是,這款編程語言迅速吸引到各類數學以及統計學用戶的關注——包括數據科學家、研究科學家、工程師以及金融分析師與量化專家。

經過九年的開發與七年的 beta 測試階段,Julia 1.0 于 2018 年正式亮相。這一里程碑版本整合了核心功能與機器碼原生速度表現、數學友好型語法、多次分派、異步 I/O、并行性、軟件包管理以及良好的語言整體穩定性等優勢。自那時以來,Julia 的三大主要發行版帶來了數十項新功能,旨在不斷改善其數學、統計以及常規編程方面的實際表現。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Hazelcast Jet

今年,以開源內存數據網格聞名的 Hazelcast 發布了 Hazelcast Jet 的首個通用版本。Hazelcast Jet 是一套 Java 可嵌入分布式流處理引擎。盡管剛剛發布通用版本,但 Hazelcast Jet 3 已經擁有多年的實踐應用經驗,并用實際表現證明了其強大的可靠性水平。(從 3.x 版本開始,Jet 與 Hazelcast 的旗艦 IMDG 產品版本保持一致。)

在后臺,Hazelcast Jet 采用 java.util.stream API 創建出一套多線程數據攝取網絡,該網絡能夠在調頻情況下高效運行。此外,連接器選項使用戶能夠輕松利用 Hazelcast IMDG、HDFS 以及 Kafka 等數據源進一步豐富數據流。對于實時邊緣應用程序(例如對物聯網傳感器網絡的監控以及面向支付處理網絡的欺詐檢測),Jet 已經成為一套理想的解決方案。

Hazelcast Jet 的通用版本提供對 Java 11 的全面支持,從而增強對數據流診斷的分析能力、新的管理轉換與聚合功能以及無損作業恢復(僅適用于企業版)。Java 開發人員可以在這里使用到自己熟悉的 map、filter 以及 reduce 等概念。如果大家希望將分布式實時情報嵌入至流處理 Java 應用程序當中,那么 Hazelcast Jet 絕對值得一試。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Apache Airflow

Apache Airflow 是一套基于 Python 的平臺,負責以可編程方式實現工作流的編寫、規劃與監控。這些工作流屬于任務的有向無環圖(DAG),大家可以利用 Python 代碼編寫流水線以實現 DAG 配置。

Airflow 能夠生成 Web 服務器充當其用戶界面。我們可以通過該網站查看多種視圖以觀察 DAG,并借此對 DAG 進行操作。此外,Airflow 還提供命令行界面,該界面同樣允許用戶對 DAG 進行多種類型的操作,同時實現服務啟動、開發與測試。

大家可以自主定義操作程序與執行程序,同時擴展 Airflow 庫以確保其與你的環境抽象級別相匹配。你可以使用 Jinja 模板引擎對腳本進行參數化。Airflow 還具有可擴展的模塊化架構,并使用消息隊列以安排任意數量的工作程序。Airflow 以數據庫為基礎,你可以選擇使用 SQLite(僅用于開發及測試)或者任何其他常見的關系數據庫選項。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

GridGain

大約五年之前,GridGain 將 Ignite 代碼庫交由 Apache 軟件基金會進行開源。自那時以來,該公司一直在為這套內存數據網格平臺提供企業級功能、更新與功能增強。GridGain 社區版 于今年 3 月首次亮相,其相較 Apache Ignite 采用了相同的簽名 GridGain 調整與補丁以實現性能與可靠性優化,同時增強了安全性并簡化關鍵任務部署的維護流程。

GridGain 社區版提供可伸縮集群、本機復制以及良好的備份與恢復選項,因此非常適合立足分布式數據中心為數據密集型應用程序提供服務。此外,GridGain 還支持本地、云以及混合部署方式。雖然 GridGain 中的高級功能集仍然要求按需付費,但憑借著此次推出的 GridGain 社區版,大家完全可以免費下載這套可靠的高容量、內存內流式傳輸與實時事件處理平臺。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Apache Druid

Apache Druid 是一套面向列的時間序列數據庫加分析引擎,可為事件驅動型高速數據帶來實時可視化與低延遲查詢功能。Druid 將流式攝取、OLAP 風格的批量攝取以及搜索技術結合在一起,能夠輕松對實時及歷史數據進行切片、切塊以及轉換。出色的可伸縮性以及閃電般的即時查詢響應速度,使得 Druid 成為超越傳統數據倉庫的更強交互式應用程序與高并發工作負載處理選項。

Druid 是個規模相可觀的開源項目。集群當中包含多個服務器與進程,負責各自獨立地處理攝取、查詢或者工作負載協調任務。但是,這種復雜性并沒有影響到出色的靈活性與可靠性。盡管目前 Druid 尚處于 Apache 孵化階段,但其已經擁有良好的穩定性、容錯能力并能夠在本地或者云環境中支持生產流程。

如果你需要更高級的 Druid 工具,我建議大家試 Imply 發行版,這套發行版添加了拖拽式 GUI、高級分析以及向導驅動型 Kafka 集成機制,外加其他多種監控與管理功能。為了使大量事件源與下游分析更可靠地耦合起來,這里也建議你考慮將 Apache Kafka 添加到組合當中。在這里,我們推薦 Confluent 發行版。Kafka 與 Druid 這對組合將成為一對強大的事件驅動型實時分析搭檔。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

TensorFlow

在目前市面上所有可用的出色機器學習與深度學習框架當中,TensorFlow 無疑是最成熟、在研究論文中引用次數最多(即使排除掉谷歌員工的引用也是如此)、而且在實際生產中表現最亮眼的選項。雖然它的學習曲線比較陡峭,但入門難度已經遠低于 2016 年的版本。另外,TensorFlow 也已經成為眾多谷歌服務的實現基礎。

TensorFlow 2.0 專注于簡單化與易用性,并迎來了急切執行、直觀高級 API(Keras)以及立足任意平臺實現靈活建模等重要更新。急切執行意味著 TensorFlow 代碼能夠在定義時立即運行,而不必等待將所有節點及邊界添加到運行會話當中(后一種正是 TensorFlow 的原始運行模式)。TensorFlow 2.0 也繼續支持 TensorBoard 圖形化與診斷功能。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

TensorWatch

盡管 TensorBoard 成功降低了 TensorFlow 以及新型 PyTorch 程序的理解、調試與優化門檻,但其仍有一大致命缺點——需要在訓練完成后立足日志文件運行并使用自己的獨立用戶界面。事實上,TensorBoard 的日志記錄分析會帶來巨大的資源開銷。

TensorWatch  是一套用于深度學習模型調試與可視化的 Python 庫,由微軟研究院開發完成。其能夠在模型訓練的同時,實時顯示可視化圖形。此外,它還提供強大的訓練前與訓練后功能,包括模型圖可視化、降維數據探索、模型統計以及用于卷積網絡的多種預測解釋器。

TensorWatch 可利用 Jupyter Notebooks 或者 Jupyter Lab 提供交互式實時訓練流程調試功能。除了 TensorBoard 使用的直接日志記錄模式之外,TensorWatch 還支持懶惰日志記錄模式,負責以極低的資源開銷觀察變量。在此之后,大家可以立足變量上下文執行交互式查詢,并返回相關數據流供進一步可視化處理。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

PyTorch

在 2018 年入駐深度學習領域并立即成為研究人員的熱門選項之后,PyTorch 在 2019 年進一步針對生產需求做出了改進。隨著 PyTorch 1.0 版本的到來以及 TorchScript 的出現(TorchScript 為 JIT 編譯的 Python 子集,同時配合一套高速 C++ 運行時),該框架無疑已經為生產應用做好準備。既然 Facebook 公司能夠利用 PyTorch 搞定每天一萬億次操作,那么它也絕對能夠滿足我們的所有日常需求。

除了生產就緒之外,過去一年當中,PyTorch 的相關生態系統也快速發展成熟。如今,它有了自己的中樞平臺 PyTorch Hub,用于存儲各類經過預先訓練的 PyTorch 模型,外加相關文本、視覺與音頻庫。這些庫包含最先進的技術成果,而且全部打包就緒供用戶直接使用。毫無疑問,PyTorch 已經成為眾多數據科學家的最愛,并有望在 2020 年乃至之后以更低的上手門檻在深度學習領域發揮重大作用。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

PyTorch-Transformers

Hugging Face 的開發人員們通過 PyTorch-Transformers 為 PyTorch 以及 NLP(自然語言處理)社區做出了巨大的貢獻。這套庫中包含著大量最新、最前沿的 NLP 研究模型實現成果,例如 BERT、GPT-2 以及 XLNet 等等。這些實現通常會在一周之內進行更新,用以及時跟進新的模型或版本。

憑借著面向全部模型的統一 API 以及針對已訓練模型(同時支持對 TensorFlow 訓練模型進行轉換)及新模型構建的完善文檔,PyTorch-Transformers 無疑成為急切希望探索建模新世界的朋友們的最佳選擇。在學術研究之外,這套庫也具備充分的實用性,可用于 Hugging Face 自家的 Talk To Transformer 等產品當中。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Ludwig

Ludwig 是一套由 Uber 公司開發的 Python 工具箱,基于 TensorFlow,旨在降低神經網絡編程的復雜性水平。Ludwig 能夠幫助數據科學新手在無需編寫任何代碼的前提下,完成對復雜深度學習模型的訓練與測試。沒錯,只需要對 YAML 配置聲明文件進行參數調整,即可輕松完成目標。當然,經驗更為豐富的數據工程師也可以在后臺調整更多其他參數。

Ludwig 允許大家定義數據源(目前支持 CSV 文件或者 Pandas DataFrame),同時選擇你需要的功能與編碼器。接下來,Ludwig 會預處理器開始工作,通過拆分數據集進訓練與測試、構建神經網絡,并通過不同的模型優化方法進行迭代。內置的可視化工具允許用戶檢查模型的測試性能與預測值結果。此外,Ludwig 提供的編程 API 還能夠直接導入 Python 當中,這也使得該工具包的實用性遠遠超越了純命令行范疇。

Ludwig 支持大量數據類型(從文本到圖像,再到時間序列)以及多種神經網絡編碼器(包括多種 CNN/RNN 組合,以及用于較大圖像處理網絡的 ResNet)。Ludwig 與其他 Uber 工具(包括用于分布式 GPU 訓練的 Horovod)配合良好,并將很快增加對 Amazon S3 以及 HDFS 存儲的支持能力。

如果大家希望在深度學習領域獲得更快的迭代實驗能力,那么 Ludwig 的實際表現應該能夠滿足你的需求。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

RAPIDS

一般來說,提升速度也就意味著放棄舊有方法——只有擺脫你所熟悉的固有解決方案,才能以一種完全不同的途徑實現速度提升。但 RAPIDS 致力于打破這種局面,這是一套數據科學框架,能夠在無需放棄已有知識與技能的前提下成功實現機器學習加速。

RAPIDS 能夠利用內存內處理方式在 GPU 上直接訓練機器學習模型,而且即使與其他 GPU 訓練方法相比,其訓練速度水平仍然要高出幾個量級。它所使用的數據分析工具與 Python 相關實現方案完全等效(主要是 Pandas DataFrames)但又有所不同,在某些情況下你只需要變更腳本中的 import 語句即可完成兼容。

RAPIDS 目前的一大致命缺陷在于平臺支持能力有限。該框架目前僅能夠運行在 Ubuntu 與 CentOS 系統之上,而且需要與 Python 的 Anaconda 發行版配合才能實現最佳效果。另外,它也不具備通過 pip 在通用 Python 環境下進行安裝的功能。但是,憑借著將數據準備與模型訓練任務遷移至 GPU,它確實能夠幫助大家顯著節約時間,這可以在相當程度上抵消以上種種不便。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

MLflow

機器學習項目擁有自己的一套生命周期。具體來講,實驗過程難以跟蹤、模型難以推廣、結果也難以重現。MLflow 項目的建立目標在于讓機器學習項目擁有與其他軟件開發項目類似的低管理門檻,同時提供一致且可重復的方式以實現數據準備、代碼與配置跟蹤及輸出、模型與工作流共享以及生產環境下的模型部署。

MLflow 為機器學習項目中的各個主要組成部分及階段都準備了對應的工具。在機器學習實驗方面,MLflow 提供 API 以實現結果的跟蹤與比較。為了重現用于生成結果的環境,MLflow 提供基于 Conda 與 Docker 的代碼打包格式。為了將模型交付至不同的部署平臺,MLflow 還提供專門的模型打包格式,允許立足模型提供預測結果,同時保留其中關于模型創建的數據與代碼關系。

MLflow 具有編程語言與平臺中立性,能夠在 Linux、Windows 以及 MacOS 上運行,且可以與任何機器學習庫(包括 TensorFlow、PyTorch 等)協同使用。MLflow 使用 Python 語言編寫,因此在 Python 生態系統中能夠發揮最佳效果。但其同時也與 R 及 Java 緊密關聯,同時提供面向大部分其他語言選項的 REST API。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Kubeflow

Kubeflow 這個名字聽起來不太嚴肅,畢竟它直接就把 IT 領域當下最熱門的兩個詞匯結合了起來——Kubernetes 加上機器學習。然而,它用實際表現證明了自己的能力,解決了長期以來一直困擾著各類組織的兩個現實問題:如何將機器學習研究從開發環境轉移到生產環境,以及如何將遙測技術從生產環境轉移回開發環境(以實現深度研究)。

基于谷歌 TensorFlow 擴展平臺的 Kubeflow 項目已經在發展過程中建立起自己的中立定位,能夠支持 PyTorch、MXNet 以及 Chainer 等競爭性機器學習庫,并獲得了 Chase、微軟以及阿里巴巴等科技巨頭的支持與貢獻。作為一個致力于簡化機器學習模型部署、管理與擴展工作的項目,Kubeflow 絕對是今年乃至未來幾年內值得高度關注的重量級成果之一。

Julia、Delta Lake榜上有名!2019年最佳开源软件奖公布

Delta Lake

Databricks 公司于今年早些時候對 Delta Lake 進行了開源。這樣的選擇令人驚訝,畢竟這家公司過去一直將其作為商用產品中不可或缺的重要組成部分。Delta Lake 擁有處理 PB 甚至 EB 級數據的強大性能,負責充當數據湖中的存儲層,可提供 ACID 轉換與簡單的數據版本控制功能,,且只需通過 Apache Spark read 函數調用傳遞時間戳即可實現“時間旅行(time travel)”。

雖然 Delta Lake 尚處于早期開源開發階段(今年 6 月剛剛發布 0.2.0 版本,增加了對 AWS 與 Azure 云資源的支持能力),但其已經在 Viacom 與 McGraw Hill 的生產環境中運行,因此大家對其穩定性應該不必擔心。在接下來的幾個月中,相信會有更多企業將 Delta Lake 納入自己的生產技術棧。

 

責任編輯:張燕妮 來源: AI前線
相關推薦

2021-01-25 09:50:59

天翼云

2014-02-09 14:13:29

LinuxUbuntuAndroid

2009-01-08 08:10:12

2012-12-27 10:02:54

2011-06-16 08:30:12

央采泰合SOC啟明星辰

2009-10-20 11:43:23

2009-07-20 08:29:44

古怪IT人物喬布斯鮑爾默

2023-06-19 13:30:03

海思

2022-11-24 15:17:31

人工智能論文

2018-02-23 10:13:30

2014-12-04 12:00:50

移動設計產品失敗

2022-04-15 12:08:19

安全運營SOAR

2016-05-16 16:48:30

云適配

2012-05-28 09:59:25

2015-01-20 15:31:18

QQ盜號流氓推廣免殺木馬

2009-04-29 13:11:53

亞洲 杰出

2021-10-20 09:36:16

開源技術 軟件

2009-11-19 09:22:08

互聯網10年10大重要

2009-02-22 09:23:09

Android軟件排行
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产羞羞视频在线观看 | 国产精品视频在线观看 | 亚洲色片网站 | 国产欧美日韩视频 | 最新中文字幕久久 | 狠狠骚 | www狠狠干| 国产精品一区免费 | 精品日韩一区 | 午夜视频一区二区三区 | 亚洲精品综合 | 国产伦精品一区二区三区高清 | 国产精品久久久久久吹潮日韩动画 | 在线免费观看日本视频 | 麻豆久久久久久 | 国产在线精品一区二区三区 | 久久久免费精品 | 韩日一区二区三区 | 亚洲顶级毛片 | 欧美一卡二卡在线观看 | 国产黄色网址在线观看 | 日韩欧美在线观看 | 欧美大片一区 | 九七午夜剧场福利写真 | 国产精品欧美一区二区 | 精品久久一区 | 国产精品特级毛片一区二区三区 | 91精品国产综合久久婷婷香蕉 | 国产精品久久久久久久免费观看 | 欧美 日韩 在线播放 | 精品久久久久久18免费网站 | 蜜桃在线播放 | 日本xx视频免费观看 | 日韩三级在线观看 | 日韩av第一页 | 亚洲欧美日韩在线一区二区 | 国产欧美一区二区三区在线看蜜臀 | 亚洲情视频| 久婷婷 | 精品欧美一区二区在线观看视频 | 国产精品美女久久久久aⅴ国产馆 |