值得推薦的五大開源在線機器學習環境
譯文【51CTO.com快譯】機器學習是一個研究領域,讓機器無需直接編程就能學習。由于許多學生、教師、開發者和數據科學家使用機器學習來開發各種項目和產品,機器學習開發方興未艾。然而,開發機器學習模型對系統規格有很高的要求,因為有時模型訓練過程可能需要2小時到2天甚至更久。因此,低端系統無力處理機器學習模型的訓練;就算勉強可以訓練模型,也很可能會出現嚴重的系統問題。
然而有許多開源機器學習環境可用,它們對系統規格沒有任何要求,可使用云基礎架構在最短的時間內訓練模型。以下是幾種高效和常用的在線機器學習環境:
1. Google Colaboratory
這是谷歌提供的一項易于訪問的云服務,用于開發產品和項目。它支持免費的GPU,基于Jupyter Notebooks環境。它為所有人提供了一個論壇,以便使用廣泛使用的庫(比如PyTorch、TensorFlow和Keras),構建機器學習和深度學習應用。它讓您的系統可以不必處理機器學習活動的全部工作量。它是同類中最成功的平臺之一。
- 內存—12 GB至26.75 GB
- 磁盤空間—25 GB
- CPU核心—2個
- 支持的語言—Python
2. IBM Watson
IBM推出了支持開源解決方案的Watson數據平臺和數據科學體驗(DSX)。它終于推出了可自由選擇的多云平臺,以處理數據科學工作。這是借助通過Kubernetes實行容器化來實現的。因而,它可以分布在存儲數據的Docker或CloudFoundry容器中。
- 內存—16GB
- 磁盤空間—90 GB
- CPU核心—4個
- 支持的語言—Apache Spark、Python、R和Scala
3. Kaggle Kernel
這是面向云端深度學習和機器學習應用的出色平臺。 Kaggle和Colab有諸多相似之處,都是谷歌的產品。它在瀏覽器中支持Jupyter Notebooks。Jupyter Notebooks的許多鍵盤快捷方式與Kaggle幾乎相同。Kaggle擁有龐大的數據集,還有廣泛的社區致力于宣傳、學習和驗證數據科學技能。GPU和TPU的使用在Kaggle內核中有一些方面的限制。
- 內存—25GB
- 磁盤空間—155 GB
- CPU核心—1個
- 支持的語言—Python和R
4. Coclac
它是用于計算、研究、協作和編寫文檔的虛擬在線工作區。這包括使用各種科學語言,提供LaTeX、R/knitr或Markdown中的創作文本功能、基于Web的Linux控制臺、時間旅行功能以及聊天室和課程管理等網絡資源。然而,其大多數功能僅供付費用戶使用。
- 內存—16GB
- 磁盤空間—20 GB
- CPU核心—3個
- 支持的語言—Julia、Octave、Python、SageMath和R Statistics等
5. Microsoft Azure
微軟的Azure Notebooks在功能上與Colab相似,但以速度取勝,這方面比Colab好得多。Azure Notebooks是一系列鏈接筆記本,名為Libraries(庫)。這些庫還能存儲您的數據,假設每個數據文件都小于100MB。Azure Notebooks更適合基本應用。Azure僅提供12個月的免費服務。
- 內存—可變
- 磁盤空間—可變
- CPU核心—可變
- 支持的語言—Python、R和F#
原文標題:Top 5 Open-Source Online Machine Learning Environments,作者:Rituraj Saha
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】