2018年7款最佳免費(fèi)數(shù)據(jù)分析工具
譯文【51CTO.com快譯】數(shù)據(jù)分析對(duì)期望發(fā)掘隱藏在海量數(shù)據(jù)中的洞察力的公司來(lái)說(shuō)越來(lái)越重要。企業(yè)可以使用旨在面對(duì)眾多數(shù)據(jù)源,組織、分類和推導(dǎo)統(tǒng)計(jì)結(jié)論的工具,獲得極其寶貴的洞察力,以便了解客戶和業(yè)務(wù)目標(biāo)。
企業(yè)在評(píng)估數(shù)據(jù)分析工具時(shí)要考慮許多方面、要做出許多選擇,但是一旦找到合適的軟件,并高效地使用其功能可顯著改善業(yè)務(wù)。
我們?cè)u(píng)估了多家提供商以找到如今市面上***的免費(fèi)數(shù)據(jù)分析軟件。我們?cè)谠u(píng)估了它們的優(yōu)缺點(diǎn),并分析了各家研究公司的評(píng)論后,選出了下列七款工具(按首字母順序排列),幫助你找到最適合自己的解決方案。
1.DataMelt
DataMelt又叫DMelt,這款計(jì)算平臺(tái)用于統(tǒng)計(jì)分析龐大數(shù)據(jù)和科學(xué)可視化。該軟件最常用于自然科學(xué)、工程以及金融市場(chǎng)的建模和分析。它支持許多編程語(yǔ)言,包括Python、 BeanShell、Groovy、Ruby、Java及其他語(yǔ)言。
企業(yè)組織可通過(guò)動(dòng)態(tài)腳本來(lái)訪問(wèn)大型庫(kù),包括面向計(jì)算和可視化的40000多個(gè)Java類和500個(gè)Python模塊。更高級(jí)的功能需要開發(fā)者許可證或商業(yè)許可證,但是免費(fèi)版DataMelt包括探索、分析和可視化數(shù)據(jù)所必要的許多關(guān)鍵功能。
DataMelt可在Windows、Linux、macOS和Android設(shè)備上運(yùn)行。
2.KNIME分析平臺(tái)
KNIME分析平臺(tái)旨在幫助企業(yè)通過(guò)可視化編程來(lái)處理、分析和建模數(shù)據(jù)。該軟件包括1000多個(gè)模塊、數(shù)百個(gè)隨時(shí)可運(yùn)行的示例和眾多集成工具,幫助用戶借助機(jī)器學(xué)習(xí)來(lái)發(fā)現(xiàn)隱藏在數(shù)據(jù)中的潛在洞察力,并預(yù)測(cè)未來(lái)。
KNIME讓企業(yè)能夠拖放活動(dòng)之間的連接點(diǎn),無(wú)需編寫代碼。該數(shù)據(jù)分析工具使用單一的可視化工作流程,支持簡(jiǎn)單文本文件、數(shù)據(jù)庫(kù)、文檔、圖像、網(wǎng)絡(luò)和基于Hadoop的數(shù)據(jù)之間的數(shù)據(jù)融合。KNIME分析平臺(tái)是開源工具,每年發(fā)布兩個(gè)新版本。
KNIME適用于Windows、macOS和Linux設(shè)備。
鏈接:https://www.knime.com/knime-analytics-platform
3.OpenRefine
OpenRefine前身是Google OpenRefine,可幫助企業(yè)處理凌亂的數(shù)據(jù)。谷歌在2012年停止支持該項(xiàng)目,但該軟件并未停供,由自愿者定期更新。OpenRefine可對(duì)數(shù)據(jù)執(zhí)行眾多任務(wù),包括清理、轉(zhuǎn)換和格式化數(shù)據(jù),讓數(shù)據(jù)更適合數(shù)據(jù)分析和探索。該工具還讓用戶能夠從外部Web服務(wù)獲取數(shù)據(jù),對(duì)來(lái)自各數(shù)據(jù)源的數(shù)據(jù)進(jìn)行調(diào)和及匹配。
OpenRefine不是最適合大型數(shù)據(jù)庫(kù)的工具,但對(duì)許多企業(yè)來(lái)說(shuō)仍是一種重要的、備受好評(píng)的選擇,這是由于分析員們經(jīng)常把大量的時(shí)間花在清理數(shù)據(jù)用于預(yù)測(cè)模型上。
OpenRefine可以下載到Windows、macOS和Linux上。
4.Orange
Orange是一款開源數(shù)據(jù)分析和可視化工具,在斯洛文尼亞的盧布爾雅那大學(xué)開發(fā)而成。用戶可以通過(guò)可視化編程或Python腳本在終端窗口中挖掘數(shù)據(jù);探索靜態(tài)分布、箱形圖或散點(diǎn)圖;以及利用決策圖、層次聚類、熱圖和線性預(yù)測(cè),更深入地鉆研數(shù)據(jù)。
Orange的圖形用戶界面讓用戶能夠?qū)W⒂谔剿餍詳?shù)據(jù)分析,而不是編寫代碼。該工具還擁有用于機(jī)器學(xué)習(xí)的組件和擴(kuò)展數(shù)據(jù)挖掘功能的附件,以執(zhí)行自然語(yǔ)言處理、文本挖掘、生物信息學(xué)、網(wǎng)絡(luò)分析以及相關(guān)的規(guī)則挖掘。
Orange支持Windows、macOS和Linux。
5.R
R編程語(yǔ)言廣泛用于統(tǒng)計(jì)方法中的研究。企業(yè)組織還能充分利用用于數(shù)據(jù)處理、計(jì)算和圖形顯示的集成軟件套件。關(guān)鍵的統(tǒng)計(jì)功能包括:線性和非線性建模、經(jīng)典統(tǒng)計(jì)測(cè)試、時(shí)間序列分析、分類和聚類。
R在Unix、Windows和macOS上運(yùn)行。
6.Tableau Public
Tableau Public是一款數(shù)據(jù)分析和可視化軟件,讓用戶能夠向Web發(fā)布交互式數(shù)據(jù)。免費(fèi)版Tableau僅限于1GB的數(shù)據(jù)存儲(chǔ)和100萬(wàn)行數(shù)據(jù)。Tableau Public具有簡(jiǎn)潔性和界面直觀的優(yōu)點(diǎn),因而成為***的數(shù)據(jù)分析工具之一。
Tableau Public可挖掘來(lái)自Google Sheets、微軟Excel、CSV文件、JSON文件、靜態(tài)文件、空間文件、Web數(shù)據(jù)連接件和OData的數(shù)據(jù)。用戶可以生成在社區(qū)媒體上共享或嵌入到網(wǎng)站上供公眾訪問(wèn)的交互式圖形、圖表和地圖。Tableau Public可以下載到Windows和macOS上。
鏈接:https://public.tableau.com/en-us/s/download
7.Trifacta Wrangler
Trifacta Wrangler是另一款旨在幫助數(shù)據(jù)分析員清理和準(zhǔn)備來(lái)自諸多數(shù)據(jù)源的凌亂數(shù)據(jù)的軟件。一旦數(shù)據(jù)集導(dǎo)入到Trifacta Wrangler,該軟件就會(huì)自動(dòng)整理數(shù)據(jù),并自動(dòng)確定結(jié)構(gòu)。機(jī)器學(xué)習(xí)算法可建議常見的轉(zhuǎn)換和聚合,有助于準(zhǔn)備數(shù)據(jù)用于更詳細(xì)的分析。
Trifacta Wrangler可從微軟Excel、JSON文件和原始的CSV文件導(dǎo)入數(shù)據(jù)。該工具還可分析數(shù)據(jù),表明多少百分比的行存在值缺失、不匹配或不一致的情況,并按類型對(duì)數(shù)據(jù)進(jìn)行直觀地分類,比如日期或時(shí)間、字符串或與每個(gè)數(shù)據(jù)點(diǎn)有關(guān)的IP地址。Trifacta Wrangler僅限于100MB數(shù)據(jù),可以下載到Windows和macOS設(shè)備上。
鏈接:https://www.trifacta.com/products/wrangler/
原文標(biāo)題:Best free data analytics tools, 2018,作者:Matt Kapko
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】