大數據分析--R語言開始之旅
R的源起
R是S語言的一種實現。S語言是由 AT&T貝爾實驗室開發的一種用來進行數據探索、統計分析、作圖的解釋型語言。最初S語言的實現版本主要是S-PLUS。S-PLUS是一個商業 軟件,它基于S語言,并由MathSoft公司的統計科學部進一步完善。后來Auckland大學的Robert Gentleman 和 Ross Ihaka 及其他志愿人員開發了一個R系統。R的使用與S-PLUS有很多類似之處,兩個軟件有一定的兼容性。
R is free
R是用于統計分析、繪圖的語言和操作環境。R是屬于GNU系統的一個自由、免費、源代碼開放的軟件,它是一個用于統計計算和統計制圖的優秀工具。
R是一套完整的數據處理、計算和制圖軟件系統。其功能包括:數據存儲和處理系統;數組運算工具(其向量、矩陣運算方面功能尤其強大);完整連貫的統計分析工具;優秀的統計制圖功能;簡便而強大的編程語言:可操縱數據的輸入和輸入,可實現分支、循環,用戶可自定義功能。
R是一個免費的自由軟件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免費下載和使用的,在那兒可以下載到R的安裝程序、各種外掛程序和文檔。在R的安裝程序中只包含了8個基礎模塊,其他外在模塊可以通過CRAN獲得。
R的特點
(1) 有效的數據處理和保存機制。
(2) 擁有一整套數組和矩陣的操作運算符。
(3) 一系列連貫而又完整的數據分析中間工具。
(4) 圖形統計可以對數據直接進行分析和顯示,可用于多種圖形設備。
(5) 一種相當完善、簡潔和高效的程序設計語言。它包括條件語句、循環語句、用戶自定義的遞歸函數以及輸入輸出接口。
(6) R語言是徹底面向對象的統計編程語言。
(7) R語言和其它編程語言、數據庫之間有很好的接口。
(8) R語言是自由軟件,可以放心大膽地使用,但其功能卻不比任何其它同類軟件差。
(9) R語言具有豐富的網上資源
R語言環境安裝
接下來從R語言的安裝折騰起(本人使用的是win7 32位,其他平臺可觸類旁通)。
R語言的安裝文件可以在http://www.r-project.org/下 載。
頁面的左側點擊“CRAN”(Comprehensive R Archive Network)即可。
C*AN是大多數自由軟件采用的發布方式,除了R以外還有為TeX準備的CTAN,為Perl弄的CPAN等等。CRAN在世界各 地有很多鏡像,中國的中科院,廈大,中科大等都有鏡像。
下載好安裝文件后即可直接安裝,不過要注意以下兩點:
把默認安裝目錄中的R版本號去掉,比如要是R告訴你裝在C:/Program Files/R/R-3.0.0/,不要接受這個結果,把它改成C:/Program Files/R/。這個對于后面安裝RStudio和knitr等都有一些關系。
避免安裝在中文目錄下。這可以避免很多不必要的編碼問題。
安裝完成后,桌面會有一個R應用快捷方式。雙擊打開
>help.start() 開啟幫助文檔
安裝RStudio
推薦在安裝完R語言后安裝RStudio。RStudio是一個R語言的IDE(integrated development environment),集合了各種功能,并且也是跨平臺和開源的。http://www.rstudio.com/ide/download/
現在提供桌面板和服務器版,個人用戶下載做桌面版即可。下載完成后安裝在默認的安裝 目錄,然后就可以使用了
>help.start() 開啟幫助文檔
原文鏈接:http://quasimodo-es.iteye.com/blog/1851000
【編輯推薦】