成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數據分析師技能加點攻略

大數據 數據分析
我做分析的過程中經常用到的一些理論,工具和技能。如果把數據分析當作功夫,那么技能是外功,理論是內功,工具是裝備。

[[389690]]

越來越多的小伙伴想要入行或者轉行大數據分析,各種文章,課程五花八門可讓人看花了眼,兜兜轉轉之后感覺要么學了用不上,要么用的時候還沒學,作為互聯網數據分析老鳥,本次將結合自己的實際工作給大家一些建議,讓大家在入門數據分析的過程中少走彎路,本章節將分為 三個部分,數據分析技能必備,數據分析理論基礎,數據分析常用工具匯總,希望可以幫到大家。

數據分析技能必備

EXCEL

【百度百科】Microsoft Excel是Microsoft為使用Windows和Apple Macintosh操作系統的電腦編寫的一款電子表格軟件。直觀的界面、出色的計算功能和圖表工具,再加上成功的市場營銷,使Excel成為最流行的個人計算機數據處理軟件。

EXCEL非常重要這一點大家都比較清楚,同時EXCEL是一個學習其他技能的基礎。當我們用sql/pyhton處理數據的時候其實并不能看到數據底層的處理過程,通過類比excel來類比學習sql/python能夠理解地更加深刻這些語言。把excle的數據處理過程搞明白了,再學python,sql就事半功倍了。

推薦書籍:網上資料多的是,各種長短視頻,選擇自己喜歡的一類堅持看就好

SQL

【百度百科】結構化查詢語言(Structured Query Language)簡稱SQL,是一種特殊目的的編程語言,是一種數據庫查詢和用于存取數據以及查詢、更新和管理關系數據庫系統

數據分析師取數據用的最多的語言就是SQL。SQL家族有幾個兄弟,比如hql(用hive提取),sparksql(用spark提取),mysql等等。雖然sql的種類多,可畢竟沾親帶故,他們依然保留sql的基本語法和結構,正所謂“味徒不同,其實葉相似”,學會了最基本的SQL語法就可以一通百通了。有些人說sql很簡單吶,幾天就學會了,于是花了幾天時間,把demo寫的66的,可真正工作需要的時候,就會有種學廢的感覺。其實寫好sql也沒有那么簡單,有一些套路和規范,在以后的文章中我會逐一呈現給大家。

推薦:《SQL基礎教程》兩冊

Python

【百度百科】Python是一種跨平臺的計算機程序設計語言。是一個高層次的結合了解釋性、編譯性、互動性和面向對象的腳本語言。最初被設計用于編寫自動化腳本(shell),隨著版本的不斷更新和語言新功能的添加,越多被用于獨立的、大型項目的開發。

上面的百科對我們數分來說有點太遠了,咱們做數分的掌握一門編程語言那可好裝備了一身鋼鐵俠戰衣。分析的工具有n多種,但是python基本上都有可實現的類似功能。統計常用的包pandas,作圖常用的pyecharts,機器學習常用的sklearn等等。除了可以直接套用的功能之外,學會寫代碼可以輕松幫我們實現用sql和excle不好處理的復雜邏輯。那有同學會問僅學python不就可以了么,當然不是的,每種工具都有自己擅長的場景,在選擇工具過程中需要我們做到因地制宜,沒有必要用高射炮打蚊子,也不可用殺雞刀宰牛。

推薦:《利用python進行數據分析》,《python》圖靈。學python萬萬不可只看書,這玩意是練出來的。

理論基礎

概率與統計

【百度百科】數理統計是應用概率的理論研究大量隨機現象的規律性,對通過科學安排的一定數量的實驗所得到的統計方法給出嚴格的理論證明,并判定各種方法應用的條件以及方法、公式、結論的可靠程度和局限性,使人們能從一組樣本判定是否能以相當大的概率來保證某一判斷是正確的,并可以控制發生錯誤的概率。

概率和統計第一次讓我感受到數學對數據分析的重要性,剛入行特別迷茫的時候把概率統計看了至少10遍,越看越有意思,從中抽取了許多可以直接應用于分析的理論工具。概率和統計總是結伴而行其實是有原因的。就我個人的理解,概率和統計的關系相當于連城訣里面神照經與連城劍法的關系。連城劍法作為套路可以單獨練習,有了神照經內功的加持方能施展真正的威力。同樣概率是統計的理論基礎,統計是在概率基礎上衍生出來的工具,兩者結合是真的香。概率的實際應用在之后的課程中也會分享給大家。

推薦:《概率論與數理統計》,B站浙大《概率論與數理統計》

邏輯學

邏輯是認識客觀世界,表達思維和論證思想的工具,是學習其他學科的基礎。

邏輯是一種內功,不僅僅做數據要講究邏輯,做其他事情也都要從邏輯出發。俗話說,謀定而后動,這句話對于做數據來說尤為在理。數據分析的過程就是從目的出發構建一顆邏輯樹的過程。分析師需要從根出發到葉子節點,不斷地驗證關鍵節點信息,不斷修枝建枝,最終把結果以最直觀,簡潔而優美地方式呈現出來。而且一個優秀的數據分析師不僅僅要自己邏輯清晰明了,表達和論證能力也非常重要,邏輯學正是提升這方面能力的利器,用過都說好。

推薦:《符號邏輯學》(B站),《西方哲學史》,《金字塔原理》,《有用的邏輯學》等

運籌學

【百度百科】運籌學,是現代管理學的一門重要專業基礎課。它是20世紀30年代初發展起來的一門新興學科,其主要目的是在決策時為管理人員提供科學依據,是實現有效管理、正確決策和現代化管理的重要方法之一。該學科應用于數學和形式科學的跨領域研究,利用統計學、數學模型和算法等方法,去尋找復雜問題中的最佳或近似最佳的解答。

這本書每個章節都講述了關于某類問題的數學模型和解決方案,比如背包問題講究如何權衡收益與資源,最短路問題講究如何找到關鍵路徑直達目的地。這些理論雖然可能學起來枯燥無味,但當懂了它在說什么,就會潛移默化中能改變人的思維方式。舉個簡單的栗子,比如要做一個項目有n步,每一步又有m個方案,如果沒有動態規劃的思維在里面,就有可能會在某一步上為求最優解而浪費對于整體來說寶貴的資源。當然運籌學在實際中有很多應用,在渠道調控的過程中就用到了運籌學的知識,并取得了良好的效果

推薦:胡運權《運籌學教程》

工具使用

sublime&Notepad++

【百度百科】Sublime Text 是一個文本編輯器,它最初被設計為一個具有豐富擴展功能的Vim。Sublime Text具有漂亮的用戶界面和強大的功能,例如代碼縮略圖,Python的插件,代碼段等。還可自定義鍵綁定,菜單和工具欄。Sublime Text 的主要功能包括:拼寫檢查,書簽,完整的 Python API , Goto 功能,即時項目切換,多選擇,多窗口等等。

Notepad++是Windows操作系統下的一套文本編輯器,有完整的中文化接口及支持多國語言編寫的功能(UTF8技術)。Notepad++功能比 Windows 中的 Notepad(記事本)強大,除了可以用來制作一般的純文字說明文件,也十分適合編寫計算機程序代碼。Notepad++ 不僅有語法高亮度顯示,也有語法折疊功能,并且支持宏以及擴充基本功能的外掛模組。

這兩個文本編輯器是大部分人的選擇,也基本能實現我們一般的工作需求,有些同學會問那還要啥自行車,下面自行車來了~

typora

在案例這款自(bian行(ji)車(qi)之前,先介紹一個概念-Markdown

【百度百科】Markdown是一種輕量級標記語言。它允許人們使用易讀易寫的純文本格式編寫文檔,然后轉換成有效的XHTML(或者HTML)、PDF文檔。這種語言吸收了很多在電子郵件中已有的純文本標記的特性。由于Markdown的輕量化、易讀易寫特性,并且對于圖片,圖表、數學式都有支持,目前許多網站都廣泛使用Markdown來撰寫幫助文檔或是用于論壇上發表消息

當然word也可以實現這個功能,而且對本文的編輯處理更強,能用word干的活為啥還要用markdown呢,這個問題在于word功能強大是其優點也是缺點,強大的功能使其更有通用性,但是細分領域卻不那么方便。markdown像是對word常用功能做了模板和格式化,比如標題,內容,字體等等,能夠讓人更加專注于文章的結構和內容,快速而省心編輯文本。

而typora就是這么一款markdown編輯器

我個人比較喜歡這個軟件(也是一直在用的一款)的原因主要有以下兩點:

第一,在排版方面,typora支持代碼塊,圖片,表格等等元素。在做分析的過程中將python或者sql放入代碼塊,數據結果和圖表也可以整合在一起,對整個項目和分析的管理更加方便,這也是typora相比sublime的優點。

第二,目錄

typora擁有文件和目錄兩個視圖,一般我在文件視圖中創建項目,然后轉入大綱視圖,一邊寫文章一邊梳理分析邏輯,一邊整理內容,真正讓人不再去關心格式專注于寫作本身

當然typora也有其缺點

第一,沒有自動補全代碼的聯想功能(這卻極大地提升了打字速度)

第二,默認的高亮顯示不清晰(windows版本的sql腳本的關鍵字高亮幾乎是和沒有一樣),對于像我這樣的色弱十分不友好,這兩點sublime支持地就很好,所以一般sublime和typora聯合起來用

這編(zi)輯(xing)器(che)已經很好用了,有同學會說還要啥手表,但是各位,下面上手表

jupyter

剛才咱們也說了要好好學python,學完python之后一說到寫代碼就是什么pycharm。如果說pycharm相當于word那么,jupyter就相當于typora。咱們往下看。

【百度百科】:Jupyter Notebook(此前被稱為 IPython notebook)是一個交互式筆記本,支持運行 40 多種編程語言。Jupyter Notebook 的本質是一個 Web 應用程序,便于創建和共享文學化程序文檔,支持實時代碼,數學方程,可視化和 markdown。用途包括:數據清理和轉換,數值模擬,統計建模,機器學習等等。

劃重點1,用途包括:數據清理和轉換,數值模擬,統計建模,機器學習等等

劃重點2,markdown,剛才我們已經介紹過了

直接上菜:


從截圖中可以看到,jupyter和typora非常相似,所以也是很適合做數據分析的工具,而且jupyter可以直接運行代碼(這是句廢話)。大多數數據分析師用的比較多的編譯器是jupyter,而非pycharm。

Xmind

搞數據的重要的還是邏輯思維能力,而不是僅專注于花里胡哨的技能,說到思維能力就不得不提xmind這款非常有用的思維輔助工具

【百度百科】:XMind 是一款非常實用的商業思維導圖軟件,應用全球最先進的Eclipse RCP 軟件架構,全力打造易用、高效的可視化思維軟件,強調軟件的可擴展、跨平臺、穩定性和性能,致力于使用先進的軟件技術幫助用戶真正意義上提高生產率。

說到思維導圖,咱們再介紹一個網站-https://www.processon.com/ 。process on有大量的腦圖模板和分享(這不是廣告貼),希望大家可以去看看。下面直接上菜:


總結一下

以上就是我做分析的過程中經常用到的一些理論,工具和技能。如果把數據分析當作功夫,那么技能是外功,理論是內功,工具是裝備。其中技能和工具主要在分析的過程中加以磨練,但是理論不學習是真的不會自己跑到腦子里面,現在的數分市場也越來越成熟,大家在平時一定要主要理論知識的積累與應用,師兄也會寫一些這方面的文章來共同探討學習。

數據分析雖然入門容易,但是天花板卻是比較高。數據分析要有寬廣的視角,敏銳的洞察以及實操的落地能力。在成長過程中做到內外齊修,兼顧陰陽。

 

責任編輯:姜華 來源: 數師兄
相關推薦

2023-07-28 14:48:00

數據分析效果

2020-07-20 07:00:00

數據分析師數據分析大數據

2019-02-20 17:55:45

數據分析師技能管理

2016-10-21 14:41:22

數據分析師大數據

2023-07-08 23:05:01

數據分析運營

2015-08-18 13:26:05

數據分析

2020-05-12 10:44:19

數據分析師薪資數據

2012-08-08 09:00:29

數據分析師

2015-08-17 09:39:40

大數據

2021-09-30 07:25:32

數據分析數據分析師工具

2012-08-07 17:32:25

數據分析師

2015-08-06 14:02:31

數據分析

2017-05-11 10:05:47

數據分析excelPython

2017-05-11 10:35:51

數據分析語言學習

2017-02-13 19:25:24

2015-04-03 11:19:21

大數據大數據分析師

2013-07-29 15:58:28

大數據數據分析

2015-08-19 13:50:19

數據分析

2016-11-11 20:38:39

數據分析師大數據

2017-08-01 20:50:45

大數據數據分析技能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线观看欧美日韩视频 | 一区二区三区四区免费视频 | 91精品国产91久久久久久不卞 | 黑人性hd | 一道本不卡 | 黄色一级视频免费 | 精品一区二区三区在线观看国产 | 99精品九九 | 中文二区 | 亚洲精彩视频在线观看 | 国产免费一区 | 日韩网站免费观看 | 视频在线一区二区 | 免费一区二区三区 | 一级毛片视频 | 精品久 | 久久久精彩视频 | 中文字幕成人在线 | 日韩av在线不卡 | 亚洲+变态+欧美+另类+精品 | 国产一级片免费看 | 亚洲欧美中文日韩在线v日本 | 国产一区二区影院 | av一区二区三区四区 | 成人高潮片免费视频欧美 | 国产成人在线视频播放 | 欧美日韩高清在线一区 | 天天插天天操 | 国产一级片在线播放 | 欧美视频成人 | 欧美一级毛片久久99精品蜜桃 | 免费福利视频一区二区三区 | 国产免费拔擦拔擦8x高清 | 不卡的av一区 | 亚洲啊v | 国产午夜视频 | 亚洲视频中文字幕 | 久久九精品 | 日韩成人免费视频 | 一区二区三区中文字幕 | 亚洲精品一区二区网址 |