如何理解數據分析和大數據之間的關系
首先,大數據經過多年的發展已經形成了一個完整的產業鏈和技術鏈,大數據的產業鏈是圍繞技術鏈來打造的,而大數據的技術鏈則圍繞數據價值化這個中心來展開,涉及到數據的采集、存儲、安全、分析、呈現和應用,所以當前的大數據已經不僅僅是一個概念了,而是代表了一系列技術的整合體。
從大數據的技術鏈來看,數據分析是其中的重要一環,也是目前大數據價值化的核心環節,所以很多人也把大數據就理解為數據分析了。雖然數據分析比較重要,但是在大數據時代,要想學習數據分析也需要掌握一系列大數據技術,包括大數據平臺知識、統計學知識和機器學習知識,目前統計學和機器學習是大數據分析的兩種基本形式。
從崗位劃分上來看,大數據領域目前的崗位主要集中在三個領域,分別是大數據開發崗、大數據分析崗和大數據運維崗位,目前大數據開發崗的人才缺口相對比較大,所以目前很多大數據方向的研究生也會選擇開發崗,雖然大數據分析崗位也不少,但是崗位競爭還是非常激烈的,很多博士研究生也比較愿意選擇分析崗(算法崗)。
從知識結構上來看,學習大數據分析和學習大數據開發還是有區別的,大數據開發比較側重程序設計能力,而數據分析則比較側重算法知識的學習和運用,目前很多團隊也要求算法工程師要具備一定的編程能力。
最后,學習數據分析對于數學基礎的要求相對比較高,所以如果數學基礎比較薄弱,可以考慮一下開發方向和運維方向。