成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

寫給新人的數據庫入門指南

數據庫 MySQL
客觀原因是絕大部分數據分析崗都有SQL技能的要求。企業里面為了保證數據的安全性和管理的方便,數據都是統一存放在數據庫中,從數據庫中提取和查詢數據需要使用SQL語言,甚至有的公司就是用SQL語言來做數據分析。

寫給新人的數據庫入門指南

經常有剛從事數據分析的職場萌新,問我做數據分析工作要學些什么,應該怎樣規劃學習路徑。我會告訴他:如果你Excel還用的不溜的話,就先學學Excel,當你用Excel處理和分析一些小數據集沒有問題的時候(具體表現就是:常用函數公式信手拈來,數據透視表,篩選,排序,圖表繪制操作熟練),你就去學習SQL語言,然后用BI去分析去熟悉業務。然后到了一定階段,你可以上手R或者Python。后面如果你能更進一步,可以去了解一些Spark等大數據框架。

為什么要學習Excel?

首先Excel是我們最常用的數據分析和處理工具,Excel的功能非常豐富,基本可以涵蓋我們在之后在其它軟件(SQL、BI、Python、R)中要學到的那些功能。

有的人可能會問,既然Excel這么強大,為什么還要學其它的工具?這是因為Excel是通過菜單的形式來進行操作的,很難實現自動化和功能復用,當然你也可以通過VBA來實現,用VBA也就是編程了,不過因為VBA這種語言學會了基本只能在office軟件中使用,學習的投入成本和產出收益不成比例,不推薦學習,這是客觀原因之一;另外就是Excel在處理比較大的數據集的時候,性能很差,并且經常崩潰。(雖然Excel2013及以上版本宣稱可以容納100+萬條記錄,但幾萬條數據就開始卡頓了)。

為什么Excel學完要學SQL?

客觀原因是絕大部分數據分析崗都有SQL技能的要求。企業里面為了保證數據的安全性和管理的方便,數據都是統一存放在數據庫中,從數據庫中提取和查詢數據需要使用SQL語言,甚至有的公司就是用SQL語言來做數據分析。

另外一個原因就是即使你先學了其它的工具,比如R,Python,甚至Spark等大數據框架,你會發現你還是得學習SQL。如果你先學習SQL,那么很多概念你都能在學習R,Python,Spark等更加復雜的工具之前弄清楚。對于后面的學習會有幫助。這就好比建房子,都是先打地基,然后一層一層的蓋。

SQL語言的學習排在Excel之后,其它工具之前,還有一個很重要的原因就是,SQL可以在一定程度上幫Excel解決大數據集的問題,同時架起一個通往其它工具的橋梁。

關于數據庫和SQL的學習,也是分為兩篇,前一篇講數據庫以及表的概念。第二篇是SQL語句的掌握和數據庫的操作。

一、數據庫基礎知識

先談一下我對數據庫的理解。數據庫顧名思義就是數據的集合,是由一張張數據表組成的。

放在物理實體上,是一堆寫在磁盤上的文件,文件中有數據。這些最基礎的數據組成了表(table),我們把它想象成一張Excel的sheet,如下圖:

寫給新人的數據庫入門指南

 

每一張表都有一個標識,即主鍵,也就是ID。ID是數據庫中重要的概念,叫做主鍵,用來表示數據的僅有性。就相當于我們的身份的證件,是僅有的,有了它,就知道數據在哪了。

ID通常沒有業務含義,就是一種僅有標識,每張表只能有一個主鍵,且主鍵通常是整數,主鍵一旦設立,值通常不允許修改。

數據庫是表的集合。一個數據庫中可以放多張表,我們給每張表命名,表與表之間能互相聯系。聯系就是數據能夠對應匹配,正式名稱叫聯接,對應的操作叫做Join,我們想象成Excel中的vlookup。

寫給新人的數據庫入門指南

 

比如上面兩張圖,左圖是學生信息表,右圖是老師信息表。左圖的主鍵是學生ID,右圖的主鍵是老師ID。細心的讀者可能發現右圖還有一個學生ID,這里的學生ID是專門用來聯接用戶表的,它并不是主鍵。只不過兩張表通過學生ID這個僅有信息來關聯。

但兩張表關聯也并不是信息能一一對應的,也會存在空缺的時候,比如:

寫給新人的數據庫入門指南

 

那兩表建立連接就會變成:

寫給新人的數據庫入門指南

 

了解上面的概念,你就知道什么叫關系型數據庫。簡單說,它是由多張能互相聯接的二維行列表格組成的數據庫。在數據準備時,我們通常要建立表關聯來分析。

關系型數據庫是基于關系代數模型發展而來,常用的關系型數據庫有SQL Server、MySQL、Oracle、DB2等,這個視企業使用為準,我們后續學習都以MySQL為主。

各關系型數據庫(不感興趣可跳過):

DB2: 關系型數據庫, 適用于大型的分布式應用系統, 確實是非常非常好的數據庫, 無論穩定性, 安全性, 恢復性等等都無可挑剔, 而且從小規模到大規模的應用都非常適合。但是使用起來覺得非常繁瑣, 安裝的時候要求頗多, 很多軟件都可能和DB2產生沖突, 因為一般DB2都是安裝在小型機或者服務器上的, 所以在PC上安裝很費事兒。新建一個庫需要設置很多東西, 分配各種各樣的存儲空間。

Oracle: 是目前市場占有率較大的數據庫, 我在學習SSH的時候用的就是Oracle, 安裝起來很繁瑣, 而且居然程序文件有3G之多... 用起來非常方便, 對于我這樣的初學者, 有很簡單的配置, 對于要求很高的企業級應用, 也有很復雜的配置和管理方法, 有很強大的數據字典, 可以說是最實用的數據庫了, 但是查了一下, 價格不菲...

MS SQL: 當初用的是2000和2005版, 這兩個版本差了很多。2000的數據庫做的不錯, 程序很小, 操作簡單, 功能較全, 算是各方面都很中庸的數據庫吧, 是中型數據庫, 我的畢業設計就是用MS SQL 2000做的。2005中加入了很多功能, 復雜多了, 有大型數據庫的風范了, 而且價格也變高了, 個人覺得除非用的是Window Server 系統或者針對Microsoft產品, 否則不如用Oracle好。

MySQL: MySQL是一個很好的關系型數據庫, 免費, 而且功能很全, 程序又小, 安裝簡單, 現在很多網站都用MYSQL, 在字段約束上做的差了點兒, 其他的都不錯, 和MS SQL 用著差不多。

Access: 典型的桌面數據庫, 覺得做個單機系統, 比如記賬, 記事兒什么的還成, 在局域網里跑個小系統都夠嗆, 數據源連接很簡單, 因為是Office的數據庫, 所以Windows自帶數據源。

更多關于數據庫的知識,看一本《數據庫系統概論》就夠了。

二、嘗試使用MySQL數據庫

如果還沒有接觸過數據庫或者說SQL,推薦大家下載并安裝MySQL數據進行嘗試,MySQL數據庫的下載安裝比較簡單,安裝完成就可以使用。

可以訪問MySQL官網進行下載,網址如下(這里給出的是Windows版下載地址):「鏈接」

寫給新人的數據庫入門指南

 

下載MySQL時,需要進行免費注冊,注冊頁面是英文的。下載該工具后,點擊運行,這個程序就能夠聯網自動為你安裝MySQL,并自動進行配置。在安裝過程中,需要你設置密碼,自己設置一個登陸密碼,并記住,下次登陸MySQL時,需要這個密碼。

解壓之后沒有my.ini文件(我的端口設置的3308),截圖中是我增加的。

寫給新人的數據庫入門指南

 

管理員命令行:

在MySQL安裝目錄的 bin 目錄下執行命令: 

  1. mysqld --initialize --console 

得到如下結果:

寫給新人的數據庫入門指南

 

看到有個警告,查了一下mysql建議使用utf8mb4

修改my.ini文件

寫給新人的數據庫入門指南

 

警告沒有了,上面打印了默認密碼:nj>uUJkpH4/I

然后,安裝服務: 

  1. mysqld --install MySQL8.0 

因為這是電腦上第二個mysql 所以服務名改成了 MySQL8.0

寫給新人的數據庫入門指南

 

啟動服務: 

  1. net start MySQL8.0 

寫給新人的數據庫入門指南

 

修改初始密碼

登錄mysql之后執行: 

  1. ALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY '123456'

寫給新人的數據庫入門指南

 

將MySQL和Excel或者其它數據分析工具連接起來

默認安裝的情況下,有一個插件允許MySQL數據庫和Excel相連接,試想一下,我們在MySQL數據庫中通過SQL語言進行大量數據的處理和計算,將計算結果存放在特定的數據表中,再通過Excel連接上MySQL數據庫,將數據讀取到Excel中,用Excel進行分析并繪制圖表,免去了將數據從數據庫導出再導入Excel的麻煩,是不是就可以提高效率了呢?

后面會分享一篇通過ODBC驅動程序連接一些報表BI工具來做分析的操作。

關于MySQL的學習推薦書籍《MySQL必知必會》。 

責任編輯:龐桂玉 來源: 今日頭條
相關推薦

2025-01-27 07:00:00

數據庫數據庫管理系統MySQL

2017-11-08 09:22:36

數據庫NoSQLArangoDB

2017-06-26 09:15:39

SQL數據庫基礎

2010-12-30 10:04:49

Linux入門

2023-12-13 11:23:15

2023-12-19 09:36:35

PostgreSQL數據庫開源

2020-05-11 09:54:33

JavaScript開發技術

2025-05-20 07:00:37

2023-11-08 08:32:16

2010-12-03 11:14:58

IT人

2019-11-20 09:08:46

PostgreSQL數據庫

2010-08-10 15:02:18

Oracle認證數據庫

2010-04-19 13:12:36

Oracle 9i數據

2015-11-18 17:06:53

風控大數據挖掘

2011-07-04 09:12:53

數據庫采購

2019-01-15 09:00:27

人工智能AIML

2013-03-28 10:22:33

數據庫關系型數據庫數據庫設計

2010-06-13 11:29:51

MySQL數據庫

2023-09-26 15:50:21

2020-07-07 10:34:57

設計師工作互聯網設計
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产91九色 | 91精品成人久久 | 亚洲一区二区免费 | 一级a毛片 | 视频1区2区 | www.日本在线观看 | 国产精品区一区二区三 | 国产黄色在线 | 97国产精品视频人人做人人爱 | 在线永久看片免费的视频 | 中文亚洲字幕 | 黄色a三级 | 视频一区在线观看 | 国产精品免费一区二区三区 | 久久久精品一区二区 | 欧美精品一二三区 | 成人高清在线视频 | 亚洲欧美在线观看 | 欧美日韩视频在线第一区 | 激情欧美日韩一区二区 | 久久国内精品 | 国产精品三级久久久久久电影 | 国产激情综合五月久久 | 国产精品日韩一区二区 | 狠狠的日| 日韩精品一区二区三区 | 91麻豆精品国产91久久久更新资源速度超快 | 一区二区成人 | 男女污网站 | 中文精品视频 | 亚洲综合大片69999 | 亚洲aⅴ| 欧美精品一区三区 | 一区二区三区欧美在线 | 国内精品久久久久久 | 日韩在线小视频 | 日韩中文字幕在线视频观看 | 精品福利在线 | 日韩精品久久久久久 | 午夜影院在线观看 | 国产精品久久久久久久久久久久久 |