成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何使用Python將MySQL表數據遷移到MongoDB集合

譯文
云計算 MongoDB
本文詳細的講解了如何在需要的地方獲取MySQL 數據。

[[410477]]

【51CTO.com快譯】介紹

MySQL 是一個 RDBMS 平臺,它以規范化的方式以表格格式存儲數據,而 MongoDB 是一個 NoSQL 數據庫,它以無模式的方式將信息存儲為按集合分組的文檔。數據的表示方式完全不同,因此將 MySQL 表數據遷移到 MongoDB 集合聽起來可能是一項艱巨的任務。但是,Python 憑借其強大的連接性和數據處理能力讓這一切變得輕而易舉。

在本文中,將詳細的講解如何使用簡單的 Python 腳本將 MySQL 表數據遷移到 MongoDB 集合所需的步驟。這些腳本是在 Windows 上使用 Python 3.9.5 開發的。但是,它應該適用于任何平臺上的任何 Python 3+ 版本一起使用。

步驟 1:安裝所需的模塊

第一步是安裝連接MySQL 和 MongoDB 數據庫實例所需的模塊。我們將使用mysql.connector連接到 MySQL 數據庫。對于 MongoDB,使用pymongo,這是從 Python 連接到 MongoDB 的推薦模塊。

如果所需模塊尚未安裝,請運行以下PIP命令來安裝它們。

  1. pip 安裝 mysql 連接器 pip 安裝 pymongo 

PIP 是 Python 包或模塊的包管理器。

步驟2:從MySQL表中讀取數據

第一步是從源 MySQL 表中讀取數據,并以可用于將數據加載到目標 MongoDB 數據庫中的格式進行準備。MongoDB 是一個 NoSQL 數據庫,它將數據存儲為 JSON 文檔,因此最好以 JSON 格式生成源數據。值得一提的是,Python 具有強大的數據處理能力,可以輕松地將數據轉換為 JSON 格式。

  1. import mysql.connector  
  2. mysqldb = mysql.connector.connect(    host="localhost",    database="employees",    user="root",    password="" ) 
  3. mycursor = mysqldb.cursor(dictionary=True) mycursor.execute("SELECT * from categories;") myresult = mycursor.fetchall()  
  4. print(myresult) 

當腳本在沒有任何錯誤的情況下完成時,輸出的結果如下:

  1.    { 
  2.       "id":4
  3.       "name":"Medicine"
  4.       "description":"<p>Medicine<br></p>"
  5.       "created_at":""
  6.       "updated_at":"" 
  7.    }, 
  8.    { 
  9.       "id":6
  10.       "name":"Food"
  11.       "description":"<p>Food</p>"
  12.       "created_at":""
  13.       "updated_at":"" 
  14.    }, 
  15.    { 
  16.       "id":8
  17.       "name":"Groceries"
  18.       "description":"<p>Groceries<br></p>"
  19.       "created_at":""
  20.       "updated_at":"" 
  21.    }, 
  22.    { 
  23.       "id":9
  24.       "name":"Cakes & Bakes"
  25.       "description":"<p>Cakes & Bakes<br></p>"
  26.       "created_at":d""
  27.       "updated_at":"" 
  28.    } 

請注意,輸出的是一個 JSON 數組,因為我們將dictionary=True參數傳遞給了游標。否則,結果將采用列表格式。現在有了 JSON 格式的源數據,就可以遷移到 MongoDB 集合。

步驟3:寫入 MongoDB 集合

獲得 JSON 格式的源數據后,下一步是將數據插入到 MongoDB 集合中。集合是一組文檔,相當于 RDBMS 中表(或關系)。我可以通過調用insert_many()集合類的方法來實現,該方法返回插入文檔的對象 ID 列表。請注意,當作為參數傳遞空列表時,此方法將引發異常,因此在方法調用之前進行長度檢查。

  1. import pymongo 
  2.  
  3. mongodb_host = "mongodb://localhost:27017/" 
  4. mongodb_dbname = "mymongodb" 
  5.  
  6. myclient = pymongo.MongoClient(mongodb_host) 
  7. mydb = myclient[mongodb_dbname] 
  8. mycol = mydb["categories"
  9.  
  10. if len(myresult) > 0
  11.         x = mycol.insert_many(myresult) #myresult comes from mysql cursor 
  12.         print(len(x.inserted_ids)) 

完成此步驟后,檢查一下 MongoDB 實例,以驗證數據庫和集合是否已創建,文檔是否已插入。注意MongoDB 是無模式的,這就意味著不必定義模式來插入文檔,模式是動態推斷并自動創建的。MongoDB 還可以創建代碼中引用的數據庫和集合(如果它們還不存在的話)。

步驟4:把數據放在一起

下面是從 MySQL 中讀取表并將其插入到 MongoDB 中集合的完整腳本。

  1. import mysql.connector 
  2. import pymongo 
  3.  
  4. delete_existing_documents = True 
  5. mysql_host="localhost" 
  6. mysql_database="mydatabase" 
  7. mysql_schema = "myschema" 
  8. mysql_user="myuser" 
  9. mysql_password="********" 
  10.  
  11. mongodb_host = "mongodb://localhost:27017/" 
  12. mongodb_dbname = "mymongodb" 
  13.  
  14. mysqldb = mysql.connector.connect( 
  15.     host=mysql_host, 
  16.     database=mysql_database, 
  17.     user=mysql_user, 
  18.     password=mysql_password 
  19.  
  20. mycursor = mysqldb.cursor(dictionary=True
  21. mycursor.execute("SELECT * from categories;"
  22. myresult = mycursor.fetchall() 
  23.  
  24. myclient = pymongo.MongoClient(mongodb_host) 
  25. mydb = myclient[mongodb_dbname] 
  26. mycol = mydb["categories"
  27.  
  28. if len(myresult) > 0
  29.         x = mycol.insert_many(myresult) #myresult comes from mysql cursor 
  30.         print(len(x.inserted_ids)) 

步驟 5:增強腳本以加載 MySQL 架構中的所有表

該腳本從 MySQL 中讀取一個表,并將結果加載到 MongoDB 集合中。然后,下一步是遍歷源數據庫中所有表的列表,并將結果加載到新的 MySQL 集合中。我們可以通過查詢information_schema.tables元數據表來實現這一點,該表提供給定模式中的表列表。然后可以遍歷結果并調用上面的腳本來遷移每個表的數據。

  1. #Iterate through the list of tables in the schema 
  2. table_list_cursor = mysqldb.cursor() 
  3. table_list_cursor.execute("SELECT table_name FROM information_schema.tables WHERE table_schema = %s ORDER BY table_name;", (mysql_schema,)) 
  4. tables = table_list_cursor.fetchall() 
  5.  
  6. for table in tables: 
  7.     #Execute the migration script for 'table' 

也可以通過將遷移邏輯抽象為一個函數來實現這一點。

  1. #Function migrate_table  
  2. def migrate_table(db, col_name): 
  3.     mycursor = db.cursor(dictionary=True
  4.     mycursor.execute("SELECT * FROM " + col_name + ";"
  5.     myresult = mycursor.fetchall() 
  6.  
  7.     mycol = mydb[col_name] 
  8.      
  9.     if delete_existing_documents: 
  10.         #delete all documents in the collection 
  11.         mycol.delete_many({}) 
  12.  
  13.     #insert the documents 
  14.     if len(myresult) > 0
  15.         x = mycol.insert_many(myresult) 
  16.         return len(x.inserted_ids) 
  17.     else
  18.         return 0 

步驟6:輸出腳本進度并使其可讀

腳本的進度是通過使用print 語句來傳達的。通過顏色編碼使輸出易于閱讀。例如,以將成功語句打印為綠色,將失敗語句打印為紅色。

  1. class bcolors: 
  2.     HEADER = '\033[95m' 
  3.     OKBLUE = '\033[94m' 
  4.     OKCYAN = '\033[96m' 
  5.     OKGREEN = '\033[92m' 
  6.     WARNING = '\033[93m' 
  7.     FAIL = '\033[91m' 
  8.     ENDC = '\033[0m' 
  9.     BOLD = '\033[1m' 
  10.     UNDERLINE = '\033[4m' 
  11.  
  12. print(f"{bcolors.HEADER}This is a header{bcolors.ENDC}"
  13. print(f"{bcolors.OKBLUE}This prints in blue{bcolors.ENDC}"
  14. print(f"{bcolors.OKGREEN}This message is green{bcolors.ENDC}"

最終結果

  • 源 MySQL 數據庫
  • 遷移后的目標 MongoDB 數據庫
  • 在VSCode 中的 Python 腳本和輸出

完整的腳本

  1. import mysql.connector 
  2. import pymongo 
  3. import datetime 
  4.  
  5. class bcolors: 
  6.     HEADER = '\033[95m' 
  7.     OKBLUE = '\033[94m' 
  8.     OKCYAN = '\033[96m' 
  9.     OKGREEN = '\033[92m' 
  10.     WARNING = '\033[93m' 
  11.     FAIL = '\033[91m' 
  12.     ENDC = '\033[0m' 
  13.     BOLD = '\033[1m' 
  14.     UNDERLINE = '\033[4m' 
  15.  
  16. begin_time = datetime.datetime.now() 
  17. print(f"{bcolors.HEADER}Script started at: {begin_time} {bcolors.ENDC}"
  18.  
  19. delete_existing_documents = True
  20. mysql_host="localhost" 
  21. mysql_database="mydatabase" 
  22. mysql_schema = "myschhema" 
  23. mysql_user="root" 
  24. mysql_password="" 
  25.  
  26. mongodb_host = "mongodb://localhost:27017/" 
  27. mongodb_dbname = "mymongodb" 
  28.  
  29. print(f"{bcolors.HEADER}Initializing database connections...{bcolors.ENDC}"
  30. print("") 
  31.  
  32. #MySQL connection 
  33. print(f"{bcolors.HEADER}Connecting to MySQL server...{bcolors.ENDC}"
  34. mysqldb = mysql.connector.connect( 
  35.     host=mysql_host, 
  36.     database=mysql_database, 
  37.     user=mysql_user, 
  38.     password=mysql_password 
  39. print(f"{bcolors.HEADER}Connection to MySQL Server succeeded.{bcolors.ENDC}"
  40.  
  41. #MongoDB connection 
  42. print(f"{bcolors.HEADER}Connecting to MongoDB server...{bcolors.ENDC}"
  43. myclient = pymongo.MongoClient(mongodb_host) 
  44. mydb = myclient[mongodb_dbname] 
  45. print(f"{bcolors.HEADER}Connection to MongoDB Server succeeded.{bcolors.ENDC}"
  46.  
  47. print(f"{bcolors.HEADER}Database connections initialized successfully.{bcolors.ENDC}"
  48.  
  49. #Start migration 
  50. print(f"{bcolors.HEADER}Migration started...{bcolors.ENDC}"
  51. dblist = myclient.list_database_names() 
  52. if mongodb_dbname in dblist: 
  53.     print(f"{bcolors.OKBLUE}The database exists.{bcolors.ENDC}"
  54. else
  55.     print(f"{bcolors.WARNING}The database does not exist, it is being created.{bcolors.ENDC}"
  56.  
  57. #Function migrate_table  
  58. def migrate_table(db, col_name): 
  59.     mycursor = db.cursor(dictionary=True
  60.     mycursor.execute("SELECT * FROM " + col_name + ";"
  61.     myresult = mycursor.fetchall() 
  62.  
  63.     mycol = mydb[col_name] 
  64.      
  65.     if delete_existing_documents: 
  66.         #delete all documents in the collection 
  67.         mycol.delete_many({}) 
  68.  
  69.     #insert the documents 
  70.     if len(myresult) > 0
  71.         x = mycol.insert_many(myresult) 
  72.         return len(x.inserted_ids) 
  73.     else
  74.         return 0 
  75.  
  76. #Iterate through the list of tables in the schema 
  77. table_list_cursor = mysqldb.cursor() 
  78. table_list_cursor.execute("SELECT table_name FROM information_schema.tables WHERE table_schema = %s ORDER BY table_name LIMIT 15;", (mysql_schema,)) 
  79. tables = table_list_cursor.fetchall() 
  80.  
  81. total_count = len(tables) 
  82. success_count = 0 
  83. fail_count = 0 
  84.  
  85. for table in tables: 
  86.     try
  87.         print(f"{bcolors.OKCYAN}Processing table: {table[0]}...{bcolors.ENDC}"
  88.         inserted_count = migrate_table(mysqldb, table[0]) 
  89.         print(f"{bcolors.OKGREEN}Processing table: {table[0]} completed. {inserted_count} documents inserted.{bcolors.ENDC}"
  90.         success_count += 1 
  91.     except Exception as e: 
  92.         print(f"{bcolors.FAIL} {e} {bcolors.ENDC}"
  93.         fail_count += 1 
  94.          
  95. print("") 
  96. print("Migration completed."
  97. print(f"{bcolors.OKGREEN}{success_count} of {total_count} tables migrated successfully.{bcolors.ENDC}"
  98. if fail_count > 0
  99.     print(f"{bcolors.FAIL}Migration of {fail_count} tables failed. See errors above.{bcolors.ENDC}"
  100.  
  101. end_time = datetime.datetime.now() 
  102. print(f"{bcolors.HEADER}Script completed at: {end_time} {bcolors.ENDC}"
  103. print(f"{bcolors.HEADER}Total execution time: {end_time-begin_time} {bcolors.ENDC}"

警告

該腳本適用于中小型 MySQL 數據庫,它有幾百個表,每個表有幾千行。對于具有數百萬行的大型數據庫,性能可能會受到影響。在開始實際遷移之前,請在表列表查詢和實際表select查詢上使用 LIMIT 關鍵字對有限行進行檢測。

下載 

帶點擊此處從 GitHub 下載整個腳本:
https://github.com/zshameel/MySQL2MongoDB

【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】

責任編輯:梁菲 來源: DZone
相關推薦

2017-10-20 08:45:15

數據庫MongoDBMySQL

2016-12-12 19:16:43

數據云端

2021-01-28 09:00:00

SQL數據庫NoSQL

2022-08-29 14:14:22

云計算云遷移數據分析

2016-11-11 00:00:16

MySQLOracle數據

2013-10-09 09:35:49

數據中心遷移虛擬化

2013-10-09 09:54:46

數據中心云計算

2019-03-25 12:20:29

數據MySQL性能測試

2009-08-06 09:20:30

2020-01-13 15:22:42

ERP云平臺遷移

2019-04-23 08:00:08

Azure微軟云遷移

2020-04-20 08:08:23

MongoDBElasticsear數據庫

2010-08-12 09:43:31

CassandraMongoDB

2018-07-10 14:46:04

LinuxShellsudo

2017-10-16 00:17:56

云計算信息管理遷移

2023-08-23 09:00:00

區塊鏈以太坊

2015-09-14 14:49:39

MySQLMariaDBLinux

2021-07-13 09:45:48

CentOSAlmaLinux命令

2020-12-02 14:38:21

SQL數據庫MySQL

2018-08-15 15:15:00

數據基礎設施遷移
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成在线人视频免费视频 | 国产成人av在线 | 亚洲在线观看视频 | 欧美一级片在线观看 | 欧美成年人视频在线观看 | 亚洲国产一区二区在线 | 自拍中文字幕 | 高清亚洲 | 四虎永久免费地址 | 欧美男人亚洲天堂 | 欧美一级视频在线观看 | 久久精品免费观看 | caoporn免费 | 欧美视频区 | 九九久久久 | a级大片 | 国产一区二区三区在线 | 欧美黄视频 | 高清欧美性猛交xxxx黑人猛交 | 欧美日韩亚洲国产综合 | 亚洲精品久久久久久国产精华液 | 国产视频一区二区三区四区五区 | 精品国产一区二区三区久久久蜜月 | 国产一区二区三区 | 欧美精品一区二区三区在线播放 | 亚洲视频在线观看 | 国产在线观看网站 | 国产一区二区在线视频 | 亚洲看片网站 | 国产精产国品一二三产区视频 | 精品国产一区二区三区性色av | 日韩免费1区二区电影 | 亚洲国产高清在线观看 | 欧美日韩国产一区二区三区 | www.亚洲视频 | 黄频视频 | 国产精品久久欧美久久一区 | 中文字幕日韩欧美一区二区三区 | 亚洲一区二区三区在线 | 成人一区二区三区视频 | 日韩精品一区二区在线 |