成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

pydbgen:一個數據庫隨機生成器

開發 后端 數據庫
用這個簡單的工具生成帶有多表的大型數據庫,讓你更好地用 SQL 研究數據科學。對于數據科學來說,熟悉 SQL 的重要性不亞于了解 Python 或 R 編程。如果想收集諸如姓名、年齡、信用卡信息、地址這些信息用于機器學習任務,在 Kaggle 上查找專門的數據集比使用足夠大的真實數據庫要容易得多。

[[249748]]

用這個簡單的工具生成帶有多表的大型數據庫,讓你更好地用 SQL 研究數據科學。

在研究數據科學的過程中,最麻煩的往往不是算法或者技術,而是如何獲取到一批原始數據。盡管網上有很多真實優質的數據集可以用于機器學習,然而在學習 SQL 時卻不是如此。

對于數據科學來說,熟悉 SQL 的重要性不亞于了解 Python 或 R 編程。如果想收集諸如姓名、年齡、信用卡信息、地址這些信息用于機器學習任務,在 Kaggle 上查找專門的數據集比使用足夠大的真實數據庫要容易得多。

如果有一個簡單的工具或庫來幫助你生成一個大型數據庫,表里還存放著大量你需要的數據,豈不美哉?

不僅僅是數據科學的入門者,即使是經驗豐富的軟件測試人員也會需要這樣一個簡單的工具,只需編寫幾行代碼,就可以通過隨機(但是是假隨機)生成任意數量但有意義的數據集。

因此,我要推薦這個名為 pydbgen 的輕量級 Python 庫。在后文中,我會簡要說明這個庫的相關內容,你也可以閱讀它的文檔詳細了解更多信息。

pydbgen 是什么

pydbgen 是一個輕量的純 Python 庫,它可以用于生成隨機但有意義的數據記錄(包括姓名、地址、信用卡號、日期、時間、公司名稱、職位、車牌號等等),存放在 Pandas Dataframe 對象中,并保存到 SQLite 數據庫或 Excel 文件。

如何安裝 pydbgen

目前 1.0.5 版本的 pydbgen 托管在 PyPI(Python 包索引存儲庫Python Package Index repository)上,并且對 Faker 有依賴關系。安裝 pydbgen 只需要執行命令:

  1. pip install pydbgen

已經在 Python 3.6 環境下測試安裝成功,但在 Python 2 環境下無法正常安裝。

如何使用 pydbgen

在使用 pydbgen 之前,首先要初始化 pydb 對象。

  1. import pydbgen
  2. from pydbgen import pydbgen
  3. myDB=pydbgen.pydb()

隨后就可以調用 pydb 對象公開的各種內部函數了。可以按照下面的例子,輸出隨機的美國城市和車牌號碼:

  1. myDB.city_real()
  2. >> 'Otterville'
  3. for _ in range(10):
  4. print(myDB.license_plate())
  5. >> 8NVX937
  6. 6YZH485
  7. XBY-564
  8. SCG-2185
  9. XMR-158
  10. 6OZZ231
  11. CJN-850
  12. SBL-4272
  13. TPY-658
  14. SZL-0934

另外,如果你輸入的是 city() 而不是 city_real(),返回的將會是虛構的城市名。

  1. print(myDB.gen_data_series(num=8,data_type='city'))
  2. >>
  3. New Michelle
  4. Robinborough
  5. Leebury
  6. Kaylatown
  7. Hamiltonfort
  8. Lake Christopher
  9. Hannahstad
  10. West Adamborough

生成隨機的 Pandas Dataframe

你可以指定生成數據的數量和種類,但需要注意的是,返回結果均為字符串或文本類型。

  1. testdf=myDB.gen_dataframe(5,['name','city','phone','date'])
  2. testdf

最終產生的 Dataframe 類似下圖所示。

生成數據庫表

你也可以指定生成數據的數量和種類,而返回結果是數據庫中的文本或者變長字符串類型。在生成過程中,你可以指定對應的數據庫文件名和表名。

  1. myDB.gen_table(db_file='Testdb.DB',table_name='People',
  2.  
  3. fields=['name','city','street_address','email'])

上面的例子種生成了一個能被 MySQL 和 SQLite 支持的 .db 文件。下圖則顯示了這個文件中的數據表在 SQLite 可視化客戶端中打開的畫面。

生成 Excel 文件

和上面的其它示例類似,下面的代碼可以生成一個具有隨機數據的 Excel 文件。值得一提的是,通過將 phone_simple 參數設為 False ,可以生成較長較復雜的電話號碼。如果你想要提高自己在數據提取方面的能力,不妨嘗試一下這個功能。

  1. myDB.gen_excel(num=20,fields=['name','phone','time','country'],
  2. phone_simple=False,filename='TestExcel.xlsx')

最終的結果類似下圖所示:

生成隨機電子郵箱地址

pydbgen 內置了一個 realistic_email 方法,它基于種子來生成隨機的電子郵箱地址。如果你不想在網絡上使用真實的電子郵箱地址時,這個功能可以派上用場。

  1. for _ in range(10):
  2. print(myDB.realistic_email('Tirtha Sarkar'))
  3. >>
  4. Tirtha_Sarkar@gmail.com
  5. Sarkar.Tirtha@outlook.com
  6. Tirtha_S48@verizon.com
  7. Tirtha_Sarkar62@yahoo.com
  8. Tirtha.S46@yandex.com
  9. Tirtha.S@att.com
  10. Sarkar.Tirtha60@gmail.com
  11. TirthaSarkar@zoho.com
  12. Sarkar.Tirtha@protonmail.com
  13. Tirtha.S@comcast.net

未來的改進和用戶貢獻

目前的版本中并不***。如果你發現了 pydbgen 的 bug 導致它在運行期間發生崩潰,請向我反饋。如果你打算對這個項目貢獻代碼,也隨時歡迎你。當然現在也還有很多改進的方向:

  • pydbgen 作為隨機數據生成器,可以集成一些機器學習或統計建模的功能嗎?
  • pydbgen 是否會添加可視化功能?

一切皆有可能! 

責任編輯:龐桂玉 來源: Linux中國
相關推薦

2022-06-17 11:04:46

生成器計算

2020-09-08 11:21:48

SQL生成器跨庫

2024-11-01 15:51:06

2019-01-24 09:46:38

PelicanPython生成器

2017-05-18 10:00:40

Linuxpandom隨機數生成器

2024-02-23 18:32:17

2022-10-17 18:29:55

2024-08-19 00:00:00

表單生成器開發開源

2018-02-25 17:30:18

2011-05-19 11:30:00

密碼密碼生成器

2024-10-07 08:52:59

分布式系統分布式 IDID

2024-06-12 13:40:58

2024-12-09 00:00:03

Vue3項目表單

2020-08-26 14:45:34

SQL數據庫數次

2022-07-25 10:27:36

背景生成器工具前端

2023-02-07 16:11:41

2022-08-28 19:10:37

JavaScript二維碼源碼

2020-12-09 08:34:24

css生成器設計師

2020-12-20 10:04:44

Qrcode二維碼生成器QR Code

2014-07-23 10:07:34

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91porn在线观看 | 国产精品国产三级国产播12软件 | 午夜日韩精品 | 免费视频一区二区 | 丝袜 亚洲 欧美 日韩 综合 | 日本小视频网站 | 国产成人精品免高潮在线观看 | 欧美在线一级 | 久久久精品一区二区三区 | 毛片一级片 | 中文成人在线 | 韩国精品在线观看 | 日韩视频一区二区三区 | 欧美视频 亚洲视频 | 在线观看免费av网站 | 成年女人免费v片 | 久久久tv| 99久久精品国产毛片 | 亚洲精品视频在线观看视频 | 亚洲va中文字幕 | 国产在线1区 | 久久久精彩视频 | 亚洲日韩中文字幕一区 | 亚洲精品一区二区三区蜜桃久 | 最近日韩中文字幕 | 亚洲综合激情 | 日韩在线中文字幕 | 成人在线观看中文字幕 | 国产精产国品一二三产区视频 | 成人精品鲁一区一区二区 | 国产一区二区影院 | 亚洲一区在线日韩在线深爱 | 亚洲免费视频网站 | 精品国产乱码一区二区三区a | 国产精品91视频 | 男人的天堂在线视频 | 97国产在线视频 | 日韩精品免费视频 | 91精品在线播放 | 狠狠操婷婷 | 在线a视频网站 |