成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

聊聊一種讀取億級(jí)Doris數(shù)據(jù)庫(kù)的方法

數(shù)據(jù)庫(kù) 其他數(shù)據(jù)庫(kù)
如果數(shù)據(jù)量比較大,超過千萬,甚至過億,單節(jié)點(diǎn)讀取會(huì)遇到超時(shí)以及時(shí)效過低的問題??梢允褂胹park.read.jdbc分布式多節(jié)點(diǎn)并發(fā)讀取。spark讀取支持兩種方式。
  1. 工作中,常常需要將線上doris同步至集市。讀取doris數(shù)據(jù)同讀取常規(guī)mysql基本相同。如果數(shù)據(jù)行小于千萬,比較簡(jiǎn)單的方式直接單節(jié)點(diǎn)連接、讀取和存儲(chǔ)。Python示例如下:
def get_data(sql,host='',port=2000,user='',password='',db=''):
    # 支持doris
    import pymysql
    connect = pymysql.connect(host=host,port=port,user=user,password=password,db=db,charset='utf8')
    cursor = connect.cursor()
    cursor.execute('SET query_timeout = 216000;') #單位秒
    cursor.execute(sql)
    result = cursor.fetchall()
    for row in result:
        pass # 存儲(chǔ)格式可以自行控制 
    cursor.close()
    connect.close()
    return result
  1. 如果數(shù)據(jù)量比較大,超過千萬,甚至過億,單節(jié)點(diǎn)讀取會(huì)遇到超時(shí)以及時(shí)效過低的問題。可以使用spark.read.jdbc分布式多節(jié)點(diǎn)并發(fā)讀取。spark讀取支持兩種方式。

主要參數(shù)介紹:

read.jdbc(url=url,table=remote_table,column='item_sku_id',numPartitions=50,lowerBound=lowerBound, upperBound=upperBound,properties=prop)

url:格式如'jdbc:mysql://**.jd.com:2000/數(shù)據(jù)庫(kù)名?useUnicode=true&characterEncoding=UTF-8&autoReconnect=true&failOverReadOnly=false&zeroDateTimeBehavior=convertToNull&useSSL=false&serverTimezone=Asia/Shanghai'

table:可以是表名,也可以是查詢sql(也即支持條件查詢),如果是sql,格式如"(SELECT count(*) sku FROM rule_price_result where dt='2023-05-10') AS tmp"

numPartitions:控制并發(fā)節(jié)點(diǎn)個(gè)數(shù)

lowerBound+upperBound和properties二選一,控制每個(gè)節(jié)點(diǎn)讀取的數(shù)據(jù)范圍。

lowerBound+upperBound方式:指定讀取最低和最高值,spark會(huì)結(jié)合分區(qū)個(gè)數(shù)和最低最高邊界機(jī)械做分割。

如果數(shù)據(jù)分布有傾斜,可以通過predicates列表自行控制范圍。

作者:京東零售 趙奇猛

來源:京東云開發(fā)者社區(qū)

責(zé)任編輯:武曉燕 來源: 今日頭條
相關(guān)推薦

2011-04-06 10:09:56

MySQL數(shù)據(jù)庫(kù)安裝

2018-09-27 16:15:10

區(qū)塊鏈數(shù)據(jù)庫(kù)

2012-03-14 11:46:30

ibmdw

2012-03-19 10:45:44

ibmdw

2021-06-11 00:11:23

GPS數(shù)據(jù)協(xié)議

2023-03-30 22:32:21

2018-12-14 14:30:12

安全檢測(cè)布式系測(cè)試

2011-07-04 17:53:48

快速測(cè)試

2023-01-06 08:31:53

數(shù)據(jù)庫(kù)基準(zhǔn)測(cè)試

2024-10-12 15:29:56

2023-01-26 00:18:53

云原生數(shù)據(jù)庫(kù)云資源

2021-10-28 19:28:04

數(shù)據(jù)庫(kù)開發(fā)Spring

2022-09-23 07:44:48

時(shí)序數(shù)據(jù)庫(kù)物聯(lián)網(wǎng)

2020-05-19 17:07:09

Spark測(cè)試數(shù)據(jù)計(jì)算

2022-04-20 08:00:00

深度學(xué)習(xí)數(shù)據(jù)集Hub

2010-03-26 13:34:47

CentOS安裝

2019-12-31 14:21:00

數(shù)據(jù)挖掘關(guān)系網(wǎng)絡(luò)數(shù)據(jù)

2024-05-08 08:14:18

數(shù)據(jù)庫(kù)IO備份

2022-09-21 07:30:12

數(shù)據(jù)庫(kù)勒索病毒企業(yè)

2023-10-11 08:09:53

事務(wù)隔離級(jí)別
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 免费观看一级特黄欧美大片 | 久久久九九九九 | 日韩欧美中文字幕在线观看 | 国产激情91久久精品导航 | 性一爱一乱一交一视频 | 婷婷色国产偷v国产偷v小说 | 91av在线免费看 | 亚洲精品久久嫩草网站秘色 | 亚洲欧洲成人在线 | 国产精品午夜电影 | 成人一级片在线观看 | 拍真实国产伦偷精品 | 色综合色综合网色综合 | 国产九九精品视频 | 日本视频免费 | 天天拍天天操 | 亚洲视频在线一区 | 天天天天天天天干 | 国产精品成人一区二区三区夜夜夜 | 蜜桃一区 | 久久久精品一区二区 | 九色91视频 | 亚洲天堂影院 | 女女百合av大片一区二区三区九县 | 久久综合av | 精品国产欧美 | 日韩高清国产一区在线 | 天天干天天爽 | 成人亚洲片 | 视频在线一区二区 | 男女网站免费观看 | 亚洲免费观看视频 | 国产精品色 | 国产午夜精品久久 | 色视频一区二区 | 成年人视频在线免费观看 | 日韩欧美精品在线 | 久久精品久久久久久 | 国产片侵犯亲女视频播放 | 99re在线视频观看 | 国产婷婷色一区二区三区 |