成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Stinger Initiative:讓Hive提速100倍

云計算
最初,Hive用于建立大規模的成批計算,這在數據報告、數據挖掘以及數據準備等應用場景很有效。這些應用場景很重要,但是Hadoop的需求十分廣闊,企業用戶越來越需要Hadooop具備更高的實時性和交互性。在Hortonworks,我們相信開源社區的創新力要超過任何一個專有的提供商,Stinger initiative再次證明了這一點,我們會聯合(社區)伙伴一起提升Hive的性能。

自從2007年Facebook提出Apache Hive和HiveQL后,他們已經成為事實上的Hadoop上的SQL接口。如今,各種類型的大公司或小公司都在使用Hive這中非常普遍的方法來訪問Hadoop數據,從而給公司或者用戶帶來更多的價值。同時,還有許多公司通過大量已存的BI工具生態系統來達到相同的目的,這些BI工具同樣使用Hive作為接口。

最初,Hive用于建立大規模的成批計算,這在數據報告、數據挖掘以及數據準備等應用場景很有效。這些應用場景很重要,但是Hadoop的需求十分廣闊,企業用戶越來越需要Hadooop具備更高的實時性和交互性。在Hortonworks,我們相信開源社區的創新力要超過任何一個專有的提供商,Stinger initiative再次證明了這一點,我們會聯合(社區)伙伴一起提升Hive的性能。

什么是Stinger Initiative?

能讓Hive回答問題的速度滿足普通人(例如一個問題的返回時間在5-30秒),如大數據探索、可視化、參數化報告等場景,而且并不依賴其它工具,并分發到用戶社區,可以很好的維護企業原有的投資和開發者的Hive技能。

 

 

圖:Stinger Initiative的roadmap

為此,我們發布了Stinger Initiative,并進入社區進行分享,為的是讓Hive支持更多SQL,并實現更好的性能。一直以來,HiveQL都沒有什么變化,而這次HiveQL將變得更強大。同時,與現有的工具保持一致形成***的互補。

首先,我們讓Hive與人們在Hadoop上想要的查詢想匹配。這包括增加類似OVER子句的分析功能,支持WHERE子查詢,以及調整Hive的樣式系統更多的符合標準的SQL模型。

其次,我們優化了Hive的請求執行計劃,我們內部某些測試結果顯示,優化后的請求時間減少了90%。我們也著眼于在Hive執行引擎中增加一些改動,我們確信這可以增加單一Hive task每秒鐘處理記錄的數量。

第三,我們在Hive社區中引入了新的列式文件格式(如ORC文件),提供一種更現代、高效和高性能的方式來儲存Hive數據。

***,我們引入了一種新的runtime框架—— Tez,它的目標是消除Hive的延遲以及吞吐量限制。Tez通過消除不必要的task、障礙同步和對HDFS的讀寫作業來優化Hive job。這將優化Hadoop內部的執行鏈,徹底加速Hive負載處理。

所有這些對Hive的調整仍在公開的進行中,內部預覽版將在今年三月舉行的由Hortonworks主辦的Hadoop大會上公開。

擁抱社區和Hive

許多不同的團隊在Hive社區貢獻著他們成果。來自SAP的Harish Butani的團隊負責為Hive增加一個分析和數據窗口函數。這個函數將增加到OVER子句中用于已經存在的聚集函數,就像RAND、NTILE和LEAD、LAG等函數一樣, 這里可以看到詳細的說明。Facebook的Namit Jain已經花了大量時間來優化Hive的查需執行計劃,這讓Join等操作變的更高效,并減少來自用戶的提示。Hortonworks已經參與到這些項目中。

Owen O’Malley,Hortonworks聯合創始人,早期的Hadoop的開發者,已經在Facebook為ORC文件格式進行了大量工作,這項工作將幫助提升Hive讀、寫、處理數據的性能,在 這里可以看到詳情。我們還在為一些更長遠的目標工作,如重寫Hive的運算符來處理上千的記錄,其效率和現在相比將有大幅提升。

為什么要重新造輪子呢?

責任編輯:王程程 來源: Hortonworks
相關推薦

2016-10-08 16:02:37

WIFIMegaMIMO系統

2022-08-09 09:10:31

TaichiPython

2016-03-21 10:16:06

RedisSpark大數據處理

2021-04-21 18:57:16

二進制存儲空間

2023-12-11 15:40:32

PyTorch代碼大模型

2020-07-20 09:20:48

代碼geventPython

2021-02-17 13:20:51

forpandas語言

2023-07-12 14:28:45

谷歌模型

2024-07-01 12:17:54

2024-07-17 08:25:44

2021-06-02 22:54:34

技巧 Git Clone項目

2022-08-01 11:15:26

MIT材料

2023-03-16 16:18:09

PyTorch程序人工智能

2013-09-24 09:40:41

Java圖形加速

2018-07-27 09:32:18

Python代碼數據

2009-12-16 11:43:28

卡巴斯基NVIDIA Tesl

2016-02-18 09:36:52

光纖wifi

2019-11-01 10:49:21

技術開源應用

2023-12-23 23:04:26

AI模型

2022-03-09 14:57:53

Numbapython
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产一区二区三区四区区 | 国产精品九九九 | a在线视频 | 久久久www成人免费精品 | 久久精品播放 | 精品少妇一区二区三区在线播放 | 亚洲精品黄色 | 欧美视频1 | 91九色麻豆 | 国产欧美精品 | 一区二区三区免费观看 | 91五月天| 日韩久草 | 成人免费观看视频 | 国产精品污www一区二区三区 | 91亚洲国产成人久久精品网站 | 亚洲国产成人精品一区二区 | 成人精品一区二区三区中文字幕 | 精品日本中文字幕 | 91av视频 | 99久久精品免费 | 国产精品一区二区视频 | 国产探花在线精品一区二区 | 日韩成人在线播放 | 亚洲国产一区二区三区 | 国产精品免费在线 | 日韩av免费在线电影 | 毛片视频观看 | 欧美日韩视频在线第一区 | 日日天天 | 日本特黄a级高清免费大片 国产精品久久性 | a级片www| 黄色大片网站 | 国产精品欧美一区喷水 | 国产精品黄视频 | 亚洲国产一区二区三区在线观看 | 一级日韩 | 欧美极品在线 | 羞羞视频免费观看入口 | av一区二区三区四区 | 伊人亚洲 |