互聯網技術聯盟(ITA1024)大數據技術專題月
一、 中國最頂級公司齊聚互聯網技術聯盟(ITA1024)
我們對未來的觀點是:未來是一個“互聯網+互聯網”的時代。互聯網企業需要走到線下深入傳統行業業務,而傳統企業也需要+互聯網以成為下一代新銳企業。
在這樣的愿景和共識下,互聯網技術聯盟(ITA1024)成立。由京東、美團點評、小米、滴滴、攜程、網易、搜狐、樂視、當當、途牛、餓了么、58、獵豹、360等TOP100的互聯網服務和七牛、青云、聽云、DaoCloud、UCloud、有云等技術服務,以及海爾電商、正大電商、美的電商、正大電商等聯合發起,專注于互聯網+互聯網技術與創新。
目前,ITA1024已經成為國內最大的企業間技術交流組織。
二、把一項技術用一個月時間徹底講透
聯盟以主題月這種創新形式進行立體式全方位的交流對接。由最佳實踐案例每日推薦、每周一期線上萬人課堂、每月一次1024技術峰會、每月一次專家研討會綜合組成,通過一個月的時間,把一項互聯網+互聯網的技術徹底講透。
繼云計算、前端技術主題月之后,我們4月精心策劃推出大數據技術專題月。在大數據技術專題月中,聯盟核心成員推薦了來自國內一流互聯網企業的大數據技術專家,針對大數據應用落地的技術選型和實施經驗,分享支撐和驅動業務成長的最佳實踐。
互聯網技術聯盟(ITA1024)大數據技術專題月的講師陣容,堪稱目前業界大數據技術領域的最強陣容。講師來自Linkedin、eBay、京東、美團、搜狗、攜程、七牛、Kylin、斗魚TV、雪球、58以及Admaster的大數據核心研發團隊。
三、不只是一場1000+人的頂級大會
4月23日,互聯網技術聯盟(ITA1024)技術專題月的高潮環節——1024大數據技術峰會在北京舉辦,聯盟邀請了海爾電商和七牛作為峰會的重要合作伙伴。海爾電商在傳統企業轉型互聯網電商模式上,有多年的經驗沉淀和先進的探索。七牛在大數據的底層技術方面有扎實的基礎,在大數據處理平臺擁有核心技術,這樣的搭配,也頗為符合聯盟“互聯網+互聯網”的使命愿景。
同時,全球最大的IT中文社區CSDN作為互聯網技術聯盟(ITA1024)的戰略合作伙伴,也將邀請CTO俱樂部的200+位CTO一同參會。互聯網技術聯盟也邀請到了來自河南、山東、陜西、河北、福建的CIO聯盟成員一同參與本次峰會。
四、怎樣獲得技術專題月的免費門票
千人規模的1024大數據技術峰會,除了500+受邀出席的CTO和CIO之外,聯盟也準備開放500名業界報名用戶免費參會。
只要是在大數據技術領域深耕的架構師們,可以有機會獲得免費門票,與業界頂級CTO、CIO一起共話大數據技術落地帶來的業務創新價值。
報名地址:http://www.ita1024.com/activity/view/id/1459499665114
附:
【互聯網技術聯盟】1024大數據技術峰會 會議日程:
08:30-09:00 簽到
09:00-09:10 開幕致辭 互聯網技術聯盟
09:10-09:50 創造數據產品驅動商業價值 Leo Li Linkedin Sr Manager
09:50-10:30 使用Apache Kylin搭建企業級開源大數據分析平臺 史少鋒 Kyligence技術合伙人&資深架構師,Apache Kylin PMC
10:30-11:10 大數據時代的時序數據 陳超 七牛技術總監
11:10-11:50 大數據處理和統一調度系統優化 申賢強 搜狗資深高級工程師
11:50-13:30 休息 13:30-14:10 京東大腦的技術解密 京東 京東大數據資深架構師
14:10-14:50 斗魚TV實時計算平臺的演進 吳瑞誠 斗魚TV大數據團隊負責人
14:50-15:30 大數據機器學習在OTA酒店服務的應用 潘鵬舉 攜程酒店研發部BI經理
15:30-15:50 休息 15:50-16:30 雪球大數據體系探索 唐福林 雪球首席架構師
16:30-17:10 打造又快又準的廣告分析系統 劉喆 Admaster資深架構師
17:10-17:50 飛流:一個通用實時統計分析平臺的設計與實踐 趙健博 58同城大數據資深架構師
17:50-18:30 美團大數據平臺的技術演進 美團 美團大數據資深架構師
18:30 活動結束
講師&議題亮點:
議題一 創造數據產品驅動商業價值
分享 LinkedIn 如何從數據中挖掘價值的一些案例。同時也將探討,LinkedIn 是如何把商業、數據和開發相結合,通過數據產品的形式帶來每年數十億美金的商業價值。
講師:李海鵬(Leo Li) Linkedin Sr Manager
擁有豐富的互 聯網行業大數據相關的實戰經驗,熱衷于利用數據和技術來解決商業問題。作為現任LinkedIn資深經理,Leo帶領團隊開發的數據產品,對 LinkedIn營收的高速增長做出了巨大的貢獻。在加入LinkedIn之前,Leo曾負責Amazon在線顯示廣告平臺的產品設計,以及互聯網廣告平 臺類初創公司的商業智能和運營。
議題二 使用Apache Kylin搭建企業級開源大數據分析平臺
首先簡單介紹Apache Kylin的核心架構和工作原理; 然后介紹如何使用Kylin結合Hadoop/HBase等主流開源工具構建大數據分析平臺;著重講解如何使用Kylin做企業級部署,滿足企業對高性能,高可靠,高安全等要求。
講師:史少鋒 Kyligence技術合伙人&資深架構師,Apache Kylin PMC
資深軟件架構師,Apache Kylin核心開發者和項目管理委員會成員(PMC),專注于大數據分析和云計算技術。曾任eBay全球分析基礎架構部大數據高級工程師,IBM云計算部門軟件架構師;曾是IBM公有云Bluemix dev&ops團隊核心成員,負責平臺的規劃、開發和運營。
議題三 大數據時代的時序數據
InfluxDB 是一個開源分布式時序、事件和指標數據庫。使用 Go 語音編寫,無需外部依賴。其設計目標是實現分布式和水平伸縮擴展。本次分享會對 InfluxDB 進行全面的講解,包括InfluxDB的原理與架構,并且會指出InfluxDB存在的“坑”。具體會從InfluxDB的基礎概念、如何使用InfluxDB、集群設計和存儲引擎幾方面進行。
講師:陳超 七牛技術總監
國內著名大數據專家,七牛云技術總監,全面負責七牛所有數據產品的設計與研發,近年來一直專注于分布式計算與機器學習等領域,有非常豐富的分布式系統設計與實現的經驗,在分布式數據庫方面也有深入研究。多次擔任spark summit china、open cloud、大數據峰會等大型會議演講嘉賓。
議題四 數據處理和統一調度系統優化
如何簡化用戶傳輸,清洗,建立數據倉庫等流程,降低用戶使用大數據的門檻,提供豐富的API接口,避免用戶使用不當遇到的各種坑;基于docker的調度管 理系統負責定時或者將用戶指定的image加入統一調度集群,具有任務依賴管理,高效調度,自動容錯,優先級控制,環境隔離的優勢,免除用戶各種運維相關 問題,專注核心業務邏輯的開發。
講師:申賢強 搜狗資深高級工程師
搜狗基礎平臺部,主要負責Hadoop,HBase,Docker等基礎平臺的開發和建設。畢業于中科院計算所,曾任百度網頁搜索部高級工程師,負責百度分布式架構開發。
議題五 斗魚實時計算平臺的演進--互聯網風口公司實時計算的成長
主要分享的內容包括:
1. 實時日志檢索:grep+awk --> Hive UDF --> ELK
2. 多維監控系統HBase --> TSDB + 自定義UI
3. 實時流計算 Redis --> Storm + Spark Streaming
講師:吳瑞誠 斗魚大數據團隊負責人
全面負責斗魚大數據團隊的平臺規劃、系統架構設計、集群環境運維、技術預研與落地,也是從0到1搭建公司大數據平臺和組建團隊的核心。在大數據方向,經歷 了大公司高大上的技術規模,也經歷了一個小公司的大數據平臺成長之路。背靠開源生態,應用短平快的方式,支撐起一個千萬級用戶的在線直播平臺。曾任淘寶大 數據開發(HBase)高級工程師、一號店應用架構師。
題六 大數據機器學習在OTA酒店服務的應用
攜程做為國內間夜量第一的OTA,日增量開關房操作日志千萬級大數據,通過機器學習人工開關房操作時的變量與結果,預測系統中假可訂真滿房的房型,指引人工詢房及時關房,降低滿房率。預測出假滿房真可訂的房型,機器代替人工主動打開假滿房的房型售賣,提高庫存競爭力。本次分享將重點介紹XGBOOST/GBDT等有監督的機器分類算法中變量預處理、變量篩選和淘汰、算法調優等方法。也會分析模型上線技術架構以及經驗教訓。
講師:潘鵬舉 攜程酒店研發部BI經理
負責酒店服務相關的業務建模工作,主要研究方向是用機器學習實現業務流程自動化、系統智能化、效率最優化,專注于算法實踐和應用。多年數據從業者,扎根于 互聯網機器學習和深度學習領域,曾從事數據分析、闖蕩咨詢行業、當數據架構師、數據PM,期望通過算法和業務的結合提升業務,用數據創造更大的價值。
2012年加入攜程,從事數據分析、數據架構等相關工作,2014年后專注機器學習領域,帶領團隊用算法幫助業務提升效率、減少人力成本、提高業務產量,用算法創造價值。目前和團隊同事一起致力于用機器學習優化酒店預訂服務流程,提高客戶感受,讓機器做機器擅長的事情。
議題七 雪球大數據體系探索
介紹雪球大數據體系從無到有的搭建過程,在公司內部的推廣過程,以及當前由大數據體系支撐的用戶畫像,推薦,反垃圾,廣告,用戶篩選等業務應用。
講師:唐福林 雪球首席架構師
負責雪球后端整體架構,性能和穩定性提升,以及大數據體系建設。 在加入雪球之前,作為前新浪微博技術委員會成員,微博平臺資深架構師,在微博期間深度參與微博快速增長期的性能和穩定性問題解決。
議題八 打造又快又準的廣告分析系統
分享內容包括:
1. AdMaster 數據收集系統的演進, 相關開源軟件選型和改進
2. 日志清洗系統的演進, 相關開源軟件選型和改進
3. 數據分析平臺和統一監控系統的設計開發
講師:劉喆 Admaster資深架構師
主要負責數據處理的全流程技術支持, 高性能和高可用的分布式架構設計, DSL 語言抽象, Hadoop/HBase/Storm/Spark等大數據平臺優化。曾就職百度, 負責當時全球規模最大的 hadoop 平臺的運維開發工作,曾任人民搜索運維總監。多年專注于數據挖掘/大數據/DSL/系統架構, 對分布式計算/分布式架構和程序語言有深入的理解, 曾多次受邀分享Hadoop/spark/開源軟件等相關經驗。
議題九 飛流:一個通用的實時統計分析平臺設計與實踐
分享58趕集內部已經落地的實時統計分析平臺(內部代號“飛流”)。該平臺無需編程,任務開發完全配置化;提供了豐富的數據統計分析方法,以及多維分析功能;具備很好的實時性、擴展性與可靠性。將重點介紹“飛流”平臺的整體設計與實現細節。
講師:趙健博 58趕集大數據平臺資深架構師
負責58整個大數據平臺的研發,應用與發展規劃。2009年畢業于中國科學院計算技術研究所,先后就職于百度、奇虎360、58趕集擔任大數據領域專家,主要研究領域包括分布式存儲與計算系統等。