七牛云存儲CEO許式偉:數據啟動商業新常態
8月29日-30日,以“數據重構未來”為主題的D-Future七牛數據時代峰會在上海舉行。七牛攜百名創業明星,技術大咖匯聚國際時尚中心,共話數據發展,探討行業未來!
七牛云存儲CEO許式偉在開幕演講中講到,現在如果用一次來概括互聯網時代,那就是“數據”。實際上信息一直都存在,以前在原子世界,有了計算機和互聯網之后,出現了一個新的世界,即虛擬世界。這個新的世界正在以每三年翻一倍的速度增長。相對于計算機來說,人本身的邏輯能力、處理能力是非常有限,所以計算機和互聯網延伸了人的邏輯能力,讓我們有了很強的分析和預測未來的能力。這是一個數字化的洪流。這樣的洪流對于我們的商業形態產生了非常巨大的影響。
以下是演講實錄:
許式偉:感謝大家對于七牛的支持,今天能舉辦D-Future大會,從我個人而言,心來感慨萬千,七牛到今天已經有四年左右的歷史。應該說是非常年輕的一個公司。今天有幸舉辦這樣一場大會,最重要的一點,我覺得首先是這個時代給我們的一個機遇,我覺得在座的各位都是這個時代的弄潮兒,今天有幸和大家談一談我們對于數據對于互聯網時代的看法,這是七牛的榮幸,也是我們能夠和大家共同,如何重構,用技術的方式,基于數據重構我們的商業。我覺得我們是非常非常幸運的,我個人畢業的時候,剛好是互聯網這個新興的產業剛剛開始的階段,我覺得前面的十幾年很精彩,但是其實今天大家也能感覺到,更加精彩的時刻,因為互聯網剛剛開始的時候,它只是一個新興的產業,今天大家都說互聯網產業,但是很快在不久的將來,互聯網不再是一個新興的產業,它其實是一個新興的生產力,和所有的實體經濟和各行各業都息息相關,所以今天為什么,我們認為它是一個更加有巨大的商業機會的時代,是因為互聯網之前是一個行業,它的影響仍然只是非常小的一個人群。但是今天我們看到,每一個人都已經聯網了,基本上,中國超過半數的人群,已經隨時隨地的都在網絡上了。那么這個給我們的影響是非常巨大的。它會讓我們的商業因為有了互聯網而發生重新洗牌的機會,所以今天我們看到,所有的公司都有非常巨大的危機感,因為他們如果沒有變化,他們可能就很可能面臨淘汰,他們也許就會從這場競賽中出局。但是同時我覺得這也是一個新的機會的來臨。因為我們如果跟隨了這個時代的機遇,我們能夠在其中抓住里面帶給我們的機會,我相信你就可以成為你所在行業的領頭羊。所以今天為什么那么多人談互聯網轉型,為什么大家都會談創新,談顛覆,是很有道理的。因為我們正面臨著一個***的機遇,如果不變,那么你一定會死。
大家今天都知道D-Future是一個以數據為主題的會議,我們確實現在正用一個詞來涵蓋這個互聯網時代,我認為就是兩個字,數據。實際上信息一直都存在,只是它以前是在原子世界,但是有了計算機有了互聯網之后,我們知道這個世界多了一個虛擬世界,比特世界。這個新的世界正在以每三年翻一倍的速度在增長。為什么會有這樣的一個變化?是因為其實人,大家去分析一下人的能力,我們會發現,其實人本身的邏輯能力處理能力是非常有限的,我們很難去很快的執行一個對計算機來說非常簡單的預算,比如71×131等于多少,我相信沒有很多人能很快的答出來,但是計算機執行這樣的計算,是納秒級的計算。所以計算機和互聯網延伸了人的邏輯能力,讓我們有了很強的分析和預測未來的能力。這是一個數字化的洪流。在這樣的一個洪流下,我覺得對于我們的商業,其實是產生了一個非常巨大的影響。所以今天我們也想談談互聯網轉型后的商業新常態到底是什么樣的。
首先我們來看一看業務本身,因為互聯網化最基礎的一個層面的訴求,就是業務要上網,如果我們想象一下,或者我們對比一下傳統的商業和新興的商業形態,它***的一個不同是什么?或者我們用一個詞去概括舊的商業形態是什么東西。我個人想到的一個詞就是一手交錢一手交貨,這就是舊的商業形態最基本的商業特色。但是互聯網改變了這一切,互聯網讓遠程交易成為了可能。但是遠程產生一個服務,這個影響是非常非常巨大的。因為我們的業務的場景比以前開闊很多,我們以前也許只能影響我們周圍非常一小群的人群,或者最多我的公司做大了之后,我在不同的地方開不同的分部,但是你影響的人群仍然只是你公司能到達的范疇。但是互聯網改變了這一切,它讓商業可以讓你人不用過去,和世界某一角落的人就可以做生意,這個影響非常非常巨大。我們來看如何達到的,其實我們分析一下商業在互聯網上之后,業務有什么樣的特征,我概括了一個詞,非結構化數據是人的自然溝通的方式。所以在上網之后,我們發現大量的數據被映射,或者被影像到現實生活當中,這也是數據化生活洪流的根本化的原因。我們要表達我們的意愿,就是非結構化數據,什么叫非結構化數據呢?就是自然表達的語言的文本,以及圖片、音頻、視頻等等這些媒介,都是非結構化數據。那么這些數據天然是人非常容易理解的。但是其實計算機很難理解。剛剛我講了,計算機有非常強大的邏輯能力,但是計算機在語意的理解上是非常原始的,可能連三歲嬰兒的水平都達不到。在這樣的情況下人怎么樣溝通呢?就是非結構化數據。非結構化數據就是傳遞人的意愿。比如我拿起電話說幾段語音,告訴我的客戶或者是告訴我想要交易的人,告訴他我想要表達的東西?;蛘呤峭ㄟ^圖片,表達你的商品,你的商品長什么樣,你的商品怎么使用的。所以我們可以看到非結構化數據自然而然會成為交互的一個中介。而這個也是原子世界映射到比特世界一個根本原因,因為業務要上網。
第二個層次,當業務上網之后,我們會發現,舊的商業過程當中我們也會談運營。但是舊的商業過程當中,我們如何運營,大部分的企業就是做調查問卷,我們會找一些樣本的客戶去問他們,你對我們的服務有什么樣的看法,你希望我們做什么樣的一個新的服務來去為你提供,但是今天我們會發現,其實有了互聯網,有了計算機之后,這一切也發生了變化,首先業務上網之后,天然你可以記錄每一次的交易過程,可以把所有用戶的行為都能夠記錄下來,所以今天我們會發現,運營的基因的分析的背景,不是取樣數據,而是全量的用戶的行為記錄。所以我們每天都在產生,對于任何一個互聯網公司來說,每天都在產生上千萬上億的調查問卷。而這些調查問卷,如何去對你的商業去進行改進,這個是一個非常重要的課題。也是我們今天為什么會談大數據,會談精益的運營的原因。
我們先看一看非結構化數據數據的挑戰。剛才我們講了,現在世界上正以每三年翻一番的數據的增長速度,而這其中95%以上,都是非結構化數據,而且這個95%的比例還在不斷的提升,而不是下降。也就是說我們會有越來越多的非結構化數據在其中。所以這個數據的存儲量是非常非常驚人的,如此驚人的數據,應該如何存儲,如何讓它不丟失,如何進行分析和挖掘,這其實是個很重要的課題。剛才我也講了,非結構化數據,其實今天主要的用途是用來做交互,但是我們剛才也講了,今天計算機對于語意的理解是非常原始的,可能連三歲小孩都不如。所以在交互上,我們發現它仍然有非常巨大的提升空間。我們知道我們有自然語言,NLP什么的,技術數據來講,這樣的一些技術,但是它今天仍然很原始。我們也會知道有語音的識別,有視頻或者圖片里面對于場景對于動作的識別等等,但是這些新的分析方法都還非常的早期,我們把這些新的分析方法,如果能夠往前走的話,那么我們可以想象,其實這個數據時代會有更大的想象空間在里面。正因為我們的分析能力還很原始,所以今天幾乎所有的非結構化數據都沒有二次分析。所謂的二次分析,就是我們除了直接的業務交易過程,比如說我想表達我的一個意愿。但是二次分析是可能的。因為用戶每一次溝通,每一次交互過程當中,沉淀了大量的信息,這些信息如何挖掘,也是很重要的課題。
接下來談一談用戶行為的記錄,我認為這個是遠未充分挖掘的金礦。因為今天很多企業沒有用戶行為記錄。因為他們大部分業務連商網還沒有。所以他們今天想得更多的是讓我的業務上網。但是其實哪怕是互聯網公司,今天日志的處理能力,或者是我今天能處理多少的數據量,以及我的分析方法,能產生對于我經營有效的指導數據,這方面的能力還是很不足。大部分的公司停留在比如說日活躍用戶的分析等等基礎的過程。第三點是絕大部分企業日志會定期的刪除,因為他們不能理解用活分析之后還能干什么。因為日志是計算機生成的,所以它天然可以很容易被計算機所去理解,這個理解是全面的,不會損失什么信息。所以日志本身是一個更高含金量的金礦,但是大部分的企業其實并沒有意識到這一點。所以今天日志的使用量,我認為遠遠處于一個非常原生的一個狀態。
那么今天談這些對于我們來說有什么樣的意義呢?這個就涉及到七牛對于自己的定位。如果用一句話來描述七牛對于自己的定位,我們會這么解釋。七牛是最開放最完備的數據服務供應商,最開放的含義是什么呢?我們希望不是七牛把所有的數據服務給提供了,我們希望搭建一個平臺,能讓所有對于數據,因為我們剛剛分析了非結構化數據,分析了日志相關的一些挑戰,這些挑戰絕對不是七牛一家公司所能解決的,我們希望有志于去提升這個數據的應用價值的企業,都能夠和七牛一起,共同開拓這個世界,而不是七牛單獨一家去做這樣的事情。
最完備的含義是,我們希望能夠分析這一些數據的使用場景,去觸及它的方方面面,去構建一個最完整的基礎戰,七牛完整的構建一個商業。這個是七牛對于一個數據服務商的一個定位。
今天七牛做了一些什么,大家都知道七?,F在叫七牛云存儲,所以七牛如何定義云存儲,其實七牛之前已經有很多的云存儲的供應商,最典型的是亞馬遜。但是七牛,我們認為我們重新定義了云存儲這樣一個概念,為什么呢?因為在AW上的S3,我們認為它是一個零件,什么零件呢?就是云主機的復數品。因為S3主要的能力是一個數據倉庫的能力,它可以放東西,可以取東西。但是七牛認為云存儲不應該僅僅局限于我是一個數據的存儲的空間。首先它是一個數據存儲的空間,所以我們有數據存儲這樣一個基礎服務。這個基礎服務,它的核心價值很簡單,就是可靠,然后便宜。然后高可用,這個是它最基礎的幾個能力,第二個能力是什么呢?第二個能力是加速。七??赡苁?**個提出存儲加速和數據處理這樣三個詞來描述云存儲這樣一個服務的一個公司。當然后面我們看到業界也逐漸的大家認同了這樣一個模式,所以我們看到,幾乎所有的云存儲都在往這個方向在走。
那么加速是什么呢?七牛的加速,我們是用一個相對比較獨特的方式,因為大家聽到加速這個詞,都會想到CDN,而CDN是存在了十幾年的一個服務形態。七牛的加速到底和他們有什么不同呢?這個跟七牛的做事方式很有關系。我們認為不差一個新增的CDN公司。所以七牛從加速角度來講,我們定位成我們是CDN融合的公司。我們希望協助客戶管理CDN,讓這些CDN融合在一起,能夠提供更高品質的,或者是更高可用性。因為任何一家CDN,很可能會出現區域性的故障,這樣的情況下,我們可以協助自動的去解決。然后有一些CDN可能在比如在上??煲稽c,有的CDN在廣州快一點,我們可以融合,可以形成更高速的訪問。第三個層次是數據處理,數據處理這個詞比較抽象,我們如果去展開來講,它的就呼應我剛才講的那個非結構化數據的挑戰里面最重要的一點,就是我們對于非結構化數據,計算機對于非結構化數據的理解其實是非常原始的階段,所以七牛成為一個真正的開放的云存儲,最重要的點在于我們的數據處理是開放式的平臺,我們知道七牛最近接入了非常多的數據處理的服務,比如說圖片的建網,比如我們正在接入的人臉識別等等。數據處理的業務是做不完的。七牛最開始提供的一些基礎的數據處理,比如音視頻的打碼、打水印等等。這個是個開放的平臺,待會我們的團隊會講,這個我不講了。
還有什么呢?還有一點就是直播!因為視頻或者是音頻,它是一個非常特殊的介質,因為它有一個值,就是在線溝通的需求,這是傳統的存儲所沒有的。當然因為視頻和音頻它本身有流媒體的屬性,所以它天然有點播的需求。七牛的霹靂云可以把直播和點播融合的平臺。我們可以在霹靂云上完成用戶的溝通,以及事后的點播,以及不同的網絡下不同碼率的轉換。
介紹了七牛當前云存儲的概念之后,我們來看看七牛的一些數據,今天七牛的注冊企業有28萬,我們直接覆蓋網民每月月活有3.7億,我們的平臺上產生了1600億的文件,每天我們有750億的請求。我們數據處理,數據處理本身可以被加速的,也就是同一個文件,哪怕它多次訪問,它只會處理一次,所以它的量會相對少一點。今天七牛的平臺上每天有12億的數據的處理量??偨Y一下七牛干了什么,我們認為我們重新定義了云存儲,重新定義如何服務商業。很多人會問七牛未來會做一些什么,七牛到底會往什么方向發展。我們七牛首先,我認為在這個時代,要符合這個時代的主題思想,就是創新和創造,今天和數據相關的幾個詞有云計算,有大數據。這些詞七牛是如何看待的,如何重新定義這些詞。我覺得2016年可以期待,這就是我今天的演講內容,謝謝大家。