從OtterTune的倒下說起
昨天看到天舟發了一篇文章,提到OtterTune死了。我馬上到OtterTune官網上去看,發現確實如此。
這個在2022年才獲得1200萬美金A輪融資的企業居然就這么倒下了,確實讓我感到有些意外。這個不缺技術,不缺錢的優秀團隊,做的又是十分有前途的數據庫優化,商業模式又是互聯網化的SAAS服務,為什么會在拿到一筆巨額投資后不到兩年就關門歇業了呢?
DJ OT因違反假釋規定而入獄這句話不知道是否暗示了某種原因,不過我不大看得懂這種美國人的幽默。DJ OT是他們的吉祥物,畫面里是被關進了囚牢,而并不是死去了。這畫面是不是暗示了某種不甘和無奈呢?
圖片
上面是他們的核心團隊,中間C位的是卡內基美隆的教授Andy,右邊的 應該是一個華裔。我是在搜索MySQL優化資料的時候發現他們的,因為他們所做的工作和我們有些類似,而且他們的主營業務與我腦子里未來想干的事情十分類似。
圖片
從上面的圖上可以看出,OtterTUNE的商業模式還是相當牛的,通過下載一個DOCKER鏡像或者在GitHub上下載開源的客戶端完成部署,從數據庫中采集數據,通過AGENT上傳到AWS的服務端,通過機器學習訓練模型,并存儲到中央資料庫。然后通過計算引擎分析配置建議,并進行自動化巡檢,找到優化建議,推送給用戶。
上面的模式幾乎和我前些年對D-SMART SAAS服務的設計如出一轍。唯一不同的是,我們的自動化能力是基于運維知識圖譜+專家模型,在一些AI算法的輔助下完成分析,當問題無法明確定位時,還有專家的人工介入。而且我們的內容不僅限于優化推薦,在客戶端已經提供了日常監控、告警和一些簡單的分析工具。只有遇到復雜的問題的時候才需要通過收費的云服務或者遠程專家服務來獲取解決方案。
圖片
OtterTune也為數據庫建立了健康評分,只不過他們評判健康的維度與我們的健康模型相比簡單了一些。數據庫總體、資源、表、索引、查詢這幾個維度比較簡明,針對中小型數據庫系統來說,應該還是比較有效的。
不管怎樣,OtterTune的倒下為數據庫服務提供了一個可參考的反面教材,無論是做SAAS服務、AIOPS還是傳統的DBA,都可以從這個失敗的案例中得到啟示。
圖片
在Reddit上我看到了一個討論帖子,其觀點是“這是一個一次性工具,你無法在上面構建付費的服務”。當一個數據庫在進行初始化的優化后,你只需要管理好其容量,那么這個數據庫將會穩定地運行10年。如果出現問題,大部分可以通過應用側的修改和優化來解決,就不再需要使用OtterTune的服務了。而且對于MySQL、PG這樣的數據庫,在一個數據庫上活動的配置優化經驗,大部分可以不做太多調整就可以用于其他數據庫 實例。因此OtterTune能夠提供的服務真的就成為一次性服務了。如此看來,他們作為SAAS服務的業務模式本身就是不成立的。
圖片
分析OtterTune的功能,最核心的能力是通過AI算法,依托各種歷史模板為用戶提供數據庫參數的最佳配置方案。這些確實都是一次性的功能,一旦調整到位后,無需經常調整了。
圖片
除此之外,表和索引推薦、SQL審計規則是OtterTune的另外一個技術亮點。不過用戶對此的付費意愿也并不強烈,這些技能在開發人員側也很容易構建,并非剛需。
前幾天正好有一個原來的Oracle DBA來電向我咨詢如果他改行去做PG的數據庫服務有沒有前途。我說如果是年輕人,轉行去干PG可能還行,對于一個40多歲,在Oracle領域干了20多年的DBA來說,似乎比較難找到與現在價值相匹配的工作。PG的用戶所需要的服務,以及能夠支付的費用無法與Oracle服務相比,今后運維PG數據庫的方式也與運維Oracle完全不同。你現在去轉行干PG,可能還干不過那些20多歲的小年輕,你的盈利模式在什么地方呢?
回過頭來反思我們目前正在做的智能化運維產品D-SMART,實際上我們在一些MySQL、PG類數據庫為主的客戶側的使用情況也有與OtterTune類似的地方,在系統剛剛部署的時候,往往能幫助用戶發現很多問題。在建議的調整下,很快這些問題就都解決了。之后這套系統最主要的作用就是監控和巡檢了。系統中的一些屠龍絕技往往因為找不到龍來屠而變得沒有那么大的價值了。
昨天下午我也就這個問題和我們團隊的同學們在討論,我們如何才不會走上OtterTune的死路。那就是真正從數據庫運維的痛點入手,而不要總是看不起那些能夠解決技術含量不高,但是實用性很高的功能。
圖片
最近我們正在V2.7中開發兩個日常運維常用的工具,其中一個是殺會話的工具。當某個數據庫出現一些性能等方面的問題的時候,殺會話可能是一個常用的運維動作。不過有些時候當你需要殺會話的時候突然發現數據庫已經無法登錄了,你無法有效地殺掉所需要殺的會話,這時候D-SMART就可以幫助你輕松地幫你分析系統中會話的情況,找到所需要殺的會話,并立即無風險地殺掉。
圖片
另外一個是批量運維工具,當你需要在上百個類似的數據庫中做一個相同的查詢或者運維操作的時候,批量運維工具就十分有用了。開發運維工具不能僅有技術含量的屠龍刀,每天離不開的切菜刀才是最重要的工具。
OtterTune的成功崛起當年給了我們帶來了相當大的鼓舞,原來在這個領域不僅僅是我們一批人在干,在大洋彼岸也有一批和我們有類似想法的人在干類似的事情。OtterTune的倒下也給了我們警示,僅僅在技術上有一套是不行的,技術與市場必須找到契合點,在市場的推動下,產品和服務才能做好。