記一次生產數據庫性能優化實例--避免重復執行相同的 SQL
需求:在釘釘群個人簡介頁面需要顯示釘釘群名稱和簡介,每個群成員的別名,以及釘釘群主的個人簽名信息。其中需求中所需信息存放在以下四個表中:user,user_profile,groups,user_group。
方案選擇
方案1:
先看看最簡單的實現方法,一條 SQL 語句搞定所有事情:
- SELECT name,description,user_type,nick_name,sign FROM groups,user_group,user ,user_profile WHERE groups.id =?
- AND groups.id=user_group.group_id AND useruser_group.user_id=user.id AND useruser_profile.user_id=user.id
方案2:
通過稍微復雜一點的方法分兩步搞定:
首先取得所有需要展示的 釘釘group 的相關信息和所有釘釘群組員的別名信息和組員類別:
- SELECT name,description,user_type,nick_name FROM groups,user_group,user WHERE groups.id =? AND groups.id=user_group.group_id AND useruser_group.user_id=user.id
然后在程序中通過上面結果集中的 user_type 找到群主的 user_id 再到 user_profile 表中取得釘釘群主的個人簽名信息:
- SELECT sign FROM user_profile WHERE user_id =?
方案比較:
以上兩種解決方案最大的區別在于交互次數和 SQL 復雜度。而帶來的實際影響是第一種解決方案對 user_profile表有不必要的訪問(非群主的 profile 信息),造成 IO 訪問的直接增加在 20%左右。而在實際應用中,IO 操作在數據庫應用系統中是非常昂貴的資源。尤其是當這個功能的 PV 較大的時候,第一種方案造成的 IO 損失是相當大的。
總結
重復執行相同的 SQL 造成資源浪費這個問題其實很多人都知道,但是在應用系統開發過程中,仍然會常有這樣的現象存在。究其原因,主要還是開發工程師思維中面向對象的概念太過深入,以及為了減少自己代碼開發的邏輯和對程序接口過度依賴所造成的。