程序體積優化的十個小妙招
本文轉載自微信公眾號「程序喵大人」,作者程序喵大人。轉載本文請聯系程序喵大人公眾號。
大家好,我是程序喵,眾所周知,前兩天,小破站又上市了,慷慨的宣布要給員工加雞腿,激動的喵哥一夜沒睡好,萬萬妹想到啊,人算不如天算,公司真的發了雞腿,沒錯,就是你想的那個。
雞腿啥的不想了,我還是安心肝文章吧。。。
前一段時間在知乎上看到個問題:Linux如何優化可執行程序的體積?
在我們的日常工作中,一般對程序的體積都有嚴格的要求,有時候僅僅因為幾字節的代碼段體積或者多了幾十毫秒的運行時間,整個項目就達不到驗收標準,甚至不能成功上線。這里我拋磚引玉先提出幾個思路,大家如果有好的優化策略歡迎打在評論區。
大體思路有這些:
- 好好寫代碼,減小代碼段體積,別人300代碼的邏輯我們50行搞定,程序體積肯定有機會更小一些,這個就得考驗開發者自己的編程功底了
- 如果是C++程序,可以盡量減少模板的使用,模板實例化可能會導致代碼膨脹
- 不用引用沒有用的頭文件
- 使用strip,像脫衣服一樣,移除程序的所有符號,這也是很多開發者常用的方式
- strip只會清除普通符號,不會動態符號表中的符號,某些動態符號其實也可以隱藏掉,進而來減小庫的體積,可以使用-fvisibility=hidden命令
- 巧用.bss段,未初始化的全局變量和局部靜態變量會存在.bss段中,這些變量不占用程序空間
- inline-limit:內聯過多會導致代碼段體積較大,可以通過此優化選項減少內聯的數量
- 開啟Os編譯,這是產生較小代碼體積的優化選項
- 適當使用編譯選項-fdata-sections和-ffunction-sections
- 考慮鏈接動態庫而非靜態庫
以上說的太籠統了?貼心如我早就準備好了,不謝~
strip使用
在Linux中可以使用man strip查看strip使用方法,最主要的就是移除所有符號的-s參數,用于清除所有的符號信息:
- strip -s xxx
在使用strip之前先使用nm查看下可執行程序的符號信息:
- ~/test$ nm a.out
- 0000000000200da0 d _DYNAMIC
- 0000000000200fa0 d _GLOBAL_OFFSET_TABLE_
- 000000000000089b t _GLOBAL__sub_I__Z4funcPc
- 0000000000000930 R _IO_stdin_used
- w _ITM_deregisterTMCloneTable
- w _ITM_registerTMCloneTable
- 0000000000000852 t _Z41__static_initialization_and_destruction_0ii
- 00000000000007fa T _Z4funcPc
- 000000000000081c T _Z4funci
- U _ZNSt8ios_base4InitC1Ev@@GLIBCXX_3.4
- U _ZNSt8ios_base4InitD1Ev@@GLIBCXX_3.4
- 0000000000201020 B _ZSt4cout@@GLIBCXX_3.4
- 0000000000000934 r _ZStL19piecewise_construct
- 0000000000201131 b _ZStL8__ioinit
- U _ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@@GLIBCXX_3.4
- 0000000000000b24 r __FRAME_END__
- 0000000000000940 r __GNU_EH_FRAME_HDR
- 0000000000201010 D __TMC_END__
- 0000000000201010 B __bss_start
- U __cxa_atexit@@GLIBC_2.2.5
- w __cxa_finalize@@GLIBC_2.2.5
- 0000000000201000 D __data_start
- 00000000000007b0 t __do_global_dtors_aux
- 0000000000200d98 t __do_global_dtors_aux_fini_array_entry
- 0000000000201008 D __dso_handle
- 0000000000200d88 t __frame_dummy_init_array_entry
- w __gmon_start__
- 0000000000200d98 t __init_array_end
- 0000000000200d88 t __init_array_start
- 0000000000000920 T __libc_csu_fini
- 00000000000008b0 T __libc_csu_init
- U __libc_start_main@@GLIBC_2.2.5
- 0000000000201010 D _edata
- 0000000000201138 B _end
- 0000000000000924 T _fini
- 0000000000000688 T _init
- 00000000000006f0 T _start
- 0000000000201130 b completed.7698
- 0000000000201000 W data_start
- 0000000000000720 t deregister_tm_clones
- 00000000000007f0 t frame_dummy
- 000000000000083d T main
- 0000000000000760 t register_tm_clones
當前這個可執行程序的文件大小是8840字節:
- -rwxrwxrwx 1 a a 8840 Nov 29 14:54 a.out
使用strip清除符號信息:
- ~/test$ strip -s a.out
strip后再查看可執行文件的符號信息:
- ~/test$ nm a.out nm: a.out: no symbols
發現什么符號都沒有了,但還是可以執行。
strip后的可執行程序文件大小是6120字節:
- -rwxrwxrwx 1 a a 6120 Nov 29 14:54 a.out
具體可以看我這篇文章:《Linux有一個命令你一定要知道》
-fvisibility=hidden可以這樣使用:
- $ g++ -fvisibility=hidden -c layer.cxx -o layer.o
巧用.bss段:
看下面代碼:
- #include <stdio.h>
- int a[1000];
- int b[1000] = {1};
- int main() {
- printf("程序喵\n");
- return 0;
- }
我們查看下文件大小和各個段大小:
- $ gcc testlink.c -o test
- $ ls -l test
- -rwxrwxrwx 1 wzq wzq 12368 May 30 08:48 test
- $ size test
- text data bss dec hex filename
- 1512 4616 4032 10160 27b0 test
再看這段初始化的代碼:
- #include <stdio.h>
- int a[1000] = {1};
- int b[1000] = {1};
- int main() {
- printf("程序喵\n");
- return 0;
- }
再查看下文件大小和各個段大小:
- $ gcc testlink.c -o test
- $ ls -l test
- -rwxrwxrwx 1 wzq wzq 16368 May 30 08:49 test
- $ size test
- text data bss dec hex filename
- 1512 8616 8 10136 2798 test
可以看到僅僅是做了一次初始化,文件大小就從12368變成了16368,正好是初始化了的那a[1000]的大小,這4000字節從.bss段移動到了.data段,程序大小增加了,這里可以看出.bss段不占據磁盤空間。
巧用-fdata-sections和-ffunction-sections:
現在的程序和庫通常來講都很大,一個目標文件可能包含成百上千個函數或變量,當需要用到某個目標文件的任意一個函數或變量時,就需要把它整個目標文件都鏈接進來,也就是說那些沒有用到的函數也會被鏈接進去,這會導致鏈接輸出文件變的很大,造成空間浪費。
有一個編譯選項叫函數級別鏈接,可以使得某個函數或變量單獨保存在一個段里面,都鏈接器需要用到某個函數時,就將它合并到輸出文件中,對于沒用到的函數則將他們拋棄,減少空間浪費,但這會減慢編譯和鏈接過程,GCC編譯器的編譯選項是:
- -ffunction-sections -fdata-sections