緩沖區(qū)溢出漏洞那些事：C -gets函數(shù)

作者：SecIN技術(shù)社區(qū) 2022-08-09 08:31:40

攻擊者通過(guò)覆蓋應(yīng)用程序的內(nèi)存來(lái)利用緩沖區(qū)溢出問(wèn)題。這會(huì)改變程序的執(zhí)行路徑，觸發(fā)損壞文件或暴露私人信息的響應(yīng)。例如，攻擊者可能會(huì)引入額外的代碼，向應(yīng)用程序發(fā)送新指令以訪(fǎng)問(wèn) IT 系統(tǒng)。

基本概念

緩沖區(qū)是在數(shù)據(jù)從一個(gè)位置傳輸?shù)搅硪粋€(gè)位置時(shí)臨時(shí)保存數(shù)據(jù)的內(nèi)存存儲(chǔ)區(qū)域。當(dāng)數(shù)據(jù)量超過(guò)內(nèi)存緩沖區(qū)的存儲(chǔ)容量時(shí)，就會(huì)發(fā)生緩沖區(qū)溢出（或緩沖區(qū)溢出）。結(jié)果，試圖將數(shù)據(jù)寫(xiě)入緩沖區(qū)的程序會(huì)覆蓋相鄰的內(nèi)存位置。

緩沖區(qū)溢出原指當(dāng)某個(gè)數(shù)據(jù)超過(guò)了處理程序回傳堆棧地址限制的范圍時(shí)，程序出現(xiàn)的異常操作。造成此現(xiàn)象的原因有：

存在缺陷的程序設(shè)計(jì)
尤其是C語(yǔ)言?，不像其他一些高級(jí)語(yǔ)言?會(huì)自動(dòng)進(jìn)行數(shù)組或者指針的堆棧區(qū)塊邊界檢查，增加溢出風(fēng)險(xiǎn)。
C語(yǔ)言中的C標(biāo)準(zhǔn)庫(kù)還具有一些非常危險(xiǎn)的操作函數(shù)，使用不當(dāng)也為溢出創(chuàng)造條件。

什么是緩沖區(qū)溢出攻擊

如果攻擊者知道程序的內(nèi)存布局，他們可以故意提供緩沖區(qū)無(wú)法存儲(chǔ)的輸入，并覆蓋保存可執(zhí)行代碼的區(qū)域，用他們自己的代碼替換它。例如，攻擊者可以覆蓋指針（指向內(nèi)存中另一個(gè)區(qū)域的對(duì)象）并將其指向漏洞利用負(fù)載，從而獲得對(duì)程序的控制權(quán)。

緩沖區(qū)溢出攻擊的類(lèi)型

基于堆棧的緩沖區(qū)溢出更為常見(jiàn)，并利用僅在函數(shù)執(zhí)行期間存在的堆棧內(nèi)存。

基于堆的攻擊更難執(zhí)行，并且涉及將分配給程序的內(nèi)存空間泛濫到超出用于當(dāng)前運(yùn)行時(shí)操作的內(nèi)存。

哪些編程語(yǔ)言更容易受到攻擊？

C 和 C++ 是兩種極易受到緩沖區(qū)溢出攻擊的語(yǔ)言，因?yàn)樗鼈儧](méi)有內(nèi)置的保護(hù)措施來(lái)防止覆蓋或訪(fǎng)問(wèn)內(nèi)存中的數(shù)據(jù)。Mac OSX、Windows 和 Linux 都使用用 C 和 C++ 編寫(xiě)的代碼。

PERL、Java、JavaScript 和 C# 等語(yǔ)言使用內(nèi)置的安全機(jī)制來(lái)最大限度地減少緩沖區(qū)溢出的可能性。

如何防止緩沖區(qū)溢出

開(kāi)發(fā)人員可以通過(guò)代碼中的安全措施或使用提供內(nèi)置保護(hù)的語(yǔ)言來(lái)防止緩沖區(qū)溢出漏洞。

此外，現(xiàn)代操作系統(tǒng)具有運(yùn)行時(shí)保護(hù)。三種常見(jiàn)的保護(hù)措施是：

地址空間隨機(jī)化 (ASLR)— 隨機(jī)移動(dòng)數(shù)據(jù)區(qū)域的地址空間位置。通常，緩沖區(qū)溢出攻擊需要知道可執(zhí)行代碼的位置，而隨機(jī)化地址空間使得這幾乎不可能。
數(shù)據(jù)執(zhí)行預(yù)防——將某些內(nèi)存區(qū)域標(biāo)記為不可執(zhí)行或可執(zhí)行，從而阻止攻擊在不可執(zhí)行區(qū)域中運(yùn)行代碼。
結(jié)構(gòu)化異常處理程序覆蓋保護(hù) (SEHOP)— 幫助阻止惡意代碼攻擊結(jié)構(gòu)化異常處理 (SEH)，這是一種用于管理硬件和軟件異常的內(nèi)置系統(tǒng)。因此，它可以防止攻擊者利用 SEH 覆蓋利用技術(shù)。在功能級(jí)別上，使用基于堆棧的緩沖區(qū)溢出來(lái)覆蓋存儲(chǔ)在線(xiàn)程堆棧中的異常注冊(cè)記錄來(lái)實(shí)現(xiàn) SEH 覆蓋。

代碼和操作系統(tǒng)保護(hù)中的安全措施是不夠的。當(dāng)組織發(fā)現(xiàn)緩沖區(qū)溢出漏洞時(shí)，它必須迅速做出反應(yīng)以修補(bǔ)受影響的軟件，并確保軟件用戶(hù)可以訪(fǎng)問(wèn)補(bǔ)丁。

示例代碼展示

根據(jù)STACK1_VS_2017.cpp代碼進(jìn)行修改；

#include <stdlib.h>
#include  <stdio.h>
#include "Windows.h"

int main(int argc, char **argv) {

MessageBoxA((HWND)-0, (LPCSTR) "緩沖區(qū)溢出測(cè)試\n", (LPCSTR)"功能", (UINT)0);

int cookie;
char buf[2];
    int *a = &cookie;
    char * b = buf;
printf("buf: %08x cookie: %08x\n", b, a);
    u_int64 p =(u_int64)a-(u_int64)b;
    printf("兩變量?jī)?nèi)存地址之差=%d\n",p);
gets(buf);
if (cookie == 0x41424344)
printf("緩沖區(qū)溢出成功！\n");

}

運(yùn)行效果展示；

使用MessageBoxA函數(shù)檢測(cè)程序是否正常運(yùn)行，點(diǎn)擊確定開(kāi)始測(cè)試

使用printf()函數(shù)輸出提示信息，使用gets()函數(shù)獲取用戶(hù)輸入信息；

任意輸入兩個(gè)數(shù)值，不滿(mǎn)足條件，程序運(yùn)行完畢；

代碼分析漏洞成因

誘因：char buf[2]; 代碼部分解析---使用char 將變量buf聲明成了一個(gè)擁有2個(gè)元素?cái)?shù)組其中元素類(lèi)型為字符.buf有了兩個(gè)自己長(zhǎng)度，

提示：u_int64 p =(u_int64)a-(u_int64)b; 代碼部分對(duì)程序涉及變量了內(nèi)存地址進(jìn)行了一個(gè)減分計(jì)算并對(duì)賦值給變量 p，（為使其運(yùn)算成立還對(duì)其進(jìn)行了類(lèi)型轉(zhuǎn)義），結(jié)果可告知兩個(gè)變量?jī)?nèi)存地址距離，方便溢出利用

隱患：使用gets()函數(shù)獲取輸入數(shù)據(jù)，因gets()函數(shù)無(wú)限讀取數(shù)據(jù)并不檢查緩沖區(qū)的大小限制，會(huì)將超出緩沖區(qū)的數(shù)據(jù)繼續(xù)寫(xiě)入堆棧，導(dǎo)致存在溢出隱患。

為方便理解此處代碼演示下：

#include <stdlib.h>
#include  <stdio.h>
#include "Windows.h"

int main() {
    char test[] = "test1";
    printf("test1初始值為%s\n清輸入st值：",test);
    char st[2];
    gets(st);
    printf("輸出test:%s\n",test);
    printf("輸出st:%s\n",st);
}

在運(yùn)行效果上可以看到超出堆棧空間的值繼續(xù)寫(xiě)入堆棧導(dǎo)致覆蓋了test在堆棧內(nèi)對(duì)應(yīng)的值，導(dǎo)致其數(shù)值進(jìn)行了改變：test1-3456

反匯編分析其運(yùn)行過(guò)程堆棧是如何變化的

有運(yùn)行得知（外加源代碼）程序初始關(guān)鍵詞：test1初始值為test1。

可通過(guò)此關(guān)鍵詞，在反匯編程序快速定位到程序相關(guān)函數(shù)運(yùn)行區(qū)域。

在入口指令處下斷點(diǎn)方便分析。

并在實(shí)際運(yùn)行發(fā)現(xiàn)運(yùn)行到此處為顯示相關(guān)特征字符信息，初步判斷正確。

將此區(qū)域字符串進(jìn)行反編譯與源碼對(duì)照進(jìn)一步驗(yàn)證。

沒(méi)匯編指令對(duì)照不太直觀(guān)換個(gè)插件與工具，進(jìn)行展示。

未輸入st值時(shí)test對(duì)應(yīng)數(shù)據(jù)堆棧情況。

000000000061FDE8 000000000061FE0A "test1"。

輸入后查看。

000000000061FDE8 000000000061FE08 "123456"。

000000000061FDF0 000000000061FE0A "3456" //之前為test1。

根據(jù)此思路分析之前的示例程序。

反匯編分析

根據(jù)之前的思路定位關(guān)閉區(qū)域。

定位特征代碼：

根據(jù)特征代碼搜索；

在入口指令處下斷點(diǎn)；

運(yùn)行看到一個(gè)變量的對(duì)應(yīng)地址；

繼續(xù)運(yùn)行看到另一個(gè)變量的地址；

因剩下的只是運(yùn)行用就不展示了。

輸入數(shù)值后可看到由之前空白數(shù)據(jù)已被輸入的數(shù)據(jù)覆蓋；

擴(kuò)展知識(shí)：發(fā)現(xiàn)棧中對(duì)應(yīng)的值與內(nèi)存對(duì)應(yīng)的值是相反的，因?yàn)槎褩Ｖ械闹底裱冗M(jìn)后出原則故是相反的。

擴(kuò)展分析

看到此區(qū)域有個(gè)je跳轉(zhuǎn)指令，其上方有個(gè)cmp指令(功能是用來(lái)比較)，其中有一值被固定為：41424344。

可以看到明顯不滿(mǎn)足跳轉(zhuǎn)故跳轉(zhuǎn)不會(huì)執(zhí)行，不顯示隱藏的信息。

根據(jù)此思路：輸入兩值將緩沖區(qū)堆滿(mǎn)，之后數(shù)據(jù)溢出覆蓋思路，并且根據(jù)提示計(jì)算出兩變量相距離為2與堆棧數(shù)據(jù)先進(jìn)后出原則，故輸入如下條件即可使跳轉(zhuǎn)成立，進(jìn)而輸出隱藏信息

12DCBA；

跳轉(zhuǎn)成立；

可以看到隱藏信息已顯示；

擴(kuò)展知識(shí)

RSP+2C = rsp對(duì)應(yīng)的地址+2c 即000000000061FDE0+2C=61FE0C；

將16進(jìn)制轉(zhuǎn)10進(jìn)制計(jì)算；

IDA調(diào)試分析使其跟清晰地去查看變化；

為方便分析可在關(guān)鍵函數(shù)處下斷點(diǎn)單步執(zhí)行看執(zhí)行效果；

由之前可知MesssageBoxA后才開(kāi)始正式運(yùn)行，故可在此call后下斷點(diǎn)；

運(yùn)行，直到到斷點(diǎn)暫停；

運(yùn)行后發(fā)現(xiàn)rsi對(duì)應(yīng)數(shù)值無(wú)變化，正常因除了初始賦值后無(wú)其它賦值給rsi的指令；

gets函數(shù)執(zhí)行前rsi對(duì)應(yīng)數(shù)據(jù)仍未變化；

gets函數(shù)執(zhí)行后rsi對(duì)應(yīng)數(shù)據(jù)發(fā)生改變；

ush    rsi
.text:00000000004078D1 push    rbx
.text:00000000004078D2 sub     rsp, 38h
.text:00000000004078D6 call    __main
.text:00000000004078DB lea     rsi, [rsp+48h+var_1E]    初始rsi值
.text:00000000004078E0 xor     r9d, r9d        ; uType
.text:00000000004078E3 xor     ecx, ecx        ; hWnd
.text:00000000004078E5 lea     rbx, [rsp+48h+var_1C]
.text:00000000004078EA lea     r8, Caption     ; lpCaption
.text:00000000004078F1 lea     rdx, Text       ; lpText
.text:00000000004078F8 call    cs:__imp_MessageBoxA
.text:00000000004078FE mov     r8, rbx
.text:0000000000407901 mov     rdx, rsi
.text:0000000000407904 sub     rbx, rsi
.text:0000000000407907 lea     rcx, aBuf08xCookie08 ; "buf: %08x cookie: %08x\n"
.text:000000000040790E call    _Z6printfPKcz   ; printf(char const*,...)
.text:0000000000407913 lea     rcx, byte_40902D ; char *
.text:000000000040791A mov     rdx, rbx
.text:000000000040791D call    _Z6printfPKcz   ; printf(char const*,...)
.text:0000000000407922 mov     rcx, rsi
.text:0000000000407925 call    gets
.text:000000000040792A cmp     [rsp+48h+var_1C], 41424344h
.text:0000000000407932 jz      short loc_40793D

根據(jù)此區(qū)域匯編代碼分析得知，除了初始運(yùn)行對(duì)rsi進(jìn)行賦值后均無(wú)對(duì)其賦值的指令，故可得知存在溢出漏洞，覆蓋了rsi原始數(shù)據(jù)，導(dǎo)致其值改變，根據(jù)單步跟蹤執(zhí)行流程可值執(zhí)行完gets函數(shù)后其值發(fā)生變化，故可判斷使用gets函數(shù)獲取的數(shù)據(jù)導(dǎo)致堆棧數(shù)據(jù)溢出。

修復(fù)

可使用fgets或gets_s函數(shù)替換gets函數(shù)。

函數(shù)解析：

fgets()函數(shù)的第2個(gè)參數(shù)指明了讀入字符的最大數(shù)量。如果該參數(shù)的值是n，那么fgets()將讀入n-1個(gè)字符，或者讀到遇到的第一個(gè)換行符為止；
這里為3，故獲取的數(shù)值為12，共輸入6個(gè)數(shù)讀取到第2個(gè)結(jié)束

IDA附加進(jìn)程并單步執(zhí)行查看執(zhí)行流程；