GPU 驅(qū)動漏洞：窺探驅(qū)動漏洞利用的技術(shù)奧秘

當前位置：點晴教程→知識管理交流 →『技術(shù)文檔交流』

freeflydom

2024年12月16日 9:31 本文熱度 745

本文嘗試以 GPU 漏洞為引介紹圍繞 GPU 驅(qū)動這一攻擊面，安全研究人員對內(nèi)核漏洞利用技術(shù)做的一些探索。

背景介紹

目前移動 SOC 平臺上由多個硬件模塊組成，常見的硬件模塊有：CPU、GPU、Modem基帶處理器、ISP（圖像處理器）等，這些硬件模塊通過硬件總線互聯(lián)，協(xié)同完成任務(wù)。

對于 GPU 驅(qū)動漏洞研究來說，我們需要關(guān)注的一個關(guān)鍵特性是 GPU 和 CPU 共用同一塊 RAM。在 CPU 側(cè)操作系統(tǒng)通過管理 CPU MMU 的頁表來實現(xiàn)虛擬地址到物理地址的映射

GPU 也有自己的 MMU，不過 GPU 的頁表由 CPU 內(nèi)核中的 GPU 驅(qū)動管理，從而限制 GPU 能夠訪問的物理地址范圍。

在實際的業(yè)務(wù)使用中，一般是 CPU 側(cè)分配一段物理內(nèi)存，然后映射給 GPU ， GPU 從共享內(nèi)存中取出數(shù)據(jù)完成計算、渲染后再將結(jié)果寫回共享內(nèi)存，從而完成 GPU 與 GPU 之間的交互。對于 GPU 驅(qū)動安全研究來說，特殊的攻擊面在于由于其需要維護 GPU 頁表，這個過程比較復雜，涉及到內(nèi)核中的各個模塊的配合，非常容易出現(xiàn)問題，歷史上也出現(xiàn)了多個由于 GPU 頁表管理失誤導致的安全漏洞

以 ARM Mali 驅(qū)動為例，這幾年出現(xiàn)的幾個比較有代表性的漏洞如下：

漏洞	類型	漏洞原語
CVE-2021-39793	頁權(quán)限錯誤	篡改只讀映射到用戶進程的物理頁
CVE-2021-28664	頁權(quán)限錯誤	篡改只讀映射到用戶進程的物理頁
CVE-2021-28663	GPU MMU 操作異常	物理頁 UAF
CVE-2023-4211	條件競爭 UAF	SLUB 對象 UAF
CVE-2023-48409	整數(shù)溢出	堆溢出
CVE-2023-26083	內(nèi)核地址泄露	內(nèi)核地址泄露
CVE-2022-46395	條件競爭 UAF	物理頁 UAF

其中前 3 個漏洞是管理 GPU 頁表映射時的漏洞，后面幾個就是常規(guī)驅(qū)動漏洞類型

CVE-2021-28664

分析代碼下載：https://armkeil.blob.core.windows.net/developer/Files/downloads/mali-drivers/kernel/mali-bifrost-gpu/BX304L01B-SW-99002-r19p0-01rel0.tar

先以最簡單的漏洞開始講起，這個漏洞算是 Mali 第一個出名的漏洞了，同期出道的還有 CVE-2021-28664，這個漏洞是由 Project Zero 捕獲的在野利用，該漏洞的 Patch 如下

 static struct kbase_va_region *kbase_mem_from_user_buffer(
                struct kbase_context *kctx, unsigned long address,
                unsigned long size, u64 *va_pages, u64 *flags)
 {
[...]
+       int write;
[...]
+       write = reg->flags & (KBASE_REG_CPU_WR | KBASE_REG_GPU_WR);
+
 #if KERNEL_VERSION(4, 6, 0) > LINUX_VERSION_CODE
        faulted_pages = get_user_pages(current, current->mm, address, *va_pages,
 #if KERNEL_VERSION(4, 4, 168) <= LINUX_VERSION_CODE && \
 KERNEL_VERSION(4, 5, 0) > LINUX_VERSION_CODE
-                       reg->flags & KBASE_REG_CPU_WR ? FOLL_WRITE : 0,
-                       pages, NULL);
+                       write ? FOLL_WRITE : 0, pages, NULL);
 #else
-                       reg->flags & KBASE_REG_CPU_WR, 0, pages, NULL);
+                       write, 0, pages, NULL);
 #endif
 #elif KERNEL_VERSION(4, 9, 0) > LINUX_VERSION_CODE
        faulted_pages = get_user_pages(address, *va_pages,
-                       reg->flags & KBASE_REG_CPU_WR, 0, pages, NULL);
+                       write, 0, pages, NULL);
 #else
        faulted_pages = get_user_pages(address, *va_pages,
-                       reg->flags & KBASE_REG_CPU_WR ? FOLL_WRITE : 0,
-                       pages, NULL);
+                       write ? FOLL_WRITE : 0, pages, NULL);
 #endif

Patch 的關(guān)鍵點在于將 get_user_pages 參數(shù)中的 reg->flags & KBASE_REG_CPU_WR 換成了 reg->flags & (KBASE_REG_CPU_WR | KBASE_REG_GPU_WR) ，這兩個標記的作用如下：

KBASE_REG_CPU_WR：表示 reg 能夠已寫權(quán)限映射到用戶態(tài)進程
KBASE_REG_GPU_WR: 表示 reg 能夠已寫權(quán)限映射到 GPU

reg 的類型為 struct kbase_va_region ， MALI 驅(qū)動中使用 kbase_va_region 管理物理內(nèi)存，包括物理內(nèi)存的申請/釋放、GPU/CPU 頁表映射管理等。

圖中的關(guān)鍵要素如下：

kbase_va_region 中 cpu_alloc 和 gpu_alloc 指向 kbase_mem_phy_alloc ，表示該 reg 擁有的物理頁，且大部分場景下 cpu_alloc = gpu_alloc
kbase_va_region 的 flags 字段控制驅(qū)動映射 reg 時的權(quán)限，假如 flags 為 KBASE_REG_CPU_WR 表示該 reg 能夠被 CPU 映射為可寫權(quán)限，如果沒有該 flag 則不允許將 reg 以可寫模式映射到 CPU 進程，確保無法進程修改這些物理頁

核心觀點：驅(qū)動利用 kbase_va_region 表示一組物理內(nèi)存，這組物理內(nèi)存可以被 CPU 上的用戶進程和 GPU 分別映射，映射的權(quán)限由 reg->flags 字段控制.

回到漏洞本身，其調(diào)用路徑中的關(guān)鍵代碼如下：

kbase_api_mem_import
1. u64 flags = import->in.flags;
2. kbase_mem_import(kctx, import->in.type, u64_to_user_ptr(import->in.phandle), import->in.padding, &import->out.gpu_va, &import->out.va_pages, &flags);
  1. copy_from_user(&user_buffer, phandle
  2. uptr = u64_to_user_ptr(user_buffer.ptr);
  3. kbase_mem_from_user_buffer(kctx, (unsigned long)uptr, user_buffer.length, va_pages, flags)
    1. struct kbase_va_region *reg = kbase_alloc_free_region(rbtree, 0, *va_pages, zone);
    2. kbase_update_region_flags(kctx, reg, *flags) // 根據(jù)用戶態(tài)提供的 flags 設(shè)置 reg->flags
    3. faulted_pages = get_user_pages(address, *va_pages, reg->flags & KBASE_REG_GPU_WR, 0, pages, NULL);

漏洞在于傳遞 get_user_pages 參數(shù)是只考慮了 KBASE_REG_GPU_WR 情況，沒有考慮 KBASE_REG_CPU_WR，當 reg->flags 為 KBASE_REG_CPU_WR 時 get_user_pages 的第三個參數(shù)為 0

/*
 * This is the same as get_user_pages_remote(), just with a
 * less-flexible calling convention where we assume that the task
 * and mm being operated on are the current task's and don't allow
 * passing of a locked parameter.  We also obviously don't pass
 * FOLL_REMOTE in here.
 */
long get_user_pages(unsigned long start, unsigned long nr_pages,
		unsigned int gup_flags, struct page **pages,
		struct vm_area_struct **vmas)
{
	return __get_user_pages_locked(current, current->mm, start, nr_pages,
				       pages, vmas, NULL, false,
				       gup_flags | FOLL_TOUCH);
}

get_user_pages 的作用的是根據(jù)用戶進程提供的 va （start）遍歷進程頁表，返回的是 va 對應(yīng)物理地址對應(yīng)的 page 結(jié)構(gòu)體指針，結(jié)果保存到 pages 數(shù)組中。

即根據(jù) task_struct->mm 找到進程頁表，遍歷頁表獲取物理地址

其中如果 gup_flags 為 1，表示獲取 va 對應(yīng) page 后會寫入 page 對應(yīng)的物理頁，然后在 get_user_pages 內(nèi)部需要對只讀頁面和 COW 頁面做額外處理，避免這些特殊 va 對應(yīng)的物理頁被修改導致非預期行為。

如果 vma 為只讀，API 返回錯誤碼
VA 的映射為 COW 頁，在 API 內(nèi)會完成寫時拷貝，并返回新分配的 page

當 gup_flags 為 0 時則直接返回頁表遍歷的結(jié)果（P0）

對于這個漏洞而言，我們可以創(chuàng)建一個 reg->flags 為 KBASE_REG_CPU_WR 的 kbase_va_region，再導入頁面時就可以獲取進程中任意 va 對應(yīng) page 到 kbase_va_region，最后再將其以可寫權(quán)限映射到用戶態(tài)進程，這樣就可以實現(xiàn)篡改進程中任意只讀映射對應(yīng)的物理頁。

這一原語要進一步利用需要依賴操作系統(tǒng)的機制，首先介紹最簡單的一種利用方式，Linux 內(nèi)核在處理磁盤中的文件系統(tǒng)時，會對從磁盤中讀取的物理頁做緩存來加速文件訪問的性能，同時減少重復文件物理頁，減少開銷

如果所示：

當進程嘗試讀取物理頁時，比如只讀權(quán)限 mmap ，內(nèi)核會搜索 page cache 如果找到就直接返回，否則就從磁盤中加載物理頁到 Page Cache 中，然后返回
如果是寫則會有對應(yīng)的 flush cache 機制

具體來說，當兩個進程同時以只讀權(quán)限 mmap libc.so 文件時，這兩個進程的 VA 會指向同一個物理頁

這樣當我們利用漏洞修改 Page Cache 中的物理頁后，其他進程也會受到影響，因為都是映射的同一塊物理地址，因此攻擊思路就來了：

只讀映射 libc.so 利用漏洞篡改其在 Page Cache 中物理頁，在其中注入 shellcode，等高權(quán)限進程調(diào)用時就能提權(quán)
類似的手法修改 /etc/passwd 完成提權(quán)

除了修改文件系統(tǒng)的 Page Cache 外，在 Android 平臺上還有一個非常好的目標，binder 驅(qū)動會往用戶態(tài)進程映射只讀 page，里面的數(shù)據(jù)結(jié)構(gòu)為 flat_binder_object，binder_transaction_buffer_release 里面會使用 flat_binder_object->handle，相關(guān)代碼如下：

首先通過 binder_get_node 查找 node，然后會調(diào)用 binder_put_node 減少 node 的引用計數(shù)，當 node 引用為0時會釋放 node。

由于 flat_binder_object 所在物理頁用戶態(tài)無法修改，所以可以保證這個流程的正確性，當我們只讀物理頁寫漏洞篡改 flat_binder_object->handle 指向另一個 node 時，觸發(fā) binder_transaction_buffer_release 就能導致 node 引用計數(shù)不平衡

最后可以將漏洞轉(zhuǎn)換為 binder_node 的UAF，然后采用 CVE-2019-2205 的利用方式進行漏洞利用即可。

此外類似的漏洞在 2016 年就已經(jīng)出現(xiàn)在高通 GPU 驅(qū)動中，CVE-2016-2067：

同樣的業(yè)務(wù)場景，也意味著同類型的漏洞也可能會產(chǎn)生

CVE-2021-28663

該漏洞是 Mali 驅(qū)動在管理 GPU 物理頁映射時導致的物理頁 UAF 漏洞，為了能夠理解該漏洞，首先需要對 Mali 驅(qū)動的相關(guān)代碼有所了解，上節(jié)提到 Mali 使用 kbase_va_region 對象表示物理內(nèi)存資源，然后 CPU 用戶進程和 GPU 可以按需映射，對物理內(nèi)存進行訪問。

kbase_va_region 的創(chuàng)建位于 kbase_api_mem_alloc 接口，其關(guān)鍵代碼如下：

kbase_api_mem_alloc
- kbase_mem_alloc(kctx, alloc->in.va_pages, alloc->in.commit_pages, alloc->in.extent, &flags, &gpu_va);
  1. reg = kbase_alloc_free_region(rbtree, 0, va_pages, zone); // 分配reg
  2. kbase_reg_prepare_native(reg, kctx, base_mem_group_id_get(*flags))
    1. reg->cpu_alloc = kbase_alloc_create(kctx, reg->nr_pages, KBASE_MEM_TYPE_NATIVE, group_id);
    2. reg->gpu_alloc = kbase_mem_phy_alloc_get(reg->cpu_alloc);
  3. kbase_alloc_phy_pages(reg, va_pages, commit_pages) // 為 reg 分配物理內(nèi)存
  4. if *flags & BASE_MEM_SAME_VA
    - kctx->pending_regions[cookie_nr] = reg;
    - cpu_addr = vm_mmap(kctx->filp, 0, va_map, prot, MAP_SHARED, cookie); // 映射物理內(nèi)存到 GPU 和 CPU 頁表
  5. else
    - kbase_gpu_mmap(kctx, reg, 0, va_pages, 1) // 映射物理內(nèi)存到 GPU 頁表
      - 編輯 GPU 頁表插入映射
      - atomic_inc(&alloc->gpu_mappings); // 增加 gpu_mappings 記錄其被 GPU 的引用情況

對于 BASE_MEM_SAME_VA 情況驅(qū)動會做特殊處理，SAME_VA 的意思是在映射 reg 時，GPU 和 CPU 的虛擬地址是一樣的，這樣可能是為了便于數(shù)據(jù)傳遞時，之間進行指針傳遞。

如果沒有設(shè)置 BASE_MEM_SAME_VA 則會之間將物理內(nèi)存映射到 GPU，否則就會通過 vm_mmap --> kbase_mmap --> kbasep_reg_mmap 將物理內(nèi)存以同樣的 VA 映射到 GPU 和 CPU 側(cè)。

兩者均是使用 kbase_gpu_mmap 將 reg 對應(yīng)的物理內(nèi)存映射到 GPU 的頁表中.

kbase_va_region 的釋放位于 kbase_api_mem_free 接口，其關(guān)鍵代碼如下：

kbase_api_mem_free
- reg = kbase_region_tracker_find_region_base_address(kctx, gpu_addr);
- err = kbase_mem_free_region(kctx, reg);
  - kbase_gpu_munmap(kctx, reg); // 刪除 GPU 映射
  - kbase_free_alloced_region(reg);
    1. kbase_mem_phy_alloc_put(reg->cpu_alloc);
    2. kbase_mem_phy_alloc_put(reg->gpu_alloc);
    3. kbase_va_region_alloc_put(kctx, reg);

這個的大體邏輯是先根據(jù) gpu_addr 找到 reg，然后釋放 reg 和 reg->xx_alloc 的引用，對于這種復雜的對象管理，可以先按照正常流程分析下對象之間的關(guān)系， kbase_va_region 中與生命周期相關(guān)的字段如下：

上圖表示的是 kbase_api_mem_alloc 創(chuàng)建非 SAME_VA 內(nèi)存的場景，kbase_gpu_mmap 執(zhí)行后會對 gpu_mappings 加一，然后通過 kbase_api_mem_free 釋放時，會將 kbase_va_region 和 kbase_mem_phy_alloc 的引用計數(shù)減成0，從而釋放兩個對象

如果是 SAME_VA 的情況如下，區(qū)別在于 SAME_VA 內(nèi)存在 kbase_api_mem_alloc 中會調(diào)用 vm_mmap 把 reg 同時映射到 CPU 和 GPU 側(cè)，這就需要增加對應(yīng)的引用計數(shù)（va_refcnt、kref、gpu_mappings），然后在 munmap 進程 VA 時，減少對應(yīng)的引用計數(shù)

對驅(qū)動的對象管理有大概的認知后，具體看下漏洞相關(guān)的兩個接口 kbase_api_mem_alias 和 kbase_api_mem_flags_change，分別利用的功能：

kbase_api_mem_alias：創(chuàng)建別名映射，即新分配一個 reg 與其他已有的 reg 共享 kbase_mem_phy_alloc
kbase_api_mem_flags_change：釋放 kbase_mem_phy_alloc 中的物理頁

kbase_api_mem_alias 的關(guān)鍵代碼如下：

kbase_mem_alias
1. reg = kbase_alloc_free_region(&kctx->reg_rbtree_same, 0, *num_pages, KBASE_REG_ZONE_SAME_VA);
2. reg->gpu_alloc = kbase_alloc_create(kctx, 0, KBASE_MEM_TYPE_ALIAS,
3. reg->cpu_alloc = kbase_mem_phy_alloc_get(reg->gpu_alloc);
4. aliasing_reg = kbase_region_tracker_find_region_base_address( kctx, (ai[i].handle.basep.handle >> PAGE_SHIFT) << PAGE_SHIFT);
5. alloc = aliasing_reg->gpu_alloc;
6. reg->gpu_alloc->imported.alias.aliased[i].alloc = kbase_mem_phy_alloc_get(alloc);
7. kctx->pending_regions[gpu_va] = reg;

主要是增加了 alloc 的引用計數(shù) （kref），然后將其放入 kctx->pending_regions，之后進程再通過 mmap 完成 CPU 和 GPU 映射（kbase_context_mmap）

if (reg->gpu_alloc->type == KBASE_MEM_TYPE_ALIAS) {
	u64 const stride = alloc->imported.alias.stride;
	for (i = 0; i < alloc->imported.alias.nents; i++) {  // 映射 aliased 中的各個 alloc 并增加 gpu_mappings
		if (alloc->imported.alias.aliased[i].alloc) {
			err = kbase_mmu_insert_pages(kctx->kbdev,
					&kctx->mmu,
					reg->start_pfn + (i * stride),
					alloc->imported.alias.aliased[i].alloc->pages + alloc->imported.alias.aliased[i].offset,
					alloc->imported.alias.aliased[i].length,
					reg->flags & gwt_mask,
					kctx->as_nr,
					group_id);
			kbase_mem_phy_alloc_gpu_mapped(alloc->imported.alias.aliased[i].alloc);
		}
	}

創(chuàng)建別名映射進程調(diào)用 mmap 前后， reg 對象相關(guān)引用情況如下：

在 kbase_api_mem_alias 里面增加 aliased[i]->kref 確保其在使用過程中不會被釋放，然后 kbase_mmap 映射內(nèi)存時增加 aliased[i]->gpu_mappings 記錄其被 GPU 映射的次數(shù)，同時增加 reg->va_refcnt 記錄其被 CPU 映射的次數(shù)，這個流程是沒有問題的，通過引用計數(shù)確保 aliased 中的對象不會釋放。

問題就出在 kbase_api_mem_flags_change 能在不釋放 alloc 時釋放其中的物理頁：

kbase_api_mem_flags_change
- kbase_mem_flags_change
  1. reg = kbase_region_tracker_find_region_base_address(kctx, gpu_addr);
  2. 校驗 atomic_read(&reg->cpu_alloc->gpu_mappings) > 1
  3. kbase_mem_evictable_make(reg->gpu_alloc); // 釋放 alloc 中的物理頁

kbase_api_mem_flags_change 可以利用 kbase_mem_evictable_make 將 gpu_alloc 放到驅(qū)動自己管理的鏈表中（kctx->evict_list）當內(nèi)核指向 shrink 操作時驅(qū)動會釋放該鏈表上掛的所有 gpu_alloc。

kbase_mem_evictable_make
1. kbase_mem_shrink_cpu_mapping(kctx, gpu_alloc->reg, 0, gpu_alloc->nents); // 移除 CPU 映射
2. list_add(&gpu_alloc->evict_node, &kctx->evict_list); // 加到鏈表中

shrink 時釋放 kbase_mem_phy_alloc 物理頁的代碼：

kbase_mem_evictable_reclaim_scan_objects
1. kbase_mem_shrink_gpu_mapping(kctx, alloc->reg, 0, alloc->nents); // 刪除 GPU 頁表項
  - kbase_mmu_teardown_pages(kctx->kbdev, &kctx->mmu, reg->start_pfn + new_pages, delta, kctx->as_nr);
2. kbase_free_phy_pages_helper(alloc, alloc->evicted); // 釋放物理頁

kbase_mem_flags_change 在調(diào)用 kbase_mem_evictable_make 前會校驗 gpu_mappings ，大概意思是如果這個 reg 被 GPU 多次映射了就不能執(zhí)行物理內(nèi)存釋放操作，但是回到 alias 的流程，在 kbase_api_mem_alias 結(jié)束后，aliased 數(shù)組中的 gpu_mappings 還是 1

此時調(diào)用 kbase_mem_flags_change 將 aliased[i] 放到 kctx->evict_list，此時 alloc->pages 里面的值沒有變化

然后再調(diào)用 mmap 映射 kbase_mem_alias 創(chuàng)建的 reg 將 aliased[i] 中的物理頁（alloc->pages）映射到 GPU 側(cè)，假設(shè)為映射的 VA 為 ALIAS_VA

最后觸發(fā) shrink 機制，釋放 aliased[i] 中的物理頁，之后 ALIAS_VA 還指向已經(jīng)釋放的物理頁，導致物理頁 UAF.

再次回顧漏洞根因，漏洞是驅(qū)動在建立別名映射時對 gpu_mappings 的管理不當，結(jié)合 kbase_api_mem_flags_change 釋放物理頁的邏輯，達成物理頁 UAF，這種漏洞的挖掘個人理解需要先分析內(nèi)存對象（堆、物理內(nèi)存）的生命周期，然后組合各個 API 的時序看是否會產(chǎn)生非預期行為，重點還是對象的釋放、申請、復制等邏輯。

物理頁 UAF 的漏洞利用技術(shù)目前已經(jīng)比較成熟，這里列幾個常用的方式：

篡改進程頁表：通過 fork + mmap 大量分配進程頁表占位釋放的物理頁，然后通過 GPU 修改頁表實現(xiàn)任意物理內(nèi)存讀寫
篡改 GPU 頁表：通過 GPU 驅(qū)動接口分配 GPU 頁表占位釋放的物理頁，然后通過 GPU 修改頁表實現(xiàn)任意物理內(nèi)存讀寫
篡改內(nèi)核對象：通過噴射內(nèi)核對象（比如 task_struct、cred）占位，然后 GPU 修改對象實現(xiàn)利用

CVE-2022-46395

前面兩個漏洞的利用路徑大概是：發(fā)現(xiàn)一個新漏洞，挖掘一種新漏洞利用方式完成利用，本節(jié)這個漏洞則是將漏洞轉(zhuǎn)換為 CVE-2021-28663 ，因為 28663 的能力確實太強大了，物理頁 UAF 的利用簡單、直接，目前堆上的漏洞利用也逐步往物理頁UAF 轉(zhuǎn)換（Dirty Pagetable）

漏洞是一個條件競爭漏洞，kbase_vmap_prot 后其他線程可以釋放 mapped_evt 對應(yīng)的物理頁

static int kbasep_write_soft_event_status(
        struct kbase_context *kctx, u64 evt, unsigned char new_status)
{
    ...
    mapped_evt = kbase_vmap_prot(kctx, evt, sizeof(*mapped_evt),
                     KBASE_REG_CPU_WR, &map);
    //Race window start
    if (!mapped_evt)                  
        return -EFAULT;
    *mapped_evt = new_status;
    //Race window end
    kbase_vunmap(kctx, &map);
    return 0;
}

為了擴大 race 的時間窗，作者利用 timerfd 時鐘中斷技術(shù)

  migrate_to_cpu(0);   //<------- pin this task to a cpu
  int tfd = timerfd_create(CLOCK_MONOTONIC, 0);   //<----- creates timerfd
  //Adds epoll watchers
  int epfds[NR_EPFDS];
  for (int i=0; i<NR_EPFDS; i++)
    epfds[i] = epoll_create1(0);
  for (int i=0; i<NR_EPFDS; i++) {
    struct epoll_event ev = { .events = EPOLLIN };
    epoll_ctl(epfd[i], EPOLL_CTL_ADD, fd, &ev);
  }  
  
  timerfd_settime(tfd, TFD_TIMER_ABSTIME, ...);  //<----- schedule tfd to be available at a later time
  ioctl(mali_fd, KBASE_IOCTL_SOFT_EVENT_UPDATE,...); //<---- tfd becomes available and interrupts this ioctl

大致思路就是在 kbase_vmap_prot 和 *mapped_evt 之間出發(fā)時鐘中斷，從而擴大時間窗，在兩步之間釋放 mapped_evt 對應(yīng)的物理頁，就能夠達到物理頁 UAF 的能力。

mapped_evt 在頁內(nèi)的偏移可控，寫的內(nèi)容為 0 或者 1，總結(jié)下來漏洞的原語是物理內(nèi)存 UAF 寫，寫的值只能 0 或者 1

static inline struct kbase_mem_phy_alloc *kbase_alloc_create(
        struct kbase_context *kctx, size_t nr_pages,
        enum kbase_memory_type type, int group_id)
{
    ...
    size_t alloc_size = sizeof(*alloc) + sizeof(*alloc->pages) * nr_pages;
    ...
    /* Allocate based on the size to reduce internal fragmentation of vmem */
    if (alloc_size > KBASE_MEM_PHY_ALLOC_LARGE_THRESHOLD)
        alloc = vzalloc(alloc_size);
    else
        alloc = kzalloc(alloc_size, GFP_KERNEL);
    ...
}

kbase_alloc_create 分配 kbase_mem_phy_alloc 時會調(diào)用 vzalloc 分配內(nèi)存，vzalloc 的邏輯是根據(jù)大小計算分配的物理頁數(shù)目，然后逐次調(diào)用 alloc_page 分配物理頁，利用這個邏輯可以比較快速的占位剛剛釋放的物理頁（slab cross cache 時間相對較長）

根據(jù)之前的漏洞分析，我們知道 gpu_mappings 控制的物理頁的釋放，如果通過 UAF 將其修改為 0 或者 1，就能提前釋放一個被別名映射的 kbase_mem_phy_alloc 中的物理頁，導致物理頁UAF

struct kbase_mem_phy_alloc {
	struct kref           kref;
	atomic_t              gpu_mappings;
	size_t                nents;
	struct tagged_addr    *pages;
	struct list_head      mappings;

實現(xiàn)無限制的物理頁 UAF 讀寫后，就是常規(guī)的漏洞利用流程了。這個漏洞利用的核心是利用 GPU 驅(qū)動的物理內(nèi)存管理結(jié)構(gòu)，將一個受限的 UAF 寫轉(zhuǎn)化為不受限的物理頁 UAF.

利用非GPU漏洞攻擊 GPU

前面的案例都是利用 GPU 自身漏洞，這個案例則是將其他驅(qū)動、模塊漏洞（攝像頭驅(qū)動的堆溢出漏洞）的漏洞轉(zhuǎn)換為 GPU 漏洞，進而實現(xiàn)物理頁 UAF 漏洞，核心思路與 CVE-2022-46395 一致，就是篡改 kbase_mem_phy_alloc 的 gpu_mappings 為 0，構(gòu)造物理頁 UAF

static inline struct kbase_mem_phy_alloc *kbase_alloc_create(
        struct kbase_context *kctx, size_t nr_pages,
        enum kbase_memory_type type, int group_id)
{
    ...
    size_t alloc_size = sizeof(*alloc) + sizeof(*alloc->pages) * nr_pages;
    ...
    alloc = kzalloc(alloc_size, GFP_KERNEL);
    ...
}

一個比較有意思的點是研究員發(fā)現(xiàn)及時安卓內(nèi)核啟用了 MTE，仍然有 50% 的概率能夠完成溢出而不被檢測，且及時 MTE 檢測到溢出，也不會導致內(nèi)核 Panic，只是殺掉用戶進程，這樣就給了攻擊者無限嘗試的能力，相當于 Bypass 了 MTE.

總結(jié)

從 CVE-2021-28663/CVE-2021-28664 開始研究人員逐漸重視并投入到 GPU 驅(qū)動安全領(lǐng)域，從一開始的挖掘 GPU 特有漏洞，到后面逐步將各種通用漏洞往 GPU 漏洞上轉(zhuǎn)換，核心原因在于 GPU 驅(qū)動本身的能力太強大了，只要能夠控制 GPU硬件的頁表，就能實現(xiàn)任意物理頁的讀寫，而且由于是獨立的硬件，可以直接 Bypass 掉 CPU 側(cè)的安全特性（比如 KNOX、PAC、MTE），Patch 內(nèi)核代碼。

GPU 安全研究還帶來了另一個漏洞利用方向，GPU 驅(qū)動由于要管理物理內(nèi)存，所以容易出現(xiàn)物理內(nèi)存 UAF，物理 UAF 的利用手段被發(fā)掘后，大家發(fā)現(xiàn)這個原語實在太強大了，后面涌現(xiàn)了很多將不同漏洞轉(zhuǎn)換為物理頁UAF的技術(shù)，比如 Dirty Pagetable、USMA、 pipe_buffer->page 指針劫持等。

從 GPU 攻擊的路徑來看，也可以了解到一點，即漏洞的修復并不代表漏洞生命的結(jié)束，如果一個漏洞的原語過于強大、好用，就可以考慮將其他漏洞往這上面轉(zhuǎn)換，從而復用歷史的漏洞利用經(jīng)驗。