電子科技大學研究人員的論文《InPK:InfusingPriorKnowledgeintoPromptforVisionLanguageModels》提出了一種新穎的方法,即通過將先驗知識融入到視覺語言模型(VLM)的提示中,以提升模型在零樣本和少樣本視覺識別任務中的性能。本文將結合論文詳細介紹InPK的技術原理、實現方法、實驗結果及其在視覺語言模型領域中的意義。背景近年來,在大型圖像文本數據集上預訓練的視覺語言模型(VLM),例如CLIP,已經在各種下游任務中展現...
1.背景1.1AI芯片設計的當前挑戰與新興計算范式概覽人工智能(AI)的飛速發展,特別是以Transformer為代表的深度學習模型的廣泛應用,對計算硬件提出了前所未有的要求。傳統的馮·諾依曼架構在處理這些大規模、高并行的AI負載時,其性能和效率日益受到“功耗墻”(powerwall)和“架構墻”(architecturewall)的根本性制約。隨著模型規模的持續膨脹,其計算復雜度和內存需求呈爆炸式增長,這迫使學術界和工業界必須跳出傳統思維...
引言:多學科協作醫療咨詢的挑戰與機遇在現代醫學實踐中,面對日益復雜的疾病,單一專科的視角往往難以滿足患者全面、精準的診療需求。多學科團隊(MultiDisciplinaryTeam,MDT)診療模式應運而生,通過系統性地整合不同醫學領域的專業知識,旨在制定更準確、更全面的治療策略,從而改善患者預后。MDT模式的核心價值在于其能夠匯聚跨學科的智慧,克服單一專科可能存在的局限性,為患者提供最佳的個體化診療方案。然而,傳統的MDT...
2025-06-09 00:14:15 1740瀏覽 0點贊 0回復 0收藏
隨著人工智能(AI)和機器學習(ML)在金融、醫療、自動駕駛等高風險、高影響力的關鍵領域日益普及,對其決策過程透明度和可解釋性的需求變得前所未有地迫切。復雜的模型,如深度神經網絡和集成樹模型,常因其內部運作機制難以捉摸而被視為“黑箱”,這嚴重制約了它們在實際應用中的可靠性、公平性以及用戶的信任度。可解釋人工智能(ExplainableAI,XAI)致力于開發能夠使人類理解、信任并有效管理AI系統決策過程的方法與技術。...
2025-06-09 00:13:23 2063瀏覽 0點贊 0回復 0收藏
隨著大型語言模型(LLM)技術的飛速發展,基于LLM的智能體(LLMagents)正以前所未有的速度滲透到各行各業,從自動化客戶服務、內容創作到數據分析乃至醫療輔助,深刻地改變著我們的工作與生活方式。為了充分釋放智能體的潛力,研究者們設計了多種架構,旨在促進智能體與外部實體——包括非智能體直接控制的數據源、工具以及其他在線智能體——之間的有效通信。然而,隨著應用場景的擴展和來自不同供應商、采用不同架構的智能體...
2025-05-27 06:38:23 788瀏覽 0點贊 0回復 0收藏
1.引言在理論計算機科學領域,計算的概念及其能力的研究占據著核心地位。為了深入理解計算的本質和不同計算模型的潛力,研究人員常常會借助抽象機器的概念。這些抽象機器,例如圖靈機,為我們提供了一個形式化的框架來探討哪些問題可以通過計算解決,以及解決這些問題所需的資源(如時間和空間)。在這些理論工具中,“預言機”(Oracle)作為一種特殊的抽象概念,扮演著至關重要的角色。預言機可以被視為一種能夠在一步之內解...
2025-05-27 06:24:28 488瀏覽 0點贊 0回復 0收藏
引言OpenAI光環之下的隱憂OpenAI,這家憑借ChatGPT、GPT系列模型API等顛覆性技術迅速占領全球科技高地的企業,無疑是人工智能(AI)研究與部署領域的執牛耳者。其“確保人工智能惠及全人類”的宏大宣言,以及其技術在各行各業所描繪的革命性藍圖,不僅吸引了天文數字般的投資,也催生了難以估量的高昂運營成本。OpenAI的技術浪潮以前所未有的速度推動了AI應用的普及化,然而,在這股浪潮之下,關于其社會影響的深度拷問、倫理責...
2025-05-13 00:21:27 827瀏覽 0點贊 0回復 0收藏
由前OpenAI研究員DanielKokotajlo領銜撰寫的報告《AI2027》,并非遙遠的科幻想象,而是立足于當前人工智能發展趨勢、結合專家訪談與嚴謹邏輯推演,對未來幾年(直至2027年)可能發生的劇變進行的一次“沙盤推演”(即模擬預演)。這份報告的核心論斷極具沖擊力,通用人工智能(AGI)乃至超越人類智慧的超級智能(ASI)可能比許多人預期的更早到來,其對人類文明的重塑力量將遠超工業革命,而我們的社會對此卻普遍缺乏認知和準備...
2025-04-27 07:27:06 1596瀏覽 0點贊 0回復 0收藏
通用人工智能(GPAI)時代的風險與挑戰通用人工智能(GPAI)系統,憑借其廣泛的應用能力,正迅速滲透到我們生活的方方面面。這些基于基礎模型并服務于多種用途的軟件系統,已擁有龐大的用戶群體。一些GPAI系統每周活躍用戶已超過3億。同時,GPAI系統在安全和權利影響領域的應用也日益廣泛,如醫療保健、金融、教育和司法等(Maragnoetal.,2023;Young,2024;PerezCerrolazaetal.,2024)。然而,GPAI系統的廣泛應用也伴隨著巨大的潛...
2025-04-15 07:52:14 1235瀏覽 0點贊 0回復 0收藏
想象一下十七世紀的歐洲,那是一個思想迷霧重重的時代。古老的經院哲學大廈搖搖欲墜,知識的海洋里充滿了相互矛盾的學說和難以證實的觀點。就在這時,勒內·笛卡爾,像一位孤獨的燈塔看守人,點亮了近代哲學的“理性之光”。在他的著作《談談方法》中,他進行了一場驚心動魄的思想遠征:懷疑一切,直至找到那個絕對不可動搖的立足點——“我思故我在”(Cogito,ergosum)。以此為基石,他試圖用嚴謹的方法、清晰的理性,為人類...
2025-04-02 07:48:29 1528瀏覽 0點贊 0回復 0收藏
送孩子上補習班的路上,孩子突然和我說起來白馬是不是馬的問題。我驚異于這個問題的來源,她說是看到了雜志上關于公孫龍子的“白馬非馬”和“離堅白”的介紹和討論,才有這樣的問題。我拼湊著腦袋里的蛛絲馬跡,試圖解釋公孫龍子的學說。雖然沒有給孩子解釋明白這個如何抽象出來的閉環邏輯,但是自己卻突然意識到名和實之間的邏輯關聯不就是現在的大語言模型所正在探索的領域嗎?于是歸納思路,便有此文。回顧一下,歷史上的抽...
2025-03-24 00:03:06 1812瀏覽 0點贊 0回復 0收藏
摘要本文針對安全多方計算(MPC)框架下通用矩陣乘法(GEMM)運算的性能瓶頸,提出一種全新的MPCGEMM實現方案。該方案的核心思想在于:基于加法秘密共享重構DeepSeekDeepGEMM的CUDAkernel,將MPC協議的邏輯與DeepGEMM的底層優化深度融合,消除MPC協議與GPU計算之間的“兩張皮”現象。方案采用INT8FP8數據表示、秘密共享運算的kernel級實現、Hopper架構優化(如適用)、GPU并行Beaver三元組生成以及JIT編譯等關鍵技術。本文將詳...
2025-03-11 02:10:35 2484瀏覽 0點贊 0回復 0收藏
引言:測試時計算擴展的興起與挑戰近年來,大型語言模型(LLMs)在自然語言處理領域取得了舉世矚目的成就,其性能的飛躍在很大程度上得益于大規模自監督預訓練和不斷增長的模型規模。然而,模型規模的不斷擴大也帶來了訓練成本和計算資源需求的急劇增加,這使得進一步提升模型性能變得越來越困難。為了在不進一步增加模型規模的前提下提升性能,一種新的范式——測試時計算擴展(TestTimeComputationExtension)——應運而生。...
2025-02-19 11:58:12 2249瀏覽 0點贊 0回復 0收藏
1.深度學習的算力饑渴與HPC的成本困境深度學習的浪潮,正以勢不可擋的姿態席卷而來。從圖像識別領域的AlexNet和ResNet,到自然語言處理領域的Transformer,再到如今參數規模動輒千億、萬億的大型語言模型(LLM),如GPT3和PaLM,以及混合專家模型(MoE)和多模態模型,深度學習模型的能力在不斷突破,但其背后對計算資源的需求也呈現出爆炸式的增長。高性能計算(HPC)集群,作為支撐深度學習訓練的基石,其重要性日益凸顯。然而,傳...
2025-02-12 13:17:54 3644瀏覽 0點贊 0回復 0收藏
1.引言人工智能(AI)正迅速滲透到我們生活的方方面面,并在各個領域展現出巨大的潛力。尤其是在信貸、住房和醫療等高風險領域,AI驅動的自動化決策(ADM)系統正發揮著越來越重要的作用。這些系統能夠高效地處理海量數據,并根據預設算法做出決策,從而提高效率、降低成本。然而,ADM系統的廣泛應用也引發了人們對其透明度和問責制的擔憂。由于許多ADM系統基于復雜的機器學習模型,例如深度神經網絡,其決策過程往往難以理解,甚至...
2025-02-04 19:55:40 2539瀏覽 0點贊 0回復 0收藏
1.引言近年來,隨著深度學習技術的飛速發展,人工智能(AI)在諸多領域取得了突破性進展。然而,傳統的深度學習模型在處理需要復雜推理的任務時仍然面臨挑戰。例如,在面對數學題、邏輯謎題或科學問題時,簡單地依靠模式識別和函數擬合難以獲得令人滿意的結果。為了解決這個問題,研究人員開始探索將深度學習與符號推理相結合,從而賦予AI系統更強的推理能力,即慢思考推理。慢思考推理強調對問題進行深入分析和逐步求解,而非僅...
2025-01-20 11:15:02 2794瀏覽 0點贊 0回復 0收藏
1.引言近年來,大型語言模型(LargeLanguageModels,LLMs)的參數規模呈現指數級增長趨勢,展現出強大的通用智能,在眾多自然語言處理任務上取得了突破性進展。然而,這些龐大的模型也伴隨著高昂的訓練成本、巨大的計算資源需求以及難以部署等問題,極大地限制了其廣泛應用。為了解決這些問題,業界開始探索更加高效、輕量化的模型架構和訓練方法。在這樣的背景下,微軟研究院機器學習基礎團隊另辟蹊徑,推出了一系列名為“Phi”...
2025-01-10 12:33:14 3311瀏覽 0點贊 0回復 0收藏