成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微軟「小而美」系列三連發!視覺小鋼炮PK GPT-4o,MoE新秀力壓Llama 3.1

人工智能 新聞
微軟Phi 3.5系列上新了!mini模型小而更美,MoE模型首次亮相,vision模型專注多模態。

就在今天,微軟「小語言模型」系列正式升級,最新的Phi 3.5版本一口氣連發三款模型——

- 38.2億參數的Phi-3.5-mini-instruct

- 419億參數的Phi-3.5-MoE-instruct

- 41.5億參數的Phi-3.5-vision-instruct

圖片

這三個模型都可供開發人員在Hugging Face上下載、使用和微調,并獲得了微軟的MIT許可證,可以進行不受限制的商業應用和修改。

別看規模不大,但這三個模型在很多第三方基準測試中都性能表現都相當不錯,甚至在某些情況下擊敗了其他領先大模型,包括谷歌的Gemini 1.5 Flash、Meta的Llama 3.1,甚至在一些競技場上擊敗了OpenAI的GPT-4o。

圖片

優秀的性能加上寬松的開放許可證,網友在社交網絡上紛紛試用并點贊Phi 3.5新系列:

圖片

接下來,根據Hugging Face上的發行說明,簡要介紹一下三款新型號模型的不同特點和用途。

Phi-3.5-mini-Instruct:小而美

圖片

模型:https://huggingface.co/microsoft/Phi-3.5-mini-instruct

延續之前模型小而美的路線,Phi-3.5-mini-Instruct也是一種輕量級AI模型,基于Phi-3使用的數據集構建,擁有38億個參數,支持128k token上下文長度。

Phi-3.5-mini使用512個H100-80G GPU,在10天內對3.4萬億個token進行了訓練。

Phi-3.5-mini非常適合在內存或算力受限的設備上使用,雖然內存有限但推理能力不減,可以完成代碼生成、數學問題的解決和邏輯推理等任務。

默認情況下,Phi-3.5-mini使用Flash Attention,這需要某些類型的GPU硬件才能運行。

通過在不同類型的GPU上進行測試,發現在NVIDIA V100或更早一代GPU上即可使用。

多語言

盡管尺寸緊湊,Phi-3.5-mini在多語言和多輪對話任務中表現出了優秀的性能。

Phi-3.5-mini支持阿拉伯語、中文、英語、芬蘭語、法語、德語等23種語言。

下表重點介紹了Phi-3.5-mini在多語言MMLU、MEGA和多語言MMLU-pro數據集上的多語言功能。

圖片

總體而言,即使只有3.8B參數,Phi-3.5-mini在多語言任務上與其他更大參數的模型相比,也具有競爭力。

圖片

長上下文

Phi-3.5-mini支持128K上下文長度,因此該模型能夠執行多種長上下文任務,包括長文檔/會議摘要、長文檔QA、長文檔信息檢索。

Phi-3.5-mini在衡量「長上下文代碼理解」的RepoQA基準測試中超越了其他類似大小的模型,比如Llama-3.1-8B-instruct和Mistral-7B-instruct。

圖片

Phi-3.5-MoE-instruct:首款MoE

圖片

模型:https://huggingface.co/microsoft/Phi-3.5-MoE-instruct

Phi-3.5-MoE-instruct是微軟Phi模型中的首個MoE模型,將多種不同類型的模型組合成一個模型,匯總的模型內部每個類型模型專門從事不同的任務。

顧名思義,Phi-3.5-MoE采用的是混合專家架構,在23天內使用512個H100-80G GPU,對4.9萬億個token進行了訓練。

420億個參數的架構,支持128k token上下文長度,Phi-3.5-MoE專注于處理高質量,推理密集數據。

然而,根據HuggingFace文檔,Phi-3 MoE有16x3.8B參數,只能使用6.6B參數運行。

Phi-3.5-MoE專為在各種推理任務而設計,尤其是在代碼、數學和多語言理解方面具有強大的性能。

并且,MoE模型經歷了嚴格的優化過程,結合了監督微調、近端策略優化(proximal policy optimization)和直接偏好優化(direct preference optimization),確保精確并且安全的指令遵守。

與Phi-3.5-mini一樣,MoE版本也支持多種語言,并且在長上下文表現優秀,在特定基準測試中優于較大的模型,包括RepoQA:

圖片

專業學科

由于Phi-3.5-MoE模型的定位是處理不同種類的專業任務,那它在專業學科領域表現如何?

Phi-3.5-MoE在5個樣本MMLU(大規模多任務語言理解)上擊敗了GPT-4o mini,涉及STEM、人文科學、社會科學等不同專業水平的學科。

圖片

因此,MoE模型獨特的組合架構使其能夠跨多種語言的情況下,也能處理不同類型復雜的任務,并且保持高質高效。

Phi-3.5-vision-instruct:視覺多模態

圖片

模型:https://huggingface.co/microsoft/Phi-3.5-vision-instruct

前兩個模型都用于文本推理,而Phi-3.5-vision-instruct作為多模態模型,集成了文本和圖像處理功能。

Phi-3.5-vision在6天內使用256個A100-80G GPU,對5000億個token進行了訓練。

多模態模型特別適合一般的圖像理解、光學字符識別、圖表和表格理解以及視頻摘要等任務。

與Phi-3.5系列中的其他模型一樣,Phi-3.5-vision支持128k token上下文長度,能夠處理復雜的多幀視覺任務。

微軟強調,模型是結合合成和過濾的公開可用數據集進行訓練的,重點關注高質量、推理密集的數據。

視覺任務

Phi-3.5-vision主要用于多幀圖像理解和推理,包括詳細的圖像比較、多圖像摘要和視頻摘要,這些能力在辦公場景中有廣泛的應用。

經過測試,大多數圖像基準測試性能都得到提升,例如,MMMU性能從40.2提升到43.0,MMBench性能從80.5提升到81.9,文檔理解基準TextVQA從70.9提升到72.0。

以下是現有多圖像基準的比較結果,平均而言,Phi-3.5-vision在相同尺寸上優于競爭對手模型,并且在多幀功能和視頻摘要方面能更大的模型一決高下。

BLINK包含14項視覺任務的基準測試,人類可以很快解決這些任務,但對于LLM來說仍然很難。

不僅在每一項小分上得分更高,例如藝術風格識別和法醫學鑒定都獲得了87.2和92.4的高分;從總分來看,Phi-3.5-vision高于Gemini-1.5-Flash、GPT-4o-mini和Claude-3.5-Sonnet。

圖片

Video-MME用于全面評估LLM處理視頻數據的能力,涵蓋廣泛的視覺領域任務,并且包括不同時長的視頻處理任務。

可以看出,視頻處理能力方面,Phi-3.5-vision與領先的幾個模型相比,仍有比較大的進步空間,但得分也都基本超過了InternVL模型。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-06-21 09:58:38

2025-04-08 02:26:00

2024-11-28 15:51:19

GPT-4o微軟

2025-03-31 08:44:00

GPT-4o模型技術

2024-05-17 09:35:55

GPT-4o模型OpenAI

2024-05-21 12:23:17

2024-06-05 08:29:35

2024-07-24 09:20:45

2025-04-11 09:10:00

模型開源AI

2024-12-13 14:03:44

模型訓練AI

2024-01-31 09:38:23

AI模型

2024-07-24 13:18:17

2023-06-01 16:42:41

AI課程

2023-10-11 13:09:52

訓練模型

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2025-04-15 08:01:12

2024-05-24 14:04:04

2024-12-26 07:10:00

2024-07-11 11:53:56

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美精品日韩精品 | 国产精品欧美一区二区三区不卡 | 精品久久一区 | 精品久久久久久久久久久久 | 国产精品一区二区av | 99国产在线 | 日韩免费视频一区二区 | 久久精品二区 | 精品一区二区在线观看 | 日日骚视频 | 国产精品综合 | 亚洲视频在线播放 | 99久久精品国产一区二区三区 | 天天碰日日操 | h视频在线观看免费 | 91av小视频 | 国产精品99久久免费观看 | 日韩男人天堂 | 亚洲高清成人 | 干一干操一操 | 视频一二三区 | 欧美成人一级 | 日日射夜夜骑 | 国产综合在线视频 | 日本a级大片 | 一本色道久久综合亚洲精品高清 | 精品日韩一区二区 | 国产在线视频一区 | 一区二区三区在线观看视频 | 国产精品久久久久久久久久免费看 | 午夜视频在线 | 国产不卡视频 | 亚洲日韩中文字幕一区 | 色婷婷久久久亚洲一区二区三区 | 午夜天堂精品久久久久 | 日韩av免费在线电影 | 国产精品一区二区无线 | 久久亚洲欧美日韩精品专区 | 日韩在线中文 | 国产一级片免费视频 | 国产日韩亚洲欧美 |