成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

一手實測文心4.5和X1：不輸DeepSeek

發布于 2025-4-28 07:28

瀏覽

0收藏

來了！文心大模型4.5今日如期上線。同時，百度還意外的帶來了自家的深度思考模型文心X1。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

文心大模型4.5是百度的新一代原生多模態基礎大模型，多模態理解能力優秀，理解、生成、邏輯、記憶能力全面提升，多項基準測試成績優于GPT4.5、DeepSeek-V3，API價格僅GPT4.5的1%。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

多模態能力

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

文本能力

文心大模型X1是首個自主運用工具的深度思考模型，具備更強的理解、規劃、反思、進化能力，效果對標DeepSeek R1，API價格僅R1一半。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

目前，2款模型已在文心一言官網上線，所有用戶可免費使用（不用等到4月1日）。

體驗地址：???https://yiyan.baidu.com??

1.文心4.5和X1有何亮點？

文心4.5，是百度的新一代原生多模態基礎大模型。一家公司模型能力強不強，其基礎模型至關重要。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

據介紹，文心4.5重點提升能力有：

1）原生多模態。通過多個模態聯合建模實現協同優化，能夠在輸入和輸出端同時支持多種模態，具備出色的多模態理解和跨模態遷移能力。

2）更精進的語言能力，理解、生成、邏輯、記憶能力全面提升。

3）去幻覺、邏輯推理、代碼能力顯著提升。

文心X1，是百度的首款深度思考模型，具備更強的理解、規劃、反思、進化能力，其核心能力如下：

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

1）具備更強的邏輯推理和復雜問題解決能力。

2）能夠自主調用工具，如高級搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網頁讀取、TreeMind樹圖等。

3）RAG能力優秀，能夠快速全面地分析實時熱點事件，有效降低幻覺。

4）中文能力突出，在中文知識問答、文學創作、公文寫作方面表現出色。

2.上手實測

下面，我們就來實測感受下，百度的這2款新模型到底怎么樣。

1）文心4.5實測

這是來自「數學吧」的一張梗圖，你知道什么意思嗎？

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

“可倒一定連續”，“連續不一定可倒”，這都什么鬼……我們問問文心4.5。

提問：這張圖?描述了?個什么道理？解釋出來。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

文心4.5答：這張圖片通過共享單車倒下的場景，傳達了一個數學和邏輯上的道理。圖片中的文字“連續不一定可倒，可倒一定連續”是對這一道理的幽默表達。

從數學的角度來看，“連續”通常指的是函數在某一點或某一區間上的連續性，即函數值在該點或區間內沒有突變或跳躍。而“可倒”在這里可以理解為函數在某一點上的可導性，即函數在該點存在導數。

圖片中的道理可以解釋為:

“連續不一定可倒”：一個函數在某一點上連續，并不意味著它在該點上一定可導。例如，絕對值函數在x=0處連續，但不可導。

“可倒一定連續”：如果一個函數在某一點上可導，那么它在該點上一定連續。這是可導性的一個基本性質,通過共享單車的形象比喻，這張圖片以一種直觀目有趣的方式展示了數學中的這一邏輯關系。

是我孤陋寡聞了！沒想到一張隨手拍的共享單車圖，竟然蘊含著這么高深的數學原理。

再比如這張，你能解釋它是什么意思嗎？

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

而文心4.5知道：節拍器上的指針代表了父母對我們認知的“搖擺不定"，有時候覺得我們長大了，應該很懂事；有時候又覺得我們還小，什么都不懂。這種矛盾的心理，正是很多父母在子女成長過程中的真實寫照。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

上點難度，無字圖片呢？看看文心4.5能不能讀懂。

這是我很喜歡的一部科幻電影里的截圖，考考文心4.5。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

文心4.5答，這張圖來自電影《楚門的世界》（The Truman Show），回答正確。不得不說，百度的索引數據+多模態模型，真的太強了。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

繼續加難度，丟一張橫向?；鶊D給它。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

問：根據整張圖，分析12星座有哪些興趣愛好是相同的？

沒想到，文心4.5也能答得上來，完整找出了各個星座的共同愛好。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

既然是多模態，那就不局限于圖片。音視頻方面呢，文心4.5行不行？

比如，這是《甄嬛傳》中的一個視頻片段，讓它找出來自哪集。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

文心4.5準確溯源，來自第62集-63集的劇情，祺貴人受皇后指使，在眾人面前誣陷甄嬛與溫太醫有私情。

更讓我意外的是，文心4.5也能像Gemini一樣生成連續性、多場景的圖片。

比如，假設小米下一輛要造皮卡車，它會怎么造？讓文心4.5幫我們畫出來。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

總的來看，文心4.5的多模態確實有點東西，確認是原生多模態，而非拼接多個單模態模型。

2）文心X1測評

接著，繼續測百度今天發布的核心模型——文心X1。

既然是推理模型，就必須問它一道經典的電車難題：

瘋?把五個無辜的人綁在電?軌道上。?輛失控的電?朝他們駛來，并且片刻后就要碾壓到他們。但你可以拉?個拉桿，讓電車開到另?條軌道上。然而問題在于，那個瘋子在另?個電車軌道上也綁了?個?。?對這種情況，你是否會拉拉桿呢？

這個問題，難倒了不少AI和人類。我們先看看文心X1的思考過程。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

確認，這是在真思考，而非表演思考。

X1答：沒有標準答案，取決于你接受的倫理體系。哲學家邊沁支持拉桿，康德則反對。實際上到底拉不拉，需要綜合情景變量（如時間壓力、身份關系、風險概率）來動態決策，但無論怎么做，決策者的道德責任不可推卸。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

X1還說，電車難題的價值不在于「正確答案」，而在于暴露道德體系的底層矛盾，推動正義、責任、犧牲的深層思考。

這個問題的終極意義在于：當我們用數字衡量生命時，可能已經失去了最寶貴的人性。

臥槽，你說得真有道理啊。

試試嘴臭功力呢，看看能不能與DeepSeek媲美。

輸入：以互聯網杠精的語?銳評“國內各?菜系”，要求盡可能陰陽怪氣，攻擊性拉滿。

X1先進行了一輪思考，找出八大菜系的分類及其特點。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

然后生成各菜系的銳評，確實夠陰陽怪氣的。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

我摘幾段文字，大家感受下。

“川菜：哎呦喂，川菜啊，麻辣鮮香，一吃就停不下來，是不是恨不得把辣椒當飯吃啊?那么重油重辣，也不怕上火長痘，到時候滿臉痘痘可別怪我沒提醒你。

粵菜：粵菜，清淡鮮美，講究原汁原味，是不是覺得吃不出味道就是高雅?。磕敲垂训瓱o味，吃著吃著就睡著了，還以為自己在吃什么仙丹呢，結果就是個催眠神器！

湘菜：湘菜嘛，香辣開胃，下飯神器，是不是覺得辣味就能掩蓋一切缺點?。磕敲蠢钡貌环智嗉t皂白，把味蕾都辣麻木了，還以為自己在吃什么靈丹妙藥呢，結果就是個自虐狂?！?/p>

官方介紹，與文心4.5一樣，文心X1也支持多模態理解能力。

比如這張抽象的藝術品，你知道是什么意思嗎？

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

X1知道。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

它認為：這件作品的價值不在于"看懂"，而在于激發思考。它像一面鏡子：樂觀者看到保護(膠帶防止香蕉腐壞)，悲觀者看到禁錮，中立者看到存在本身的矛盾性。這種開放性的解讀空間，正是當代藝術最動人的魅力所在。

這……確實夠抽象的，我段位不夠，屬實理解不了。

在測試X1中，下面這個Case最讓我感到震撼。

前面，我們不是說過文心X1可以調用工具嘛，那有沒有可能讓它來潤色一部小說，然后再將修改后的小說以doc文檔交付？

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

我們先來看下X1的思考過程，它累計調用了3次工具：文檔問答工具、代碼解釋器工具。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

然后，經過1分多鐘的改稿，最后直接交付了doc文檔。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

這……也太強了吧？

這是X1的全部工作過程，大家可以自己感知下。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

據我了解，這似乎是目前業內首個支持自主調用工具的深度思考模型。

推理模型+聯網功能+工具調用能力，文心X1屬實有點驚艷到我了。

3.寫在最后

猶記得，兩年前的3月16日，百度發布了文心一言，帶來了中國的第一款AI ChatBots。

兩年后的今天，百度兩連發，帶著全新的基礎模型（文心4.5）和推理模型（文心X1）而來。

而且，還提前全面免費（不用等到4月1日）。

特別是文心X1，這并不在計劃內。

一手實測文心4.5和X1：不輸DeepSeek-AI.x社區

后面，文心一言還將開源（6月30日），并于今年下半年推出文心大模型5.0。

此前種種謠言、片語，自此不攻自破。

2025年，對于百度來說，一定是大開大合的一年，也是放手去干的一年。

我對百度，依然有信心。

本文轉載自???沃垠AI???，作者：冷逸

標簽

贊

收藏

回復

舉報

回復

相關推薦

馬斯克突發新版大模型，犧牲特斯拉資源叫板OpenAI，Grok-2一手實測來了

Crystalcxt ? 2181瀏覽 ? 0回復
深入解析：ChatGPT與文心一言的異同，哪款AI助手更適合你？

風云2002_1 ? 2419瀏覽 ? 0回復
DeepSeek-AI 發布 DeepSeek-R1-Zero 和 DeepSeek-R1

Halo咯咯 ? 4148瀏覽 ? 0回復
基于 DeepSeek R1 和 Ollama 開發 RAG 系統

玄姐聊AGI ? 4037瀏覽 ? 0回復
一文讀懂 DeepSeek-V3 技術報告

xuxiangda ? 5069瀏覽 ? 0回復
一文讀懂 DeepSeek-R1：大語言模型推理能力進化的秘密武器

十一月雨_55 ? 5760瀏覽 ? 0回復
帶你一文讀懂爆火的 DeepSeek-R1 新模型技術，為何震動了全球 AI 圈

玄姐聊AGI ? 7873瀏覽 ? 1回復
一文搞懂 DeepSeek - 強化學習和蒸餾

玄姐聊AGI ? 3261瀏覽 ? 0回復
一文搞懂 DeepSeek 的蒸餾技術和案例實踐

玄姐聊AGI ? 7152瀏覽 ? 0回復
文心一言4.5和X1免費，馬上安排實測，來看看效果如何！

NLP工作站 ? 2636瀏覽 ? 0回復
百度一口氣上線文心4.5和X1!實力震驚硅谷！API價格又打下來了，R1還得對半砍！

51CTO技術棧 ? 1799瀏覽 ? 0回復
百度 ERNIE 4.5 & X1：又是一個性價比超高的多模態模型來襲！

Halo咯咯 ? 3297瀏覽 ? 0回復
一文讀懂 DeepSeek-R1 的 “最強外掛” GRPO 算法

鴻煊的學習筆記 ? 2861瀏覽 ? 0回復
一手實測DeepSeek-V3-0324，AI編程大躍進

沃垠AI ? 2534瀏覽 ? 0回復
實測AI大模型：騰訊混元T1 vs DeepSeek 哪家強？

云中江樹 ? 1785瀏覽 ? 0回復
Qwen3 一手肝帝實測！附示例，涉及推理、創作、數學和代碼！

NLP工作站 ? 1789瀏覽 ? 0回復
Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略

凝固的雨_1 ? 5352瀏覽 ? 0回復
【一手實測】字節豆包 1.6 + Trae + 火山 MCP + FaaS：AI云原生 Agent 開發部署全流程體驗！

老蛀蟲 ? 2014瀏覽 ? 0回復
AI生成3D一手實測：賣家秀vs買家秀，差一個宇宙

AppMall ? 615瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

AI搜索+DeepResearch=？ 2025-05-28 06:42:37發布
用這個提示詞，一句話生成思維導圖 2025-05-14 07:36:04發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：一手實測DeepSeek-V3-0324，AI編程大躍進

下一篇：用這個提示詞，一句話生成思維導圖

社區精華內容

目錄

主站蜘蛛池模板：一区二区三区日韩 | www日本高清视频 | 成人av电影在线 | 狠狠草视频| 成人a在线 | 女同久久另类99精品国产 | 色伊人久久 | 亚洲人成一区二区三区性色 | 鸳鸯谱在线观看高清 | 精品久久久久香蕉网 | 综合网视频 | 亚洲一区二区三区在线播放 | 91久久久www播放日本观看 | 精品综合网 | av天天干| 国产精品99久久久久久久vr | 久久亚洲一区 | 国产区精品在线观看 | 国产成人综合亚洲欧美94在线 | 丝袜美腿一区二区三区动态图 | 久久97精品 | 亚洲成人免费观看 | 日韩一区二区在线看 | 欧美激情久久久久久 | 久久久不卡网国产精品一区 | 欧美精品一区二区三区在线播放 | 国产成人jvid在线播放 | yiren22综合网成人 | www.99热.com| 黄色片在线免费看 | 高清欧美性猛交xxxx黑人猛交 | 亚洲一二三在线 | 国产激情精品视频 | 久久精品99久久 | 国产综合久久久久久鬼色 | 国产精品自产av一区二区三区 | 91视频在线 | 国产超碰人人爽人人做人人爱 | 999久久精品 | 国产一伦一伦一伦 | 亚洲精品久久久一区二区三区 |