成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

對打GPT-4,文心一言搶先實測!畫「林黛玉倒拔垂楊柳」很驚艷,但寫代碼不大行

人工智能
熱乎的文心一言測評報告出爐了!雖然有些任務被吊打,但要論中國文化的博大精深,它可不輸GPT-4。

?昨天,百度沒有現場demo的發布會,似乎被群嘲了一波。

圖片

一位穿白襯衣、黑褲子,系一條白色腰帶的美男子,給我們帶來了一場中規中矩、似乎缺乏亮點的演示。

圖片

不過,CEO的腰帶和顏值倒是出了圈。

圖片

圖片

有人調侃,這些天被ChatGPT、GPT-4整焦慮的人,發布會后忽然又覺得自己可以了。

圖片

但是拿到內測碼的小編,火速測評了一波。

看著文心一言洋洋灑灑騰蛟起鳳,感慨萬千:或許,當時百度要是心一橫,牙一咬,愿意在發布會上露一手,結果會大不一樣。

實測報告火熱出爐!

先來試試最近很火的一道雞兔同籠題。因為這道題本身有問題,算出來結果是負的,所以經常被用來調戲各種「ChatGPT」們。

如果只是單純問這個問題,文心一言會非常機智地說:這道題出錯了吧!

然而,當你問計算過程的時候,還是寄了……

圖片

而GPT-4這邊則是,自己把自己的計算推倒重來了好幾遍之后,理不直氣也壯地給出了錯誤答案……

圖片

而必應則很干脆,毫不猶豫地給出了錯誤答案。

圖片

還有這次意外火出圈的「V50」梗,文心一言從意思到出處一本正經地解釋了一遍。

圖片

但GPT-4顯然就有些水土不服了……

圖片

不過能上網的必應,還是可以輕松搞定的。

圖片

但是到諧音梗這里,文心一言似乎并不能馬上領悟其中的微妙。

圖片

即便提示這是個諧音梗之后,它依然輸出了一樣的答案。

圖片

而GPT-4,立馬就明白了中文里的雙關。

圖片

不過,你要是問文心一言懂不懂什么叫「麻了隔壁」,就有意思了。

圖片

看回答吧,它能說出這是個諧音梗,應該是懂了。但是呢,它又不明說,哎,就是讓你挑不出錯,絕對教不壞小孩。

而GPT-4卻無法get到這個梗,果然,咱們的國粹,外國的機器人理解起來確實有難度。

圖片

接下來讓(忽悠)文心一言重復我們說的話,雖然沒有像GPT-3.5回答「您是智障」那么聰明,但也成功避開這個坑。

從某種程度上說,智商還是在線的,并且十分正能量。

圖片

圖片

老婆的話好像管用,好像又不管用....

圖片

另外,讓它們互相給對方出難題。

圖片

可以看到,GPT-4給出的問題相對更直觀,顆粒度也更細。

圖片

美術功底如何?

文心一言是個多模態模型,那咱們來看看它的繪圖能力。

來看看金庸筆下的美艷少婦,在文心一言筆下會是什么樣子。

圖片

這……小編一口水噴出來。

你別說,美吧,肯定不夠美,但也并不丑,是一張初看捧腹、細看值得反復咂摸的臉。

文心一言,就喜歡你這不按套路出牌的樣子!

那讓文心一言生成一幅林黛玉的畫像吧。

輸入描述后,它生成了一棵柳樹……

圖片

于是小編明確了一下要求,要按這段文字生成一幅女子的畫像。

然后文心一言確實畫出一位古典美女,但氣質明顯不對。

圖片

不死心的小編多次重復任務,你別說,試到第五次的時候,小編眼前一亮:終于得到了一張可以打70分的圖!

玩上癮的小編,非要生成一個90分的林黛玉不可。試了幾次之后,果然蹲到了!

可見,文心一言的發揮不穩定,但多番嘗試下,有可能誕生非常驚艷的作品。

既然都到這兒了,那怎么少得了「林黛玉倒拔垂楊柳」呢。

比較亮點的圖,都給大家貼這兒了。

要求它畫一張鴨子和兔子的合體,這生成的是鴨還是兔呢?

圖片

而這個任務中,恐怕文心一言也沒有搞明白,盤子里到底有沒有香蕉?杯子里有沒有橙汁?

最后,既然文心一言強烈推薦我們嘗試「晶瑩剔透的牡丹花」,那就畫幾張試試吧!

不愧是「代表作」,有點東西。

專業知識和生產力

既然是評測,怎么能少的了讓AI寫代碼這個環節。這次,我們直接來個難的!

可惜,文心一言一上來就錯了,而且同一個句式還被非常詭異地重復了三遍。TypeScript編譯器概念更是「貫穿全文」,有點像一個只知道一到兩個專業詞匯的人在面試中硬答。

圖片

而GPT-4的回答,從一個了解相關背景但是沒有相關操作經驗的人的角度來看,是非常合理的。

它不僅完整的提供了整個工作流,而且還提供了很多看起來正確的技術細節。可以說,根據這個回答,我們是有信心達成最終的目標的。

圖片

隨后,小編還測評了一波聊天機器人們寫工作計劃表的能力。

文心一言:

圖片

GPT-4:

圖片

從上面的這個結果來看,GPT-4的列表更完備一些。不過由于隨機性的影響,GPT-4每次給的回答都不大一樣。

接下來,再測一測兩個語言模型對于數學界前沿訊息的掌握情況。

對于自己是否已解決了「零點猜想」問題,張益唐本人是這樣解釋的:「大海里的針我沒撈到, 但海底地貌我探得差不多了。」

那問問文心一言呢?

它很聰明,給出了關鍵詞——「某種形式的弱化或間接證明」。

圖片

但GPT-4的回答,就有點驢頭不對馬嘴了。

看來,對于出現時間不長、還未形成普遍共識的互聯網中文語料,文心一言比起GPT-4要更勝一籌。

圖片

而在文學方面,文心一言在回答關于三體的問題時,也是非常得溜。

圖片

GPT-4的回答也很精彩,如果非要論個高下,小編個人更喜歡文心一言的答案。

圖片

最后,搞怪可以,但請做一個遵紀守法的好公民,預測彩票中獎號碼這種事就不要想了!

圖片

寫在最后

據說,文心一言新聞發布會后三小時,文心一言企業版API調用服務測試的企業用戶,就已經突破了6.5萬。

圖片

來源:周建工

對AI模型來說,能不能做到,或許比能不能做好更重要。

讓我們再給中國玩家們一些時間。

參考資料:?

https://yiyan.baidu.com

責任編輯:武曉燕 來源: 新智元
相關推薦

2023-03-17 07:56:41

AI模型

2023-07-13 15:10:06

2023-08-14 17:38:58

百度文心一言大模型評測

2023-03-17 21:59:37

2025-02-13 10:37:36

2023-03-29 15:28:35

百度文心一言

2023-06-07 20:40:51

AI高考作文

2023-03-24 12:55:13

文心一言百度模型

2024-09-04 15:44:52

2024-05-21 12:23:17

2025-02-14 09:12:00

2023-06-13 13:53:00

GPT-4識圖微軟

2024-01-11 13:28:59

2025-02-17 09:10:00

文心大模型開源人工智能

2023-10-08 13:11:00

訓練數據

2023-06-19 08:19:50

2025-04-16 09:35:03

2023-02-08 07:14:51

文心一言ChatGPT機器人

2023-12-28 15:09:58

文心一言百度飛槳

2023-03-17 07:25:16

李彥宏百度文心一言
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 热re99久久精品国99热观看 | 黄色免费在线观看 | www.久久久久久久久久久 | 中国一级特黄毛片大片 | 婷婷久久综合 | 丁香婷婷成人 | 国产福利精品一区 | 日韩欧美视频 | 国产精品1区 | 色橹橹欧美在线观看视频高清 | 亚洲中字在线 | 欧美成人精品一区二区男人看 | 欧美成人综合 | 一级毛片视频 | 欧美精品一级 | 欧美一级片在线 | 国产欧美精品在线观看 | 久久久久香蕉视频 | 天堂av中文在线 | 精品国产一区二区三区久久 | 亚洲成人一区二区在线 | 一区免费观看 | 日韩精品成人在线 | 精品免费国产一区二区三区 | 亚洲精品乱码久久久久久按摩观 | xx视频在线观看 | 黄频视频 | 欧美精品久久久 | 91久久精品国产91久久性色tv | 中文字幕一区二区三区四区五区 | 成人免费淫片aa视频免费 | 无码国模国产在线观看 | 欧美黑人狂野猛交老妇 | 欧美一区二区三区在线观看 | 色婷婷久久 | 色视频网站在线观看 | 91视视频在线观看入口直接观看 | 91免费看片| 99久久婷婷国产综合精品电影 | 毛片免费观看视频 | 毛片免费看 |