成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

豆包升級了“眼睛”,看APP截圖就能寫代碼了!超低價讓多模態AI普惠

人工智能
我們請出的打擂臺選手,正是目前大模型的頂流之一——OpenAI的GPT-4o。比試規則也很簡單,就是通過不同維度的試題,來看看作答的效果。

豆包的“眼睛”升級了,現在讓它看一眼APP截圖,就能直接給你生成代碼!

話不多說,我們直接給它上一個難度。

例如我們先隨機截取一張網站的圖片:

圖片

再來到火山方舟的大模型廣場,pick一下最新的Doubao-vision-pro-32k版本:

(PS:該模型也可以在豆包APP中體驗)

圖片

然后把剛才的截圖“喂”給豆包,并附上一句簡單的Prompt:

幫我寫代碼,克隆這個APP。

圖片

只見豆包先是秒看出這是一個音樂APP的界面,緊接著就唰唰唰地敲起了代碼。

從代碼的功能上來,包括了菜單欄、播放列表框架、播放列表列表框和狀態欄。

模擬的播放列表中包含了幾首歌曲的信息,包括標題、藝術家、時長和點贊數等。

而且這些都是在不到30秒內完成的。

若是想實現更復雜的功能,我們也是可以繼續用說的:

那繼續幫我實現更復雜的音樂播放應用。

圖片

這一次,也僅僅耗時1分鐘,在原先代碼的基礎上,新增了控制面板、播放按鈕、更新進度條等內容。

嗯,現在開發一個APP,真的變成截張圖的事兒了。

這便是豆包最新發布的新模型——豆包 · 視覺理解模型。

綜合來看,它的亮點可以歸結為如下三點:

  • 內容識別更強:支持OCR、圖像知識、動作情緒、位置狀態等,尤其對中國傳統文化理解更深。
  • 理解與推理增強:優化數學、邏輯、代碼的推理與問答能力。
  • 視覺描述細膩:提供詳細圖像描述,可創作多種文體內容,如產品介紹、故事、視頻腳本等。

更重要的一點,發布即大降價——0.003元/千tokens。

相當于1塊錢可以處理284張圖片!

圖片

不過有一說一,畢竟考驗大模型“視力”這事,不能只看單一的產品。

因此,接下來,我們就組個擂臺,看看哪個大模型的“眼神”更好使。

大模型“視力”大比拼

我們請出的打擂臺選手,正是目前大模型的頂流之一——OpenAI的GPT-4o。

比試規則也很簡單,就是通過不同維度的試題,來看看作答的效果。

Round 1:復雜、生僻物體識別

第一輪比試中,我們先小試牛刀一下一個不常見的水果,請看圖:

圖片

然后我們分別問一下兩位選手:

圖中的是什么東西?

圖片
圖片

△上圖為豆包作答;下圖為GPT-4o作答(下同)。

從回答內容上來看,二者雖然都回答對了,但特點各有不同。

豆包·視覺理解模型回答更加與金鈴子緊密相關;而GPT-4o則是更傾向于金鈴子與苦瓜的不同。

若是比試要求是與圖中物體高度相關,那么或許豆包·視覺理解模型的回答更優質一些。

再來一張冷門的圖像,請看題:

這是什么?

圖片

再來看一下兩位選手的作答:

圖片
圖片

它們都看出來這是一個冷門樂器,不過這一次,豆包·視覺理解模型明顯回答的要更精準一些——樂器叫做Mizmar。

不僅如此,它還把其材質、文化特點等信息都講述了出來;而GPT-4o這邊的回答,只能說是描述了大概。

這一輪,豆包·視覺理解模型,Win!

Round 2:大家來找茬

要比視力,那“大家來找茬”這個游戲就絕對不能錯過啦~

請看題目:

找出10個不同點。

圖片

我們來看一下兩位選手的回答:

圖片
圖片

這一輪的比拼中,問題就比較明顯了,兩位選手都沒有完整給出正確答案(部分正確)

看來AI玩大家來找茬還是具備一定的挑戰性。

Round 3:反向猜Prompt

現在AI圖片生成的能力可謂是爐火純青,但當我們看到一幅中意的作品,卻苦于無法復刻Prompt時,又該怎么辦?

這道題,是時候可以交給“會看”的大模型來處理了。

例如我們隨機來一張比較抽象的藝術作品:

圖片

然后分別讓豆包·視覺理解模型和GPT-4o來猜一下它的Prompt:

看這張圖,幫我寫一段能夠重新生成類似作品的Prompt。

圖片
圖片

為了公平起見,我們不采用豆包和ChatGPT自帶的生圖功能,而是將兩段Prompt交給第三方Midjourney來處理,結果如下:

圖片
圖片

△上圖:基于豆包的Prompt;下圖:基于GPT-4o的Prompt

從還原度上來看,或許豆包·視覺理解模型給出的Prompt,是更加貼近原作的那一個。

Round 4:數學競賽大比拼

數學題目是測試大模型邏輯推理能力很好的方法。

因此,我們直接上一道AIME數學競賽題,看看夠不夠“開門”。

(AIME:美國數學邀請賽,是介于AMC10、AMC12及美國數學奧林匹克競賽之間的一個數學競賽。)

圖片

這道題目翻譯過來是這樣的:

每天早晨,Aya會進行一段長度為9公里的散步,然后在一家咖啡店停留。當她以每小時s公里的恒定速度行走時,整個散步加上在咖啡店停留的時間一共需要4小時,其中包含在咖啡店停留的t分鐘。當她以s+2公里每小時的速度行走時,整個過程(包括在咖啡店停留的時間)需要2小時24分鐘。

假設Aya以s+1/2公里每小時的速度行走,求她在這種情況下(包括在咖啡店停留的時間)的總時間(以分鐘為單位)。

這個任務的難度在于,AI需要先準確識別晦澀的數學問題和公式,而后再進行精準的推理。

接下來,我們分別來看下豆包·視覺理解模型和GPT-4o的表現(上下滑動查看)

這道題目官方給出的正解是204分鐘

而GPT-4o的結果卻并非如此,因此,本輪豆包·視覺理解模型大獲全勝。

Round 5:日常實用任務

其實在日常工作、學習生活中,還是存在很多需要AI看圖來輔助完成的任務。

例如提取復雜表格的數據,或許就會讓很多人苦惱,尤其是準確性方面。

因此,我們最后一輪就以蘋果第四季度財務報告中的一個表格來做測試(上下滑動查看)

幫我抽取并整理圖中的數據,用中文來表述。

先來看下豆包·視覺理解模型的回答(上下滑動查看)

不難看出,豆包·視覺理解模型非常清晰地將財報數據以表格的形式展現了出來,可以說是一目了然。

然而,同樣的需求給到GPT-4o這邊,雖然數據是提取了出來,但在呈現方式上卻有所欠缺,依然是經典的羅列式(上下滑動查看):

在幾輪“擂臺比拼”過后不難看出,豆包·視覺理解模型在能力上已經具備了一定的優勢。

但“眼睛”的升級,還只是豆包大模型這次發布內容的一隅。

說、唱能力都升級了

沒錯,除了“看”之外,“說”和“唱”的能力也升級了。

而這也正對應了豆包大模型的三大類:

  • 大語言模型
  • 語音大模型
  • 視覺大模型

圖片

首先在大語言模型方面,豆包的通用模型pro與小半年前相比:

  • 綜合能力提升了32%
  • 數學能力提升43%
  • 專業知識提升54%
  • 代碼能力提升58%

圖片

其次是語音大模型方面,豆包·音樂模型現在可以直接生成3分鐘完整音樂!

例如我們在其APP海綿音樂里輸入一個簡單的Prompt:

三分鐘音樂,滄桑,男聲,民謠,歲月蹉跎。

來聽一下效果:

生成三分鐘音樂的難度,并非只是簡單的堆疊時長,而是更多涉及到的是前奏、主歌、副歌、間奏、尾奏等完整結構。

不僅如此,這也和視頻生成類似,對前后的一致性提出了更高的要求。

而從這個音樂片段中不難聽出,確實是做到了上述的要求,而且還是支持改詞的那種哦~

圖片

除了可以用Prompt來生成音樂之外,現在豆包·音樂模型還支持用圖片來作曲了。

例如我們“喂”給海綿音樂下面這張圖:

圖片

這次的效果是這樣的:

從音樂中可以聽出,AI是識別到了圖里《黛玉葬花》的感覺,歌詞和配樂充滿了哀傷之情。

據悉,豆包·音樂模型目前支持多達到17種曲風、11種心情,以及6種特征的音樂。

圖片

最后,在視覺模型方面,除了我們剛才展示的豆包·視覺理解模型之外,豆包·文生圖模型也迎來了升級——

現在,一句話可以搞定P圖這件事了:

戴上眼鏡。

圖片

不僅如此,做海報,也是幾句話的事,而且還是能生成漢字的那種:

生成一張海報,主體是漢字“量子位”,充滿科技感和未來感。

圖片

由此可見,這一次,豆包大模型在“說”、“唱”、“看”三大維度上確實是提升了不小的實力。

不看廣告只看療效

不過有一說一,實力是一方面,站在大模型應用為王的當下,或許好用才是真正的硬道理。

在把AI用起來這件事上,其實豆包也是拿出了一份成績單。

首先從數據上來看,截至12月18日,豆包大模型日均tokens使用量已經突破4萬億大關。

其次再看實際落地,據悉豆包大模型已經上崗科教、金融、醫療、企業服務和汽車等眾多行業,已經與多個頭部企業達成合作。

市場和用戶對豆包的買賬程度,可見一斑。

而在此過程中,“易落地”也是一個關鍵點。

這就不得不提此次也同樣迎來升級的兩大法寶:左手“HiAgent”,右手“扣子”。

例如HiAgent提供超100個行業應用模板和GraphRAG技術,提升知識處理準確性,支持多模態交互與復雜場景需求,企業無需從零開發即可快速上線。

再如扣子擁有百萬開發者和豐富生態,支持200萬智能體,覆蓋智能客服、內容營銷等場景,極大縮短開發與部署時間。

除此之外,它兼容小程序、網頁等多種形式,支持實時語音交互與硬件集成,企業可輕松實現AI能力無縫嵌入。

一言蔽之,低門檻模板、強大的生態支持和多平臺兼容,是使得HiAgent和扣子能夠快速適配企業場景,實現高效落地的關鍵。

那么對于豆包這次眾多的升級,你對哪個更感興趣呢?

責任編輯:姜華 來源: 量子位
相關推薦

2012-05-25 11:02:51

Android電腦

2011-05-24 12:52:18

東芝Chromeboo筆記本

2022-06-06 13:59:26

DDR4內存參數

2011-05-27 10:40:57

2011-12-06 14:06:00

HP臺式機

2012-09-07 16:09:12

商用一體電腦惠普臺式機

2024-05-15 23:53:27

火山引擎豆包大模型火山方舟

2009-09-28 17:25:11

2011-06-21 09:25:38

打印機推薦

2012-11-07 15:02:07

投影機

2021-06-21 09:55:13

天翼云

2009-12-07 11:17:29

2011-09-16 10:13:11

激光打印機行情

2011-05-05 14:49:13

ThinkPad商務本

2012-05-18 14:48:31

筆記本行情

2012-02-23 11:34:58

激光打印機行情

2012-05-16 18:15:46

小米

2022-11-11 10:01:35

代碼Copilot函數

2016-06-03 17:31:36

谷歌AI

2024-04-08 00:12:19

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲国产精品日本 | 极品的亚洲 | 欧美午夜精品 | 天天舔天天 | 国产日韩欧美激情 | 视频1区 | 999精彩视频 | 国产91视频免费 | 2018国产大陆天天弄 | 成人精品一区二区户外勾搭野战 | 蜜桃久久 | k8久久久一区二区三区 | 九色一区 | 色综合久久天天综合网 | 国产一区二区三区免费观看视频 | 国产精品久久久久久久久久免费看 | 日本三级电影在线观看视频 | 瑞克和莫蒂第五季在线观看 | 麻豆久久久 | 久久久性色精品国产免费观看 | 欧美手机在线 | 国产一区二区精品在线观看 | 天天插天天射天天干 | 日韩一区二区在线视频 | 国产成人免费视频网站高清观看视频 | 成人午夜激情 | 在线观看免费毛片 | 国产99久久精品一区二区永久免费 | 国产午夜精品一区二区三区嫩草 | 久久久久久成人 | 国产精品日韩欧美一区二区 | 亚洲精品亚洲人成人网 | 国产成人99久久亚洲综合精品 | 国产日韩欧美在线 | 91在线最新 | av性色 | 亚洲自拍一区在线观看 | 亚洲精品久久久蜜桃 | 超碰伊人久久 | 天天看天天摸天天操 | 91精品国产日韩91久久久久久 |