很突然!騰訊版DeepSeek可以生圖了,路徑可行!實(shí)測翻車,搞不清清朝服飾風(fēng)格,文字和人物理解尚有不足
原創(chuàng)五一過后,元寶來了一波新動作,元寶版本的DeepSeek可以生圖了!當(dāng)然混元肯定也可以。不論選哪個模型,只需要一句話,元寶都能直接生成圖片。
據(jù)官方介紹,這項功能,結(jié)合了騰訊混元最新文生圖模型,已在元寶全端上線。
大家都知道,目前DeepSeek雖然具備圖像理解能力,但并不能直接生成圖片,這次騰訊又搶先為DS彌補(bǔ)了這個缺憾。
不過小編發(fā)現(xiàn),目前元寶版DS的作畫功能,只能是“文生圖”,而不能“圖生圖”。
原理上其實(shí)就是讓元寶版DeepSeek理解提示詞,然后調(diào)用元寶的生圖工具來生成圖片。
當(dāng)你給出一句話指令,元寶會發(fā)散、“擴(kuò)寫”成更完整、清晰的提示詞,再生成高質(zhì)量、復(fù)雜、有想象力的圖像。
雖然不能圖生圖,但模型會給你生成一段理解你需求的提示詞,輔助生成。
小編第時間嘗鮮了下,先是驚艷,然后則是有點(diǎn)翻車的吐槽感。比如讓他生成一張梵高的星空,肯定沒的說,很有梵高的抽象感。再比如讓她根據(jù)我一張五一時節(jié)拍下的鮮花美景變成日系動漫風(fēng)格,也生成了一張唯美的圖片。
但緊接著,翻車圖片接連來了:最近張杰演唱會很多,我發(fā)了一張張杰的簽名墻上拍照,讓元寶版DS生成一張清廷版本的。
元寶版DS倒是能理解我的訴求,并生成了一段完美的提示詞:
「清朝宮廷風(fēng)格,一群年輕人身著錦緞長袍與馬蹄袖褂子,在藍(lán)色簽名墻前互動。中央人物穿白色刺繡龍紋長袍張開雙臂,其他人手持折扇或團(tuán)扇,背景保留“下一個永遠(yuǎn)”標(biāo)語但改為毛筆書法字體,畫面融合現(xiàn)代活動活力感與清代服飾細(xì)節(jié),柔光濾鏡,4:3比例」
結(jié)果可好,生成的圖片既不是清廷風(fēng)格,帽子高得像一個當(dāng)差的衙役,而且漢字識別的也不是很好。
另一個翻車點(diǎn),也是在人物的發(fā)飾和人物年齡上,比如戴著虎帽的小孩,他會將所有女生的發(fā)飾上都生成一個虎帽。看得小編哭笑不得。只能說,現(xiàn)在的元寶版生圖功能任重道遠(yuǎn)。期待后續(xù)的迭代!