大模型挑選指南來了!涵蓋六種情況下的選擇方案,為你匹配最佳模型
最近Claude 2亮相、谷歌Bard支持中文、Open AI推出Code Interpreter(代碼解釋器)……
大模型發布一波接著一波,但五花八門,沒有一個可解決所有問題。
所以不同任務到底該用哪一個?
圖片
別著急,這不來自賓夕法尼亞大學沃頓商學院的Ethan Mollick教授整理了一份挑選指南。
選擇困難癥“患者”這下有救了!
這份指南不僅涵蓋了截至今年夏季的最新情況,而且在不同的任務中,還附上了不同大模型的表現對比。
手把手教你在六個使用場景下挑選大模型,還有最佳免費選項、付費選項。
網友看到后表示:
先替我同事收藏了。
圖片
一起來康康這份挑選指南里都有啥。
用不同大模型來做這六件事
一、撰寫文字
最佳免費選項:Bing 、Claude 2
付費選項:ChatGPT 4.0、ChatGPT+插件
AI寫作這一塊,Ethan Mollick教授認為,GPT-4目前仍是最靠譜的工具。
家人們還可以選擇用免費的Bing(創意模式creative mode),Claude也是一個不錯的選擇。
具體來說,用大模型可以幫你做這些事:打草稿、優化寫作內容、協助完成任務、解鎖自己(AI可以給你提供一種克服困難的方式)。
此外,這些工具還被整合到了一些辦公應用程序中,比如Microsoft Office+GPT、Google Docs+Bard。
圖片
上面這些大模型在文字寫作方面的表現都不錯,但也都有可能產生“幻覺”,胡言亂語。特別是要求未聯網的大模型提供互聯網的參考、引用信息。
Bing相較而言產生的“幻覺”更少,因為GPT-4表現效果通常更好,而且Bing連接網絡可以真正獲取相關事實信息。
Ethan Mollick教授在此前的使用中還發現一個問題:
AI并不能解釋自己,它只是讓你以為它在解釋。
圖片
如果你要求它解釋為什么寫了某個東西,它會給你一個看似合理但完全是捏造的答案。當你詢問它的思考過程時,它并不是在真正審問自己的行為,只是生成一些聽起來像是在這樣做的文本。
二、制作圖像
最透明的選項:Adobe Firefly
開源選項:Stable Diffusion
最佳免費選項:Bing、Bing Image Creator(使用DALL-E),Playground(可以使用多個模型)
最高質量的圖像:Midjourney
目前主要的圖像生成工具包括:
- Stable Diffusion:已開源,特別適合與其它來源的圖像結合使用(使用指南見文末)。
- DALL-E:來自OpenAI,已整合到Bing(需用創意模式)和Bing Image Creator(Bing圖像生成器)中。DALL-E很可靠,但比Midjourney差一些。
- Midjourney:今年年中最好的系統,學習曲線(learning-curve)是所有系統中最低的。只需輸入”thing-you-want-to-see —v 5.2”(末尾的—v 5.2很重要,使用最新的模型),就能得到非常不錯的結果。Midjourney需要使用Discord(使用指南見文末)。
- Adobe Firefly:集成在Adobe產品中的,但在生成圖片質量方面不如DALL-E和Midjourney。Adobe稱他們在訓大模型時,只使用有使用權的圖像。
大模型各自的表現是這樣嬸兒的(每張圖都是同樣提示下不同模型生成的第一張圖):
圖片
△Prompt: “Fashion photoshoot of sneakers inspired by Van Gogh”
需要注意的是,受訓練數據影響,這些模型難免存在一些偏見。
其次,訓練數據大多來自互聯網,缺乏透明度,圖像的版權問題不夠明確。
此外,目前圖片生成中不能真正創作文本,只能生成一堆看起來像文本的東西。但Midjourney對手部的描繪很好。
三、構思創意
最佳免費選項:Bing
付費選項:ChatGPT 4.0(但由于Bing聯網,表現可能更好)
要有好的創意,通常需要有大量的想法,而AI正是擅長產生大量的想法。
在創意模式下,可以用Bing查找你喜歡的非常規創意生成技巧,例如布萊恩·伊諾的傾斜策略(oblique strategies)或馬歇爾·麥克盧漢的四元結構(tetrads),然后進行應用,或者要求模型提供一些奇怪的想法。
圖片
四、制作視頻
最佳動畫工具:D-iD(用于在視頻中為面部添加動畫效果)、Runway v2(用于通過文本創建視頻)
最佳聲音克隆:ElevenLabs
現在,AI生成視頻方面可以來個一條龍服務:
從生成的角色,到劇本創建,再到配音,都可以交給AI來完成。
用AI工具生成的視頻有時看起來還蠻逼真。Ethan Mollick教授就拿自己的照片做過一段“假視頻”:
圖片
但需要特別注意的是,這些工具都需要合乎道德地使用。
五、處理文件和數據
數據(以及使用代碼的任何奇怪想法):Code Interpreter
文檔:Claude 2(大型文檔或同時處理多個文檔),Bing(側邊欄適用于較小的文檔和網頁)
Code Interpreter可實現對上傳的文件進行編寫并運行代碼,生成結果也可供下載。你可以用它來執行程序,進行數據分析,或者創建各種文件、網頁,甚至游戲。
Ethan Mollick教授還設置了一個用Code Interpreter來處理數據可視化的方法(鏈接見文末):
圖片
處理PDF文檔這方面,還是要Claude 2出馬。
Ethan Mollick教授表示曾將整本書粘貼到Claude中,還給過它許多復雜的學術文章,并要求它總結結果,Claude的表現都不錯。
圖片
不僅如此,還可以通過繼續提問進一步探討資料,比如說這種方法的證據是什么?作者的結論是什么……
但有時候模型還是會產生“幻覺”,這一點還是要注意。
六、獲取信息并學習知識
最佳免費選擇:Bing
付費選項:對于兒童來說,可用Khanmigo(AI輔導)
Ethan Mollick教授認為最好不要把這些大模型當作搜索引擎來用,出現“幻覺”的風險很高。
而他建議使用Bing,也是因為Bing聯網,“幻覺”會相對來說少一點。但如果謹慎使用,AI通常可以提供比搜索更有用的答案,特別是在搜索引擎給的結果不是很好的情況下。
此外,用這些AI工具來幫助我們學習是個不錯的選擇。Ethan Mollick教授還給出了一個他認為比較好的“自動導師”提示:
圖片
傳送門:
[1]https://www.jonstokes.com/p/stable-diffusion-20-and-21-an-overview(Stable Diffusion使用指南)[2]https://www.pcworld.com/article/540080/how-to-use-discord-a-beginners-guide.html(Discord使用指南)
[3]https://huggingface.co/spaces/society-ethics/DiffusionBiasExplorer(觀察圖片生成偏見)*
[4]https://www.oneusefulthing.org/p/a-quick-and-sobering-guide-to-cloning(Ethan Mollick用照片生成視頻)[5]https://chat.openai.com/share/afe54a2d-0ad0-4166-b1aa-9a5394deff66(用Code Interpreter做數據可視化)
[6]https://chat.openai.com/share/ec1018ec-1d86-4160-b587-354253c7d5cb(AI導師提示)*
參考鏈接:
[1] https://www.oneusefulthing.org/p/how-to-use-ai-to-do-stuff-an-opinionated
[2]https://twitter.com/emollick/status/1680586569617481728?s=20