大模型挑選指南來了！涵蓋六種情況下的選擇方案，為你匹配最佳模型

2023-07-18 12:58:06

今年年中最好的系統，學習曲線（learning-curve）是所有系統中最低的。只需輸入”thing-you-want-to-see —v 5.2”（末尾的—v 5.2很重要，使用最新的模型），就能得到非常不錯的結果。Midjourney需要使用Discord（使用指南見文末）。

最近Claude 2亮相、谷歌Bard支持中文、Open AI推出Code Interpreter（代碼解釋器）……

大模型發布一波接著一波，但五花八門，沒有一個可解決所有問題。

所以不同任務到底該用哪一個？

圖片

別著急，這不來自賓夕法尼亞大學沃頓商學院的Ethan Mollick教授整理了一份挑選指南。

選擇困難癥“患者”這下有救了！

這份指南不僅涵蓋了截至今年夏季的最新情況，而且在不同的任務中，還附上了不同大模型的表現對比。

手把手教你在六個使用場景下挑選大模型，還有最佳免費選項、付費選項。

網友看到后表示：

先替我同事收藏了。

圖片

一起來康康這份挑選指南里都有啥。

用不同大模型來做這六件事

一、撰寫文字

最佳免費選項：Bing 、Claude 2

付費選項：ChatGPT 4.0、ChatGPT+插件

AI寫作這一塊，Ethan Mollick教授認為，GPT-4目前仍是最靠譜的工具。

家人們還可以選擇用免費的Bing（創意模式creative mode），Claude也是一個不錯的選擇。

具體來說，用大模型可以幫你做這些事：打草稿、優化寫作內容、協助完成任務、解鎖自己（AI可以給你提供一種克服困難的方式）。

此外，這些工具還被整合到了一些辦公應用程序中，比如Microsoft Office+GPT、Google Docs+Bard。

圖片

上面這些大模型在文字寫作方面的表現都不錯，但也都有可能產生“幻覺”，胡言亂語。特別是要求未聯網的大模型提供互聯網的參考、引用信息。

Bing相較而言產生的“幻覺”更少，因為GPT-4表現效果通常更好，而且Bing連接網絡可以真正獲取相關事實信息。

Ethan Mollick教授在此前的使用中還發現一個問題：

AI并不能解釋自己，它只是讓你以為它在解釋。

圖片

如果你要求它解釋為什么寫了某個東西，它會給你一個看似合理但完全是捏造的答案。當你詢問它的思考過程時，它并不是在真正審問自己的行為，只是生成一些聽起來像是在這樣做的文本。

二、制作圖像

最透明的選項：Adobe Firefly

開源選項：Stable Diffusion

最佳免費選項：Bing、Bing Image Creator（使用DALL-E），Playground（可以使用多個模型）

最高質量的圖像：Midjourney

目前主要的圖像生成工具包括：

Stable Diffusion：已開源，特別適合與其它來源的圖像結合使用（使用指南見文末）。
DALL-E：來自OpenAI，已整合到Bing（需用創意模式）和Bing Image Creator（Bing圖像生成器）中。DALL-E很可靠，但比Midjourney差一些。
Midjourney：今年年中最好的系統，學習曲線（learning-curve）是所有系統中最低的。只需輸入”thing-you-want-to-see —v 5.2”（末尾的—v 5.2很重要，使用最新的模型），就能得到非常不錯的結果。Midjourney需要使用Discord（使用指南見文末）。
Adobe Firefly：集成在Adobe產品中的，但在生成圖片質量方面不如DALL-E和Midjourney。Adobe稱他們在訓大模型時，只使用有使用權的圖像。

大模型各自的表現是這樣嬸兒的（每張圖都是同樣提示下不同模型生成的第一張圖）：

圖片

△Prompt: “Fashion photoshoot of sneakers inspired by Van Gogh”

需要注意的是，受訓練數據影響，這些模型難免存在一些偏見。

其次，訓練數據大多來自互聯網，缺乏透明度，圖像的版權問題不夠明確。

此外，目前圖片生成中不能真正創作文本，只能生成一堆看起來像文本的東西。但Midjourney對手部的描繪很好。

三、構思創意

最佳免費選項：Bing

付費選項：ChatGPT 4.0（但由于Bing聯網，表現可能更好）

要有好的創意，通常需要有大量的想法，而AI正是擅長產生大量的想法。

在創意模式下，可以用Bing查找你喜歡的非常規創意生成技巧，例如布萊恩·伊諾的傾斜策略（oblique strategies）或馬歇爾·麥克盧漢的四元結構（tetrads），然后進行應用，或者要求模型提供一些奇怪的想法。

圖片

四、制作視頻

最佳動畫工具：D-iD（用于在視頻中為面部添加動畫效果）、Runway v2（用于通過文本創建視頻）

最佳聲音克隆：ElevenLabs

現在，AI生成視頻方面可以來個一條龍服務：

從生成的角色，到劇本創建，再到配音，都可以交給AI來完成。

用AI工具生成的視頻有時看起來還蠻逼真。Ethan Mollick教授就拿自己的照片做過一段“假視頻”：

圖片

但需要特別注意的是，這些工具都需要合乎道德地使用。

五、處理文件和數據

數據（以及使用代碼的任何奇怪想法）：Code Interpreter

文檔：Claude 2（大型文檔或同時處理多個文檔），Bing（側邊欄適用于較小的文檔和網頁）

Code Interpreter可實現對上傳的文件進行編寫并運行代碼，生成結果也可供下載。你可以用它來執行程序，進行數據分析，或者創建各種文件、網頁，甚至游戲。

Ethan Mollick教授還設置了一個用Code Interpreter來處理數據可視化的方法（鏈接見文末）：

圖片

處理PDF文檔這方面，還是要Claude 2出馬。

Ethan Mollick教授表示曾將整本書粘貼到Claude中，還給過它許多復雜的學術文章，并要求它總結結果，Claude的表現都不錯。

圖片

不僅如此，還可以通過繼續提問進一步探討資料，比如說這種方法的證據是什么？作者的結論是什么……

但有時候模型還是會產生“幻覺”，這一點還是要注意。

六、獲取信息并學習知識

最佳免費選擇：Bing

付費選項：對于兒童來說，可用Khanmigo（AI輔導）

Ethan Mollick教授認為最好不要把這些大模型當作搜索引擎來用，出現“幻覺”的風險很高。

而他建議使用Bing，也是因為Bing聯網，“幻覺”會相對來說少一點。但如果謹慎使用，AI通常可以提供比搜索更有用的答案，特別是在搜索引擎給的結果不是很好的情況下。

此外，用這些AI工具來幫助我們學習是個不錯的選擇。Ethan Mollick教授還給出了一個他認為比較好的“自動導師”提示：

圖片

傳送門：
[1]https://www.jonstokes.com/p/stable-diffusion-20-and-21-an-overview（Stable Diffusion使用指南）[2]https://www.pcworld.com/article/540080/how-to-use-discord-a-beginners-guide.html（Discord使用指南）
[3]https://huggingface.co/spaces/society-ethics/DiffusionBiasExplorer（觀察圖片生成偏見）*
[4]https://www.oneusefulthing.org/p/a-quick-and-sobering-guide-to-cloning（Ethan Mollick用照片生成視頻）[5]https://chat.openai.com/share/afe54a2d-0ad0-4166-b1aa-9a5394deff66（用Code Interpreter做數據可視化）
[6]https://chat.openai.com/share/ec1018ec-1d86-4160-b587-354253c7d5cb（AI導師提示）*

參考鏈接：
[1] https://www.oneusefulthing.org/p/how-to-use-ai-to-do-stuff-an-opinionated
[2]https://twitter.com/emollick/status/1680586569617481728?s=20

責任編輯：武曉燕來源：量子位

模型曲線系統

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看