企業(yè)中最常用的十種GenAI工具
從AI聊天機(jī)器人和虛擬助手,到音頻和視頻生成器,這些都是當(dāng)今最前沿的GenAI工具。
自O(shè)penAI于2022年推出ChatGPT以來(lái),GenAI已大規(guī)模進(jìn)入企業(yè)領(lǐng)域。根據(jù)Precedence Research的數(shù)據(jù),2024年全球GenAI市場(chǎng)規(guī)模已超過250億美元,并預(yù)計(jì)到2033年將達(dá)到驚人的8030億美元。同時(shí),賓夕法尼亞大學(xué)沃頓商學(xué)院的沃頓AI和分析倡議組織(AI at Wharton)與咨詢公司GBK Collective的一項(xiàng)針對(duì)高層決策者的研究發(fā)現(xiàn),2024年擁有1000名或更多員工的企業(yè)在GenAI上的投資平均比2023年高出了一倍以上。
然而,德勤最近的一項(xiàng)調(diào)查顯示,盡管大多數(shù)董事級(jí)至高管級(jí)的受訪者在使用或?qū)嵤〨enAI計(jì)劃方面有經(jīng)驗(yàn),并計(jì)劃在下一個(gè)財(cái)政年度增加其整體AI支出,但他們的態(tài)度較為謹(jǐn)慎,預(yù)計(jì)在未來(lái)幾個(gè)月內(nèi),只有30%或更少的GenAI實(shí)驗(yàn)?zāi)軌蛉嫱茝V,這反映了他們手頭可用的工具狀況。因此,鑒于當(dāng)前的獲取和采用環(huán)境,以下是當(dāng)前企業(yè)中最常用的10種GenAI工具。
ChatGPT
ChatGPT是OpenAI推出的一款聊天機(jī)器人應(yīng)用程序,它建立在生成式預(yù)訓(xùn)練轉(zhuǎn)換器(GPT)模型之上。自2022年推出以來(lái),它已成為企業(yè)中最常用的GenAI工具,沃頓商學(xué)院最近的調(diào)查顯示,62%的受訪者表示他們目前正在使用它,28%的受訪者表示他們目前尚未使用但正在評(píng)估或測(cè)試它。
ChatGPT的優(yōu)勢(shì)在于自然語(yǔ)言的理解和生成,使其成為應(yīng)對(duì)復(fù)雜語(yǔ)言挑戰(zhàn)的優(yōu)秀工具,包括自動(dòng)化和改進(jìn)客戶服務(wù)、通過處理重復(fù)性查詢來(lái)簡(jiǎn)化運(yùn)營(yíng)、生成報(bào)告、起草電子郵件以及創(chuàng)建產(chǎn)品描述等。
與所有GenAI一樣,ChatGPT的準(zhǔn)確性可能會(huì)有所不同,而且它無(wú)法理解情緒,這可能會(huì)在某些情況下引發(fā)問題。因此,可能需要人類監(jiān)督和干預(yù)。
Microsoft Copilot
Microsoft Copilot是嵌入在Microsoft 365中的一款對(duì)話聊天界面,旨在增強(qiáng)Word、Excel、PowerPoint、Outlook和Teams等應(yīng)用程序的生產(chǎn)力。它于2023年推出,利用OpenAI的GPT-4基礎(chǔ)大型語(yǔ)言模型(LLM),是第二大常用的GenAI工具。根據(jù)沃頓商學(xué)院的調(diào)查,52%的受訪者表示他們的企業(yè)目前正在使用Copilot,35%的受訪者表示他們正在評(píng)估或測(cè)試它。
Copilot的強(qiáng)項(xiàng)在于它與Microsoft 365環(huán)境中員工全天使用的生產(chǎn)力應(yīng)用程序的集成。它遵循企業(yè)已有的安全、合規(guī)和隱私政策,并可作為現(xiàn)有Microsoft許可證的附加組件提供。其用途包括:
? 在Word中起草文檔和摘要文本
? 根據(jù)Excel中現(xiàn)有數(shù)據(jù)生成圖表
? 在PowerPoint中創(chuàng)建大綱和設(shè)計(jì)幻燈片
? 管理Outlook收件箱、摘要電子郵件線程和起草回復(fù)
? 匯總Teams會(huì)議的關(guān)鍵點(diǎn)并創(chuàng)建待辦事項(xiàng)
? 利用Power BI通過自然語(yǔ)言查詢創(chuàng)建報(bào)告和可視化內(nèi)容
與ChatGPT一樣,Copilot的準(zhǔn)確性并非完美。例如,在總結(jié)內(nèi)容時(shí),它可能會(huì)遺漏要點(diǎn)或忽略關(guān)鍵細(xì)節(jié)。同樣,即使在使用品牌材料、文案和圖像時(shí),其輸出也不一定符合品牌標(biāo)準(zhǔn)。用戶需要關(guān)注其輸出。
Google Gemini
Google Gemini(前身為Bard)是一款基于Google的Gemini多模態(tài)AI模型構(gòu)建的對(duì)話聊天機(jī)器人。沃頓商學(xué)院的調(diào)查顯示,40%的受訪者表示他們目前正在使用Gemini,39%的受訪者表示他們正在評(píng)估或測(cè)試它。
與ChatGPT和Microsoft Copilot相比,Gemini在2023年推出時(shí),在多模態(tài)功能方面處于領(lǐng)先地位——除了文本之外,它還能夠處理和生成圖像、音頻和視頻。Gemini與Gmail、Docs和Slides等Google Workspace工具集成。
Gemini的潛在用途包括:
? 根據(jù)Smart Email Composer的提示起草電子郵件
? 根據(jù)提示在Google Slides中創(chuàng)建幻燈片演示文稿
? 通過Spreadsheet Analyzer在Google Sheets中識(shí)別趨勢(shì)、異常值和相關(guān)性
? 為Google Meet視頻會(huì)議生成背景插圖并模擬專業(yè)照明,甚至改善音頻體驗(yàn)
Gemini與Google Workspace的集成使其成為在使用Workspace的環(huán)境中出類拔萃的工具,但在此類環(huán)境之外,其效用有限,因?yàn)樗贕oogle的安全環(huán)境中運(yùn)行。與ChatGPT和Copilot一樣,準(zhǔn)確性可能是一個(gè)問題,因此建議對(duì)人類監(jiān)督其輸出。
Meta AI
Meta AI是Meta為其消息和社交媒體應(yīng)用程序(包括Facebook、Instagram、WhatsApp和Messenger)打造的多模態(tài)AI虛擬助手。與Gemini一樣,沃頓商學(xué)院的調(diào)查顯示,40%的受訪者表示他們目前正在使用Meta AI,36%的受訪者表示他們正在評(píng)估或測(cè)試它。
Meta AI由Meta的Llama大型語(yǔ)言模型(LLM)提供支持,用戶可以利用它在公司的應(yīng)用程序中提供建議、回答問題、編輯圖像和提供翻譯。企業(yè)可以使用Meta AI來(lái)設(shè)置虛擬助手,這些助手可以:
? 自動(dòng)化客戶互動(dòng),包括回答問題和提供個(gè)性化建議
? 在Meta的應(yīng)用程序內(nèi)促進(jìn)交易
? 分析數(shù)據(jù),以幫助企業(yè)創(chuàng)建有針對(duì)性的營(yíng)銷活動(dòng)
Meta AI已經(jīng)與許多客戶在線花費(fèi)大量時(shí)間的應(yīng)用程序集成,但訪問客戶數(shù)據(jù)可能存在隱私和道德問題。
Dall-E 3
GenAI不僅僅關(guān)乎聊天機(jī)器人和虛擬助手。同樣來(lái)自O(shè)penAI的DALL-E 3專注于根據(jù)文本描述生成視覺內(nèi)容,沃頓商學(xué)院的調(diào)查顯示,30%的受訪者表示他們目前正在使用DALL-E 3,35%的受訪者表示他們正在評(píng)估或測(cè)試它。OpenAI于2021年推出了原始的DALL-E模型,而DALL-E 3深度學(xué)習(xí)模型則利用計(jì)算機(jī)視覺和自然語(yǔ)言處理來(lái)創(chuàng)建視覺內(nèi)容。其潛在商業(yè)用途包括產(chǎn)品構(gòu)思、應(yīng)用程序原型設(shè)計(jì)、標(biāo)志設(shè)計(jì)、為社交媒體帖子和教育材料創(chuàng)建圖像和視頻等。
在AI圖像生成器中,DALL-E 3的強(qiáng)項(xiàng)在于它與ChatGPT的集成,但許多用戶表示,它在逼真度方面存在困難,具有一種獨(dú)特的風(fēng)格,使得很容易識(shí)別出模型生成的圖像。
RunwayML Gen-1和Gen-2
Runway利用文本、圖像和視頻輸入(包括由其他GenAI工具生成的內(nèi)容)來(lái)生成視頻,沃頓商學(xué)院的調(diào)查顯示,25%的受訪者表示他們目前正在使用Gen-1和Gen-2,31%的受訪者表示他們正在評(píng)估或測(cè)試這些模型。
2023年發(fā)布的Gen-2模型擴(kuò)展了Gen-1模型的功能,允許創(chuàng)建長(zhǎng)達(dá)18秒的視頻。用戶可以指導(dǎo)相機(jī)的移動(dòng)以定制內(nèi)容,并將片段拼接在一起以創(chuàng)建更長(zhǎng)的視頻。除此之外,企業(yè)還可以使用該工具來(lái)制作靜態(tài)資產(chǎn)的動(dòng)畫、視覺效果和故事板。
Runway的某些功能學(xué)習(xí)曲線較陡峭,而且可能會(huì)占用大量資源。
Stable Diffusion
Stable Diffusion是Stability AI于2022年推出的一款深度學(xué)習(xí)模型,它可以根據(jù)文本和圖像提示生成高分辨率、逼真的圖像。它還可以創(chuàng)建視頻和動(dòng)畫,沃頓商學(xué)院的調(diào)查顯示,24%的受訪者表示他們目前正在使用Stable Diffusion,33%的受訪者表示他們正在評(píng)估或測(cè)試它。
Stable Diffusion基于一種潛在擴(kuò)散模型,該模型所需的處理能力遠(yuǎn)低于一些競(jìng)爭(zhēng)對(duì)手,因此它能夠在配備消費(fèi)級(jí)GPU的臺(tái)式機(jī)和筆記本電腦上運(yùn)行,而不局限于云服務(wù)。
Stable Diffusion的潛在商業(yè)用途包括醫(yī)學(xué)成像、為目錄生成視覺內(nèi)容、設(shè)計(jì)數(shù)字原型、創(chuàng)建概念藝術(shù)和故事板,以及圖像編輯(包括色彩校正和降噪)。
Midjourney
Midjourney是一款根據(jù)自然語(yǔ)言提示生成圖像的工具。自2022年推出公開測(cè)試版以來(lái),沃頓商學(xué)院的調(diào)查顯示,23%的受訪者表示他們目前正在使用Midjourney,32%的受訪者表示他們正在評(píng)估或測(cè)試它。
可以通過Discord通信平臺(tái)或該工具的官方網(wǎng)站訪問Midjourney。
通過Midjourney商業(yè)許可證創(chuàng)建的圖像可用于商業(yè)用途,但除非經(jīng)過人類的重大改造,否則不能享有版權(quán)。因此,未經(jīng)人類藝術(shù)家改造的Midjourney創(chuàng)建的圖像被視為公共領(lǐng)域。
Perplexity
Perplexity是Perplexity AI于2022年推出的一款基于AI的搜索引擎,它利用大型語(yǔ)言模型(LLMs)處理查詢并綜合響應(yīng),沃頓商學(xué)院的調(diào)查顯示,21%的受訪者表示他們目前正在使用Perplexity,33%的受訪者表示他們正在評(píng)估或測(cè)試它。
Perplexity建立在Microsoft Azure之上。免費(fèi)版本利用OpenAI的GPT-3.5大型語(yǔ)言模型,但付費(fèi)用戶可以選擇自己的模型。其用途包括:
? 內(nèi)部搜索,用于同時(shí)在網(wǎng)絡(luò)和內(nèi)部文檔中搜索內(nèi)容
? 金融,包括實(shí)時(shí)股票報(bào)價(jià)、價(jià)格跟蹤、行業(yè)同行比較和基本財(cái)務(wù)分析工具
? Perplexity Assistant,一款適用于Android設(shè)備的基于AI的搜索助手
Claude
Claude是Anthropic于2023年推出的一款對(duì)話式AI聊天機(jī)器人,沃頓商學(xué)院的調(diào)查顯示,19%的受訪者表示他們目前正在使用Claude,34%的受訪者表示他們正在評(píng)估或測(cè)試它。
Claude遵循Anthropic開發(fā)的憲法AI(CAI)原則,這是一種訓(xùn)練AI系統(tǒng)的方法,旨在解決透明度、安全性和無(wú)需依賴人類反饋即可做出決策方面的擔(dān)憂。CAI旨在為Claude設(shè)定道德界限,使其能夠拒絕回答可能造成傷害的查詢。
Claude是ChatGPT等其他通用產(chǎn)品的替代品,企業(yè)可以利用它來(lái)自動(dòng)化和改進(jìn)客戶服務(wù)、通過處理重復(fù)性查詢來(lái)簡(jiǎn)化運(yùn)營(yíng)、生成報(bào)告、起草電子郵件以及創(chuàng)建產(chǎn)品描述。
Claude以其回復(fù)的清晰度而聞名,但也有冗長(zhǎng)的傾向。