什么是好的GenAI 產品?哪些以LLM技術為支持的產品值得開發? 原創
最近幾天,我參加了公司組織的幾次產品討論會,主要議題是是否值得開發以大型語言模型(LLM)技術為核心的產品。目前市場上一些基于LLM的產品未能達到預期的盈利水平,這讓大家對LLM的商業潛力產生了疑慮,并在多次討論會上探討未來的發展方向。
不可否認的是,人工智能初創企業的競爭非常激烈,尤其是在大型語言模型的推動下,許多初創公司如雨后春筍般涌現。然而,盡管這一領域有著明顯的發展趨勢,只有少數生成型人工智能初創公司已經進入了發展的中期階段,許多公司仍處于早期階段,甚至還未獲得風險投資的支持。
那么,什么樣的生成型人工智能產品值得開發呢?這個問題非常廣泛。雖然我不是一名創業者,也無法提供具體的市場案例作答,但基于我在行業中的經驗,可以就這個話題隨便聊一聊。同時,也歡迎大家在評論區或者群里分享各自公司的實踐經驗和觀點,以豐富我們對于這一問題的理解。
具有高質量標準或昂貴的質量監測的LLM應用可能會失敗
LLM 的推理結果不可預測且難以評估,即使用戶最初對產品評分很高,不同的用戶群(或在不同情境下的相同用戶)可能會對產品評價大不相同。此外,隨著知識庫的擴展,結果可能會在先前足夠好的情況下惡化。即使切換到所謂的“更高質量”的LLM,這種惡化也可能發生。
如果一個產品的表現需要人來監控,但我們又無法通過現有的方法來有效預防錯誤,那么這個產品可能會失敗。尤其是大語言模型(LLM),很難找到可以被信任來監控自己輸出質量的情況。
其實,這個問題歸根結底是看用戶能不能接受錯誤:
- 如果用戶對錯誤的容忍度很高,或者說結果的質量遠遠超過用戶能接受的最低標準,那么可以用模型自帶的評估方法,甚至可以不需要監控。在這種情況下,用大語言模型來做應用是沒問題的。但在一些對錯誤非常敏感的領域,比如1%的錯誤率都無法接受的地方,用大語言模型就不合適了。
- 即使在一些情況下,產品的盈利能力足夠高,能覆蓋修復錯誤所需的人力成本,那么用大語言模型也是合理的。
- 還有一種中間情況:用戶對錯誤的容忍度和當前應用程序的性能差不多。這種情況下,還是需要人來干預,但這部分工作應該由用戶來完成,而不是開發公司的員工。
總的來說,是否使用大語言模型,主要看用戶對錯誤的容忍度以及修復錯誤的成本是否劃算。
一個“完整”的LLM驅動產品應該是什么樣子的?
想象一下,你在使用一款你特別喜歡的應用,比如你用來記錄生活點滴的日記軟件,或者那個幫你管理日程的工具?,F在,有一種新技術,叫做大型語言模型(LLM),它的聰明之處能夠讓這些應用變得更加智能,但關鍵是要巧妙地融合它們,讓你幾乎感覺不到新技術的加入。
杰弗里·摩爾在他的書《跨越鴻溝》中提到,真正能夠贏得大眾喜愛的產品,是那些能完全滿足用戶需求的“整體產品”。這意味著,而不是只提供一個基礎的工具或平臺,成功的應用會結合LLM等技術,提供一個無需用戶自己去拼湊的完整解決方案。
以個人知識管理(PKM)工具為例,它們通常是給那些喜歡自定義和整合各種插件的技術愛好者用的。但如果這些工具能夠通過整合人工智能,比如自動為你的文章或視頻生成創意建議,它們就可以吸引更廣泛的用戶群體,比如內容創作者和博主。
目前,一些用戶可能嘗試通過整合如TextCortex或NotebookLM這樣的通用人工智能工具到他們的PKM系統中來實現這一點,但這種方法通常比較繁瑣,并不能提供一個無縫的使用體驗。
真正的挑戰在于,如何讓這些智能功能自然融入到應用中,讓用戶不需要學習新的操作就能從中受益。比如,在教育應用中,學生可能只需點擊一個“下一步”按鈕就能接收到人工智能生成的個性化內容,而無需意識到背后的技術復雜性。
簡單來說,讓LLM技術無縫整合到用戶熟悉的工具中,提高易用性和產品完整性,是將產品從早期采用者推向大眾市場的關鍵。而那些看起來很有技術含量但用戶體驗不佳的AI集成,比如一個與應用幾乎無關的獨立聊天助手,很難成為產品選擇的決定性因素。
新一代GenAI 產品更適合 B2B2C 而非B2C
在我看來,以LLM作為其核心功能推出新的B2C產品面臨著重重障礙。以下是其中的兩個關鍵原因:
- 數據和隱私:LLM需要高質量的數據才能提供有意義的結果。在B2C背景下,這帶來了重大挑戰。使用客戶數據引發了許多B2C客戶的隱私擔憂。另一選項是使用開發者提供的數據,這需要一個龐大、多樣的數據集來滿足各種用戶需求。這大大增加了產品開發成本和復雜性。
- 巨頭科技公司的無法逾越的優勢:像Meta、Google和Apple等科技巨頭在B2C市場擁有幾乎無法逾越的優勢。即使它們比創業公司晚些時候以LLM為動力的產品進入某個利基市場,它們數億的現有用戶群體都提供了巨大的優勢,它們的平臺是用戶已經花費他們數字生活的地方。即使進行了大量的營銷投資,創業公司也無法與這種規模匹敵。
在B2B2C模型中,一個設計良好的應用可以大幅緩解許多挑戰,尤其是為其他公司,特別是中小企業,提供快速開發端到端B2C市場產品的能力。這種模型的優勢包括:
- 數據和隱私:在B2B2C模型中,高質量的數據可以來源于B2B客戶,而不是直接來自個別的B2C客戶。這意味著,與直接收集B2C用戶數據相比,企業(B2B客戶)有更強的動力和能力來解決數據隱私問題。
- 利用現有客戶群:每個B2B客戶通常已經擁有自己的客戶群體。通過LLM驅動的產品,這些B2B企業可以提高其從現有客戶群體中獲利的能力,或者降低提供服務的成本。
如何克服用戶對調整其習慣以適應新技術的自然抵觸情緒
LLM 聽起來很高大上,但我們需要面對現實:并不是每個人都能立刻從自己的舒適區邁出步伐,投入到全新的科技潮流中。
首先,談到這些新興的人工智能應用,它們承諾為我們帶來全新的用戶體驗,仿佛賦予我們一把開啟新世界大門的鑰匙。然而,問題在于,大多數人對于改變自己的習慣,即使是微小的改變,都會感到不適,無論他們是否意識到這一點。
許多這些應用都基于所謂的“對話式用戶體驗設計”,聽起來很高級,但實際上,這意味著用戶需要花費更多時間輸入文字或進行語音交流,與應用“對話”。對于習慣于簡單點擊幾下屏幕就能完成任務的人來說,這確實是一個挑戰。
此外,為了讓基于LLM的應用更好地理解我們的需求,我們往往需要與它們進行多次對話,這個過程有時相當費勁。對于那些更喜歡動手操作而不愿意花時間閱讀和輸入的人來說,會感覺很繁瑣。
因此,如果這些新的人工智能應用希望真正吸引用戶,它們需要提供的不僅僅是節省一點時間。我們談論的是一種質的飛躍,類似于讓一個普通演講者變成一個有影響力的領袖。這種級別的改變才具有足夠的吸引力。
簡單來說,如果一個應用只能讓我們節省10%到20%的時間,對于大多數人來說,這可能還不夠吸引力。畢竟,人們總是對改變現狀有所抵觸。我們需要的是一種能夠真正讓人驚艷、讓我們成為更好的自己的技術革新。
總結
使用LLM的產品可能面臨輸出質量挑戰,并不可避免地遇到質量評估方面的困難,解決或繞過這些問題的可行性與用戶的錯誤容忍度密切相關。
對于已經成熟的產品,通過LLM集成增加產品價值,同時保持熟悉的用戶體驗是有益的。盡管如此,保持傳統用戶體驗并非總是可行的,也不一定對新穎的產品有必要。由LLM驅動的應用程序可能具有“聊天界面”,挑戰用戶改變他們的習慣。在這種情況下:
- AI必須為用戶提供變革性的好處
- 產品應該遵循B2B或B2B2C模式,而不是B2C。在這種情況下,B2B客戶成為GenAI功能的主要用戶,因為他們激勵他們的團隊提高盈利能力
本文轉載自公眾號AI 博物院 作者:longyunfeigu
原文鏈接:??https://mp.weixin.qq.com/s/PL9tsIHmctdjSY1EIVPWCg??
