成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微軟、Anthropic正在拉滿大模型的情緒價值 原創

發布于 2024-11-21 13:52
瀏覽
0收藏

編輯 | 星璇

出品 | 51CTO技術棧(微信號:blog51cto)

再過3天,ChatGPT 就要迎來它的第二個生日了,GPT 推出也已經6年了。

到目前為止,大型語言模型 (LLM) 一直在有效發展。它們真實、敏捷且足智多謀。甚至可以說它們在檢索信息方面接近完美。但是作為“信息傳遞工具”,又如何呢?

在最近接受 Reid Hoffman 采訪時,Microsoft AI 首席執行官 Mustafa Suleyman 表示:“AI 研究人員通常傾向于忽視信息傳遞工具的重要性。

考慮到理解和響應人類情感的能力如何成為一個關鍵的差異化因素,Mustafa 預測 AI 公司現在將根據其前沿模型的情商相互“角力”。

微軟、Anthropic正在拉滿大模型的情緒價值-AI.x社區圖片

1.C端AI,情商很關鍵

Mustafa 強調,消費者通常更看重這些模型的語氣和情商,以及它們設法反映用戶獨特語言風格的方式,而不僅僅是提供客觀的、百科全書式的維基百科反芻。

在 GPT 4o 中推出高級語音功能后,OpenAI 今年的重點領域之一是集成類似人類的語音對話工具。同樣,當 Google 的 NotebookLM 推出一款精致的文本轉播客工具“Deep Dive”時,AI 社區很快就接受了這個沒有噱頭的工具。

計算機科學家 Andrej Karpathy 表達了他對該工具的贊賞,甚至使用 NotebookLM 發布了一個 10 集的整個播客系列。“NotebookLM 播客劇集生成可能觸及了一個極具吸引力的 LLM 產品格式的全新領域。感覺讓人想起 ChatGPT。也許我反應過度了,“他說。

2.新方向:摸索大模型的“情商規律”

不僅僅是 AI 領域的行業巨頭。今年三個月后,被稱為“情商人工智能”的 Hume AI 在由 EQT 風險投資領投的 B 輪融資中獲得了 5000 萬美元的資金。9 月,他們發布了最新的 EVI 2 模型,該模型通過專門的情商訓練適應用戶偏好。

今年早些時候,研究人員探索了 LLM 的情商。EmoBench 是一個流行的基準,它評估了這種能力。結果表明,OpenAI 的 GPT 4 在“情感理解和情感應用”方面最接近人類。然而,所評估的模型在今天已成為過去。

最近,一項研究使用 Python 庫測量了 LLM 的“表現力”。研究人員還進行了一項實驗,涉及以詩歌風格根據情緒生成詩歌,包括遺憾、喜悅和懊悔的感覺。雖然 LLM 的表現令人滿意,但結果表明,在表達具有相似含義的情緒時存在混淆。

“所有 GPT 模型在被提示表示不贊成時通常會表示贊同。這是一個重要的例子,兩種含義相互沖突的情緒經常被誤解,“他們說。

當這些 LLM 的任務是生成 34 位不同詩人風格的詩歌時,GPT 4o 顯示出最高的表現力。然而,這些模型在負責識別女性詩人時表現出困惑,這可能在一定程度上表明了性別偏見。

在常規對話中,表現力逐漸下降。也就是說,盡管有局限性,但 Llama 3 的表現最好。應該注意的是,當提供有關主題、專業或角色的額外背景時,這些 LLM 的表現會更好。

“對于專業信號,LLM 表現出一致且不斷增長的表達水平。相反,對于情緒信號,LLM 的表達性變化更大,隨著模型根據不斷變化的情緒背景調整和改變其反應,準確性會波動,“研究人員補充道。

3.Anthropic目前的目標:提高模型情商

Anthropic 認為情商是提高 Claude 的重要因素。哲學家兼 Anthropic 技術人員 Amanda Askell 在接受 Lex Fridman 采訪時說:“我的主要想法一直是試圖讓 Claude 的行為方式,如果他們處于 Claude 的位置,你希望任何人都能理想地表現。

“所以想象一下,我帶一個人去,他們知道他們將與可能有數百萬人交談,這樣他們所說的話就會產生巨大的影響,你希望他們在這種真正豐富的意義上表現良好,”Askell 說。

對于更新的模型,Anthropic 正在努力幫助 Claude 以細致入微的情緒和表情做出回應。這涉及塑造模型以了解何時關心、何時表現得幽默、何時尊重意見以及何時確定自主程度。

她還解決了 LLM 中的阿諛奉承問題,即使他們是正確的,他們也傾向于糾正他們的輸出,只是為了服從人類輸入所說的。“如果 Claude 真的確信這不是真的,Claude 應該說,'我不這么認為。也許你有更多最新的信息',“Askell 補充道。

Askell 還提到,她想提高 Claude 在對話中提出相關后續問題的能力。總的來說,Anthropic 目前的目標是在 Claude 內心灌輸真實的個性,而不是推遲或霸道地對待人類。雖然關于 LLM 碰壁并達到其可擴展性極限的討論和爭論不斷涌現,但調整這些模型以提高情商是一種選擇。

但是,需要注意的是。今年早些時候,OpenAI 發布了一張“系統卡”,警告人們可能會過度依戀情商高的 AI。

“使用 AI 模型進行類人社交可能會產生影響人與人互動的外部性。例如,用戶可能會與 AI 建立社交關系,減少他們對人際互動的需求,可能會使孤獨的人受益,但可能會影響健康的人際關系,“OpenAI 在報告中指出。

微軟、Anthropic正在拉滿大模型的情緒價值-AI.x社區圖片

不幸的是,據之前的一個報道,一位14歲的少年由于對 CharacterAI 中的某個角色產生了深深的情感依戀,最終導致其自殺身亡。

由此可見,提高 AI 模型中的情商還有很多工作需要做,也有許多問題需要解決。開發面向消費者層面上 AI 互動技術無疑是一個明確的趨勢,但在讓大模型在同理心和責任感之間取得平衡,更加至關重要。

本文轉載自51CTO技術棧,作者:星璇

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 午夜爽爽爽男女免费观看 | 久久久久久久综合色一本 | 偷派自拍 | 国产精品免费观看 | 国产成人综合一区二区三区 | 精品久久久久久 | 正在播放亚洲 | 黄色在线免费观看 | 在线亚洲电影 | 国产免费黄网 | 亚洲va欧美va天堂v国产综合 | 成人欧美一区二区三区黑人孕妇 | 日本一区二区三区免费观看 | 亚洲国产成人精品久久 | 欧美日韩在线综合 | 久久成人综合 | 久久一级 | 亚洲成年人免费网站 | 一区二区三区四区在线视频 | 国产免费一区二区三区 | 九九久久精品视频 | 久久99精品国产麻豆婷婷 | 中文字幕亚洲欧美日韩在线不卡 | 欧美日一区 | 精品亚洲一区二区三区四区五区 | 性做久久久久久免费观看欧美 | 久久小视频| 99热欧美 | 欧美三级在线 | 午夜99| 午夜成人免费视频 | 亚洲国产偷 | 成人天堂| 精品91久久 | 国产精品三级久久久久久电影 | www.青娱乐| 国产黄色av网站 | 成人免费网站视频 | 日本特黄a级高清免费大片 特黄色一级毛片 | 欧美福利视频 | 国产91在线 | 亚洲 |