第一個能聽懂人類語氣的AI火了,網友:感覺在和真人交談
第一個能聽懂你說話的語氣、有“情商”的AI火了!
?
這個AI名為EVI(Empathic Voice Interface),它不僅能夠能夠理解用戶的語氣,還會為每個詞增加意義。
對話中的每句話,它都能可視化含驚訝量、含悲傷量、含興奮量……
然后根據用戶的聲音信號來變換自己的語音語調,給出高情商回答。
EVI發布后,網友再次沸騰,稱其為“語音交互的游戲規則改變者”。
知名科技博主,曾是微軟最著名博客人的Robert Scoble也下場體驗了,讓EVI講起了笑話:
網友看了EVI的一系列效果后也坐不住了:
除了ChatGPT,第二個讓我深感震驚的demo就是這。
還有網友表示自己用ChatGPT語音對話時,就預想到了這樣的功能體驗,現在想法變成了現實。
確實,ChatGPT、訊飛星火等語音對話都是直接將對話內容轉換成文字,語氣停頓都不能保留。
知心大姐/哥EVI來了
目前,官方放出了demo,大伙兒可以試玩。
不過由于太火,有時也會出現被擠爆情況。
已經玩上的網友開始詢問它各種問題。
比如討論冬天天氣嚴寒,是否要給樓房建造項目增加隔熱材料。
有網友用不同語調來測試它,EVI都能識別并變換多種情緒回應。
還有網友開始整花活,讓兩個EVI對話,不斷讓它們互相打斷對話,然后兩個EVI都開始“請,繼續”、“我洗耳恭聽”。
再來看官方的介紹,總的來說,EVI是一個基于自研的具有同理心的大模型“eLLM”驅動的API,4月份將正式發布。
有這么幾個特點:
- 根據你的情緒以類似人類的語調作出回應
- 針對你的需求,使用能夠提高滿意度的語言反應
- 知道何時講話,利用你的語調精準判斷對話輪次結束
- 若被打斷會停止發言,并能從中斷點恢復對話
- 通過分析你的反饋逐漸自我優化,增強你的幸福感
通過申請,開發者可以提前獲得開發訪問權限,將EVI集成到各種應用中。此外,EVI還可以融合外部大模型API的回應,而demo融入了Claude 3 Haiku。
不少開發者已經在評論區開要權限:
背后公司Hume AI
打造出EVI的,是一家名為Hume AI的實驗室/科技公司。目前團隊共有30人,已在頂刊發表了超8篇學術文章。
CEO兼首席科學家Alan Cowen是前谷歌研究員。
他的主要研究是利用計算方法來探討情感行為如何被激發、概念化、參數化、預測、注釋和轉化。
據了解,他提出的語義空間理論(semantic space theory),是Hume AI用來捕捉和理解人類表達和溝通中復雜微妙細節的數據驅動方法的基礎。
此外,Hume AI還有加州大學伯克利分校心理學教授Dacher Keltner助陣,COO是前Ageis Ventures合伙人Janet Ho。
就在幾天前,Hume AI完成了5000萬美元的新一輪融資。
之前,Hume AI還推出了Expression Measurement API,一個用于測量人類情感表達的高級工具包,以及Custom Models,它使用這些測量的遷移學習來預測人類的偏好。
那么對于新發布的EVI,你覺得它的效果如何?
本文轉自 量子位 ,作者:量子位
