與OpenAI競(jìng)爭(zhēng)?Jina AI推出開(kāi)源8K文本嵌入模型
10月27日消息,外媒報(bào)道稱,人工智能公司Jina?AI日前宣布推出其第二代文本嵌入模型“Jina-embeddings-v2”。這個(gè)開(kāi)源模型支持8K(8192個(gè)token)的上下文長(zhǎng)度,使其在大規(guī)模文本嵌入基準(zhǔn)(MTEB)排行榜和功能方面與OpenAI的專有模型text-embedding-ad-002直接競(jìng)爭(zhēng)。
值得注意的是,jina-embedding-v2在分類平均值、重新排序平均值、檢索平均值和匯總平均值方面超過(guò)了OpenAI。
jina-embeddings-v2經(jīng)過(guò)深入的研發(fā)、數(shù)據(jù)收集和微調(diào),從頭開(kāi)始精心打造。其結(jié)果是一個(gè)模型,它代表了與前代模型相比的重大飛躍。
除了技術(shù)成就之外,jina-embeddings-v2的8K上下文長(zhǎng)度為各種行業(yè)應(yīng)用打開(kāi)了新的大門,包括法律文件分析、醫(yī)學(xué)研究、文學(xué)分析、財(cái)務(wù)預(yù)測(cè)和對(duì)話人工智能。基準(zhǔn)測(cè)試表明,這種擴(kuò)展的上下文使jina-embettings-v2在幾個(gè)數(shù)據(jù)集中優(yōu)于其他領(lǐng)先的基礎(chǔ)嵌入模型,突出了較長(zhǎng)上下文能力的實(shí)際優(yōu)勢(shì)。
Jina?AI計(jì)劃發(fā)表一篇學(xué)術(shù)論文,詳細(xì)介紹“Jina-embeddings-v2”的技術(shù)復(fù)雜性和基準(zhǔn),開(kāi)發(fā)類似OpenAI的嵌入式API平臺(tái),并推出德國(guó)-英國(guó)模型。