與OpenAI競(jìng)爭(zhēng)？Jina AI推出開(kāi)源8K文本嵌入模型

作者：Yu 2023-10-27 20:52:13

人工智能公司Jina?AI日前宣布推出其第二代文本嵌入模型“Jina-embeddings-v2”。這個(gè)開(kāi)源模型支持8K(8192個(gè)token)的上下文長(zhǎng)度，使其在大規(guī)模文本嵌入基準(zhǔn)(MTEB)排行榜和功能方面與OpenAI的專有模型text-embedding-ad-002直接競(jìng)爭(zhēng)。

10月27日消息，外媒報(bào)道稱，人工智能公司Jina?AI日前宣布推出其第二代文本嵌入模型“Jina-embeddings-v2”。這個(gè)開(kāi)源模型支持8K(8192個(gè)token)的上下文長(zhǎng)度，使其在大規(guī)模文本嵌入基準(zhǔn)(MTEB)排行榜和功能方面與OpenAI的專有模型text-embedding-ad-002直接競(jìng)爭(zhēng)。

值得注意的是，jina-embedding-v2在分類平均值、重新排序平均值、檢索平均值和匯總平均值方面超過(guò)了OpenAI。

jina-embeddings-v2經(jīng)過(guò)深入的研發(fā)、數(shù)據(jù)收集和微調(diào)，從頭開(kāi)始精心打造。其結(jié)果是一個(gè)模型，它代表了與前代模型相比的重大飛躍。

除了技術(shù)成就之外，jina-embeddings-v2的8K上下文長(zhǎng)度為各種行業(yè)應(yīng)用打開(kāi)了新的大門，包括法律文件分析、醫(yī)學(xué)研究、文學(xué)分析、財(cái)務(wù)預(yù)測(cè)和對(duì)話人工智能。基準(zhǔn)測(cè)試表明，這種擴(kuò)展的上下文使jina-embettings-v2在幾個(gè)數(shù)據(jù)集中優(yōu)于其他領(lǐng)先的基礎(chǔ)嵌入模型，突出了較長(zhǎng)上下文能力的實(shí)際優(yōu)勢(shì)。

Jina?AI計(jì)劃發(fā)表一篇學(xué)術(shù)論文，詳細(xì)介紹“Jina-embeddings-v2”的技術(shù)復(fù)雜性和基準(zhǔn)，開(kāi)發(fā)類似OpenAI的嵌入式API平臺(tái)，并推出德國(guó)-英國(guó)模型。

責(zé)任編輯：龐桂玉來(lái)源：比特網(wǎng)

OpenAI Jina AI 開(kāi)源

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

與OpenAI競(jìng)爭(zhēng)？Jina AI推出開(kāi)源8K文本嵌入模型