加速大模型落地:火山引擎向量數據庫的實踐應用
近兩年隨著大模型技術的快速發展,圖片、視頻、自然語言等多模態、非結構化數據的查找需求變大,非結構化數據的量級也遠大于結構化數據,傳統數據庫已經無法滿足如此多樣化數據的處理需求。向量數據庫以其海量的數據存儲規模、高效的計算查詢能力,正在成為大模型時代重要的基礎設施。
3 月23 日,火山引擎開發者社區 Meetup 第十三期邀請到了火山引擎的三位技術專家,將從火山引擎的實踐應用出發,為大家詳解向量檢索功能的設計實現以及大規模云原生向量數據庫的核心技術和優化,和大家共同探討大模型時代向量數據庫的落地實踐。
?時間:2024/03/23(周六) 14:00-17:00
地點 :北京市海淀區北三環西路甲 18 號院大鐘寺廣場 1 號樓 3F-17
形式:線下+線上同步直播
精彩議程
《VikingDB:大規模云原生向量數據庫的前沿實踐與應用》謝劍橋|火山引擎向量數據庫高級工程師
向量數據庫是解決海量非結構化數據檢索與分析問題的行業共識,我們從 19 年解決大規模分布式向量檢索問題,到推出云原生、AI 原生的向量數據庫,持續應對抖音集團內外部業務的復雜技術挑戰,積累了豐富實踐經驗。本次演講將重點介紹 VikingDB 解決各類應用中極限性能、規模、精度問題上的探索實踐,并通過落地的案例向聽眾介紹如何在多模態信息檢索、RAG 與知識庫等領域進行合理的技術選型和規劃。
主要內容:
1. AI 原生、云原生的向量數據庫是怎樣的
a. 不止RAG——AIGC 時代的向量庫應用
b. AI 原生的能力推導
c. 大規模云原生架構設計要點
2. 極端性能、規模、精度問題是怎么解決的
a. 向量數據庫的關鍵性能維度和極限案例
b. 極致性能優化探索
c. 極端規模場景的解決之道
d. 精度:追逐相關性本質
3. 如何用好檢索型向量數據庫
a. 從應用場景進行技術選擇
b. 真實業務場景的避坑指南
《解析云原生數倉 ByteHouse 如何構建高性能向量檢索技術》田昕暉|火山引擎 ByteHouse 技術專家
向量檢索被廣泛使用于以圖搜圖、內容推薦以及大模型推理等場景。隨著業務升級與 AI 技術的廣泛使用,用戶期望處理的向量數據規模越來越大,對向量數據庫產品的穩定性、易用性與性能需求也越來越高。為此火山引擎ByteHouse 團隊基于社區 ClickHouse 進行技術演進,提出了全新的向量檢索功能設計思路,滿足業務對向量檢索穩定性與性能方面的需求。
主要內容:
1. 向量檢索概念以及在 LLM 場景的應用
2. 當前業界向量數據庫發展情況
3. ClickHouse 結合向量檢索的優勢,以及社區當前向量檢索局限性與性能問題分析
4. ByteHouse 向量檢索功能設計思路介紹
5. 性能比較
《在火山引擎云搜索服務上構建混合搜索的設計與實現》魯蘊鋮|火山引擎云搜索服務高級研發工程師
當今,隨著圖片和視頻數據的爆炸式增長,人們對于多樣化數據搜索的需求也越來越迫切。多模態搜索場景已經成為當前搜索領域的主要趨勢。在這個背景下,本次演講將重點介紹字節跳動在混合搜索領域的探索,并探討如何在多模態數據場景下進行海量數據搜索。
主要內容:
1. 混合搜索的應用場景
2. 云搜索服務在混合搜索中具備的搜索能力
a. 云搜索服務在混合搜索中的生態能力
b. 云搜索服務在混合搜索中的搜索增強能力
c. 云搜索服務在混合搜索中的排序打分增強能力
3. 云搜索的混合搜索引擎
a. 當前不同向量引擎能力介紹
b. 多種向量引擎及優化編碼
c. 不同場景下的向量搜索能力對比與選擇
掃碼立即報名
掃碼進入活動群
閱讀原文鏈接:https://zjsms.com/iFdjBHb3/