從2024年12月份DeepSeek發(fā)布了DeepSeekV3開始,整個AI圈內(nèi)就掀起了一波技術(shù)創(chuàng)新式浪潮,核心的因素在于一家在2023年剛注冊成立的初創(chuàng)企業(yè)所發(fā)布的第一個正式版本模型就直接對標(biāo)了OpenAI閉源的GPT4o以及Claude3.5Sonnet,更重要的是其訓(xùn)練階段的成本只有不到600萬美元,是什么概念?在這之前,普遍的訓(xùn)練成本都在千萬甚至于上億美元的成本支出,突然出現(xiàn)預(yù)訓(xùn)練大模型在性能上比肩目前最強的GPT4o,成本上比GPT4o要節(jié)約十幾倍,關(guān)...
2025-05-29 06:12:20 594瀏覽 0點贊 0回復(fù) 0收藏
本來想寫在AI大模型中對于數(shù)據(jù)方面的挑戰(zhàn),但是發(fā)現(xiàn)還是要找一個場景來鋪墊一下,正好去年做過一些大模型知識庫的內(nèi)容,對于RAG方面還算了解一些,所以先來說一下關(guān)于大模型應(yīng)用方面的東西吧,下一篇再來聊聊AI大模型場景中對于數(shù)據(jù)管理方面的機會。先解釋一下什么是檢索增強生成技術(shù)(下文簡稱:RAG),對于日常我們所理解的大模型來說,他們具備的是模型本身能力(億級別參數(shù)+通用數(shù)據(jù)),但是在特定領(lǐng)域內(nèi)的數(shù)據(jù)可能是無法獲...
2025-05-15 00:25:29 1106瀏覽 0點贊 0回復(fù) 0收藏
在數(shù)據(jù)應(yīng)用場景中,數(shù)據(jù)源屬于數(shù)據(jù)管理是非常的一個環(huán)節(jié),包括數(shù)據(jù)源、數(shù)據(jù)集成、生命周期、數(shù)據(jù)地圖、數(shù)據(jù)標(biāo)注、數(shù)據(jù)安全、主數(shù)據(jù)等等等,數(shù)據(jù)管理也是整個數(shù)據(jù)治理體系中最核心的部分之一,面向智算領(lǐng)域的數(shù)據(jù)能力,對于AI數(shù)據(jù)治理會有一些新的挑戰(zhàn)。在過去數(shù)十年的大數(shù)據(jù)領(lǐng)域發(fā)展過程中,結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)處理都是其中絕對的主角,結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)由業(yè)務(wù)流程產(chǎn)生,與商業(yè)價值高度相關(guān),這些數(shù)據(jù)與企業(yè)的流程業(yè)...
2025-04-28 23:52:39 1293瀏覽 0點贊 0回復(fù) 0收藏
最近一直在做數(shù)據(jù)+AI方向的工作,前兩天無意中看到一個MCP的技術(shù),經(jīng)過詳細(xì)的學(xué)習(xí)之后,了解到這個可能不僅僅應(yīng)用在大模型,而更多是數(shù)據(jù)和模型之間的橋梁,最近就一直在考慮對于多模態(tài)數(shù)據(jù)如何才能實打?qū)嵉暮蛻?yīng)用模型結(jié)合起來的事情,MCP無疑是提供了某種思路,下面是關(guān)于MCP的一些介紹,部分內(nèi)容是參考的社區(qū)文檔。MCP(ModelContextProtocol)是一種開放協(xié)議,它標(biāo)準(zhǔn)化了應(yīng)用向設(shè)備提供上下文的方式。可以將MCP想象成AI應(yīng)用...
2025-04-18 06:53:54 1098瀏覽 0點贊 0回復(fù) 0收藏