DeepSeek搭建個(gè)人知識(shí)庫教程,你學(xué)會(huì)了嗎?
各位朋友,是不是經(jīng)常被 AI 氣得火冒三丈,恨不得把鍵盤給砸了?你讓它查公司去年的財(cái)務(wù)數(shù)據(jù),它卻開始背誦經(jīng)濟(jì)學(xué)原理;你讓它分析競(jìng)品的策略,它卻大談特談馬斯洛需求理論。我太能理解這種感受了,這就好比你花錢雇了個(gè)助理,結(jié)果這助理啥都不會(huì),只會(huì)照搬百度百科的內(nèi)容!
不過,今天我要給大家分享一個(gè)超實(shí)用的技巧:利用 DeepSeek 創(chuàng)建專屬的 AI 知識(shí)庫!我自己已經(jīng)開始使用這個(gè)方法了,效果簡(jiǎn)直出乎意料地好。它不僅讓 AI 變得超可靠,還從根本上消除了商業(yè)機(jī)密泄露的風(fēng)險(xiǎn)。
其實(shí),在 AI 出現(xiàn)之前,私有知識(shí)庫就已經(jīng)在很多場(chǎng)景中發(fā)揮了巨大作用,比如企業(yè)內(nèi)部知識(shí)管理、個(gè)人知識(shí)儲(chǔ)備等。而當(dāng)它與出色的 DeepSeek 相結(jié)合后,知識(shí)檢索和歸納的效率簡(jiǎn)直提升到了一個(gè)新的高度。
小白快速搭建個(gè)人 AI 知識(shí)庫
個(gè)人 AI 知識(shí)庫的方案多種多樣,今天我來介紹一種既簡(jiǎn)單又高效的方法,特別適合新手。這種方法結(jié)合了 AnythingLLM 和 DeepSeek R1,不僅操作簡(jiǎn)單,而且知識(shí)檢索效果出色。
工具簡(jiǎn)介
- AnythingLLM:這是一個(gè)知識(shí)庫管理的前端工具,提供從上傳知識(shí)、向量化數(shù)據(jù)到檢索增強(qiáng)生成(RAG)的全流程服務(wù)。它完全開源且免費(fèi),非常適合個(gè)人用戶。
- DeepSeek R1:這是幻方量化推出的大模型,性能與 Claude 3.5 相當(dāng),但 Token 成本極低。在本次方案中,我們將使用 DeepSeek R1 作為推理模型。
注意事項(xiàng)
- 模型選擇:雖然我們推薦使用 DeepSeek R1,但 AnythingLLM 也支持其他推理模型,如 GPT、Claude,或者通過 Ollama 運(yùn)行本地開源模型等。你可以根據(jù)自己的需求選擇合適的模型。
通過這種組合,你可以輕松搭建一個(gè)高效、低成本的個(gè)人 AI 知識(shí)庫,無論是學(xué)習(xí)、工作還是研究,都能大大提高你的效率。希望這個(gè)方案對(duì)你有所幫助!
安裝 AnythingLLM
下載 AnythingLLM
地址:https://anythingllm.com/
AnythingLLM 是一個(gè)開源且免費(fèi)的工具,采用 MIT 許可證,支持文本和多模態(tài)大語言模型(LLM)在同一界面中使用。它能夠輕松處理圖像和音頻。
該工具也適合用作強(qiáng)大的 API,便于任何自定義開發(fā)或現(xiàn)有產(chǎn)品的功能擴(kuò)展。AnythingLLM 擁有不斷增長(zhǎng)的插件和集成生態(tài)系統(tǒng),可以增強(qiáng)其在應(yīng)用和組織中的功能。
設(shè)計(jì)上,AnythingLLM 默認(rèn)是私密的,所有數(shù)據(jù)都存儲(chǔ)并在運(yùn)行該工具的本地機(jī)器上處理。用戶可以輕松下載并運(yùn)行 LLM,無需額外的設(shè)置或程序。
AnythingLLM Desktop 并不是 SaaS 服務(wù),用戶無需注冊(cè)即可在本地使用完整的工具套件。
此外,AnythingLLM 可以根據(jù)公司的品牌進(jìn)行白標(biāo)定制,并支持多個(gè)用戶在同一服務(wù)器上使用,確保用戶之間的完全隔離。管理員可以細(xì)致控制用戶的權(quán)限和可見內(nèi)容。
支持系統(tǒng):Windows、Mac、Linux
圖片
圖片
圖片
配置 AI 大腦(如何使用 DeepSeekAPI 或者本地搭建 DeepSeek)
設(shè)置你的 AI 助手:DeepSeek
打開軟件后,首先需要配置 LLM(大型語言模型)。這里推薦選擇 DeepSeek 作為你的模型,具體選擇“chat”選項(xiàng),這是目前最新的模型版本。為了使用 DeepSeek 的服務(wù),你需要一個(gè) API Key。你可以通過訪問 DeepSeek 的官網(wǎng)
https://platform.deepseek.com
注冊(cè)賬號(hào)并獲取 API Key。注冊(cè)過程簡(jiǎn)單,充值少量費(fèi)用(幾塊錢)即可開始使用,非常經(jīng)濟(jì)實(shí)惠。
圖片
您可能會(huì)遇到這樣的提示:“目前我們正在進(jìn)行網(wǎng)站的維護(hù)與升級(jí)工作,網(wǎng)站暫時(shí)無法正常使用。我們正在全力推進(jìn)相關(guān)工作,爭(zhēng)取盡快恢復(fù)服務(wù)。感謝您在此期間的理解與耐心等待?!?/span>
如果官網(wǎng)的 API 暫時(shí)無法使用,您可以考慮使用本地部署版本的 DeepSeek。關(guān)于如何進(jìn)行本地部署,可以參考文檔,
本地部署 DeepSeek:打造你的專屬 AI 推理環(huán)境,簡(jiǎn)單明了適合新手
進(jìn)入工作區(qū)
可以在左下角設(shè)置按鈕中進(jìn)行基礎(chǔ)配置,如:LLM、嵌入模型、向量數(shù)據(jù)庫選擇等,新手可以先保持默認(rèn)設(shè)置。
(這里單獨(dú)提下 Embedding 模型,Embedding 是將高緯度數(shù)據(jù)嵌入低緯度空間方便存儲(chǔ),模型性能影響對(duì)后續(xù)知識(shí)
檢索有挺大影響,建議可以換成 bge-m3,這個(gè)模型對(duì)多語言和長(zhǎng)文本都支持的不錯(cuò),需要本地運(yùn)行 0llama 加載這
個(gè)模,由于需要安裝 0llama,新手可以跳過這一步)
圖片
上傳文檔
- 點(diǎn)擊工作空間的上傳按鈕,
圖片
- 支持上傳 PDF、CSV、音頻或者抓取網(wǎng)頁內(nèi)容等等。上傳后右鍵加入工作空間就 ok 了。
圖片
一定要點(diǎn)擊 save 按鈕,不然不會(huì)生效。
圖片
- 可以在 Data Connnector 中獲取 youtube(需要有 cc 字幕)視頻、confluence 文檔庫等內(nèi)容平臺(tái)的數(shù)據(jù)。
圖片
知識(shí)檢索問答
- 工作區(qū)點(diǎn)擊 new thread 可以開啟新的對(duì)話,然后提問就 ok 了
圖片
- 如果想判斷 LLM 回答的知識(shí)范圍,可以在回答的底部點(diǎn)開:Show Citations 就能看到引用了哪些知識(shí)
AnythingLLM 是一個(gè)很強(qiáng)大的知識(shí)庫管理工具,新版本還提供了 Agent 模式,可以接入谷歌、bing 等搜索引擎,實(shí)現(xiàn)實(shí)時(shí)搜索增加檢索的時(shí)效性。