五分鐘,構建國產數據庫智能體
原創近期,圈里很多朋友,都嘗試利用 DeepSeek 構建自己的智能體。我也利用騰訊元器,將個人公眾號內容做了個智能體,可以實現簡單的問答。那么延展來看,智能體除了可利用公眾號內容,也可使用離線文件等方式來構建。這不禁讓我考慮,是否可用這樣方式構造一個數據庫智能體。說干就干,花了一個小時,構建一個國產庫的智能體,玩玩還不錯。這里也希望,我們國產數據庫的廠商,能更多專注這種新的內容分享方式,加快推進國產數據庫的普及。下面我就將構建步驟,分四步來說明下。
1. 什么是“騰訊元器”
在開始之前,我們先了解下什么是“騰訊元器”。騰訊元器(https://yuanqi.tencent.com),是騰訊混元大模型團隊推出的智能體創作工具,方便您通過添加提示詞設定、插件、知識庫等功能捏出自己喜歡的智能體。
你自己創建的智能體,可以發布出來供大家使用,也可以私有來使用。目前已經有大量定義好的智能體,方便大家來使用。我自己也定義了幾個智能體,大家也可以搜索使用。
2. 專有智能體構建
智能體的創建,可分為幾個步驟,全程可通過簡單填寫表單即可完成。后面大致說明下我的操作步驟。
(1)準備知識庫材料
目前元器創建智能體,支持多種構建知識庫的方式。如果是公眾號文章就比較簡單,開通授權即可;如果是問答對類型,則需要構建一個表格實現問答描述;最為通用則是文本類型,這里就需要準備一系列文檔。
目前支持的文本類型,包括PDF、WORD、TXT等,這里就需要將構建下這些文件。目前國內數據庫廠商大多提供了在線文檔的功能,這里通過自己寫的一個小爬蟲將文檔下載并轉儲成PDF。在實現上完全可以利用 DeepSeek 直接生成代碼,微調后即可使用。以達夢數據庫為例,官方文檔位于 https://eco.dameng.com/document/dm/zh-cn/pm,以此為基礎將其文檔都下載下來。
(2)創建知識庫
創建知識庫比較簡單,只需要將文件上傳即可。這里要注意,文檔上傳后需要有個處理過程,根據文檔數量及大小有關系,可耐心等待一會。其具體的進度,可以在知識庫列表頁面中查看到。
(3)創建智能體
有了知識庫后,就可以創建智能體。分為兩個部分,一是基礎是設定部分,這里主要是提示詞的部分,比較方便的是,元器提供了提示器的自動生成,稍加修改即可。
在高級設定部分,主要完成模型設置和知識庫配置即可。這里需注意選擇模型,可以有騰訊混元模型或DeepSeek的選擇,知識庫部分關聯到剛才創建的知識庫即可。
當然還有些更為復雜的配置,如可以調用插件和工作流。系統已內置了不少插件,可供使用;也預制了部分工作流的示例,可直接復制參考使用。
(4)發布智能體
最后一步,發布智能體即可。發布后,就可以通過多種方式使用。
3. 效果體驗及展望
針對構造的智能體,我們簡單體驗下效果:
從上面效果可見,智能體已經可以承擔一些簡單的問答類工作??梢苑奖阌脩簦焖偃チ私庖粋€產品;也能彌補只有官方文檔造成的入手慢、門檻高的問題。國產數據庫之前常常被人詬病的問題,就是文檔差、內容舊,問答智能體的出現可以在一定程度上解決這些問題。當然功能遠不限于此,如未來提供更為豐富的插件和工作流定義,完全可以開發更為復雜的功能。未來隨著智能體的發展,相信會有更多、更垂直的智能體出現,場景也不僅僅限于知識問答類的,例如針對信創場景下創建個“信創智能體”,依托于構建自各廠商產品的知識體,通過工作流分辨用戶需求,可實現包括產品選型、架構對比、設計開發、語句優化等常見問題的解決。