成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

【Text2sql】低資源場(chǎng)景下Text2SQL方法

人工智能
SFT使模型能夠遵循輸入指令并根據(jù)預(yù)定義模板進(jìn)行思考和響應(yīng)。如上圖,、和是用于通知模型在推理過(guò)程中響應(yīng)角色的角色標(biāo)簽。后面的內(nèi)容表示模型需要遵循的指令,而后面的內(nèi)容傳達(dá)了當(dāng)前用戶對(duì)模型的需求。后面的內(nèi)容代表模型的預(yù)期輸出,也可以定義為模型預(yù)測(cè)的標(biāo)簽。


SFT的text2sql方法SFT的text2sql方法

SFT使模型能夠遵循輸入指令并根據(jù)預(yù)定義模板進(jìn)行思考和響應(yīng)。如上圖是用于通知模型在推理過(guò)程中響應(yīng)角色的角色標(biāo)簽。后面的內(nèi)容表示模型需要遵循的指令,而后面的內(nèi)容傳達(dá)了當(dāng)前用戶對(duì)模型的需求。后面的內(nèi)容代表模型的預(yù)期輸出,也可以定義為模型預(yù)測(cè)的標(biāo)簽。在監(jiān)督微調(diào)期間,模型根據(jù)和中的內(nèi)容預(yù)測(cè)后面的內(nèi)容,然后將其與標(biāo)簽進(jìn)行比較以計(jì)算損失函數(shù)。標(biāo)記作為結(jié)束標(biāo)記,以防止模型在后續(xù)推理階段偏離思路,從而減少推理時(shí)間。通過(guò)定義監(jiān)督微調(diào)模板,模型可以在推理時(shí)根據(jù)模板喚起微調(diào)知識(shí),用戶可以從預(yù)先建立的響應(yīng)模板中提取答案。

text2sql一些研究涵蓋兩個(gè)基本任務(wù):schema_linking和SQL生成。

  • Schema Linking: 主要目的是識(shí)別和提取與問(wèn)題相關(guān)的表,并通過(guò)分步推理和鏈?zhǔn)剿季S方法在有限內(nèi)存下處理大規(guī)模數(shù)據(jù)庫(kù)。
  • SQL 生成: 主要目的是根據(jù)模式鏈接任務(wù)的結(jié)果生成準(zhǔn)確的SQL查詢語(yǔ)句,同時(shí)通過(guò)減少輸入表的數(shù)量來(lái)降低內(nèi)存消耗。

方法

LR-SQL方法框架LR-SQL方法框架

提出了LR-SQL方法,解決低資源場(chǎng)景下的Text2SQL任務(wù),具體如下:

1.schema_link模型:首先,LR-SQL方法包含兩個(gè)監(jiān)督微調(diào)模型:schema_link模型和SQL生成模型。schema_link模型的主要作用是簡(jiǎn)化整個(gè)流程,通過(guò)將完整的數(shù)據(jù)庫(kù)分解為靈活的表組合,使模型能夠從這些分散的切片中學(xué)習(xí)數(shù)據(jù)庫(kù)內(nèi)關(guān)系。

2.數(shù)據(jù)分解:在schema_link模型的微調(diào)過(guò)程中,LR-SQL將數(shù)據(jù)庫(kù)分解為多個(gè)切片,每個(gè)切片具有可調(diào)節(jié)的表數(shù)量。這種方法允許模型根據(jù)GPU內(nèi)存限制靈活地覆蓋不同數(shù)量的表。

LR-SQL的監(jiān)督模板構(gòu)建LR-SQL的監(jiān)督模板構(gòu)建

圖片圖片

圖片

將數(shù)據(jù)庫(kù)中的表分解成多個(gè)片段,每個(gè)片段包含一定數(shù)量的表和其列的描述

3.思維鏈:為了增強(qiáng)模型在推理過(guò)程中感知各個(gè)離散切片之間關(guān)系的能力,LR-SQL訓(xùn)練了模型的鏈?zhǔn)剿季S能力。COT能力使模型能夠逐步引導(dǎo)自己生成最終結(jié)果。

LR-SQL訓(xùn)練LR-SQL訓(xùn)練

4.SQL生成模型:在schema_link模型微調(diào)完成后,預(yù)測(cè)的目標(biāo)表和問(wèn)題被發(fā)送到SQL生成模型以生成最終的SQL查詢。該模型僅使用包含目標(biāo)表的少量表進(jìn)行微調(diào),從而顯著減少了所需的內(nèi)存。

在推理階段,與訓(xùn)練相比,模型處理長(zhǎng)文本所需的內(nèi)存需求大幅減少。在推理階段,與訓(xùn)練相比,模型處理長(zhǎng)文本所需的內(nèi)存需求大幅減少。

實(shí)驗(yàn)

圖片schema_link模型評(píng)估:LR-SQL方法在兩個(gè)數(shù)據(jù)集上的總準(zhǔn)確率分別為91.38和94.38,過(guò)濾準(zhǔn)確率分別為94.26和97.19,平均精度分別為95.50和96.91,平均召回率分別為95.76和97.85。與現(xiàn)有方法相比,LR-SQL在保持較高準(zhǔn)確率的同時(shí),顯著減少了GPU內(nèi)存使用。圖片切片大小對(duì)性能的影響:實(shí)驗(yàn)還探討了不同切片大小對(duì)模型性能和GPU內(nèi)存使用的影響。結(jié)果表明,當(dāng)切片大小適中時(shí),模型的性能最佳。

參考文獻(xiàn)

  • LR-SQL: A Supervised Fine-Tuning Method for Text2SQL Tasks under Low-Resource Scenarios,https://arxiv.org/pdf/2410.11457
責(zé)任編輯:武曉燕 來(lái)源: 大模型自然語(yǔ)言處理
相關(guān)推薦

2025-03-07 09:00:00

2025-06-16 02:00:00

Text2SQL信貸風(fēng)控Coze

2025-04-21 04:10:00

2024-09-10 14:31:57

2025-02-24 09:04:20

2010-09-28 13:53:59

sql text字段

2011-08-29 15:40:00

SQL Server獲取TEXT字段的內(nèi)容DATALENGTH

2010-11-02 11:43:11

DB2動(dòng)態(tài)SQL

2019-11-22 09:21:17

技術(shù)研發(fā)數(shù)據(jù)

2010-07-19 10:08:56

SQL Server

2010-07-01 11:57:55

SQL Server日

2010-11-09 17:13:17

SQL Server中

2010-08-31 14:01:00

DB2SQL腳本

2013-05-29 00:28:24

Sublime Tex開(kāi)發(fā)工具開(kāi)發(fā)

2010-11-08 10:27:58

SQL Server檢

2010-04-09 12:20:11

Oracle SQL

2010-09-30 16:00:40

DB2動(dòng)態(tài)SQL

2022-10-27 10:32:09

Presto SQLJoin大數(shù)據(jù)

2010-09-06 15:13:05

DB2
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 免费视频99 | 亚洲h视频 | 天堂久久天堂综合色 | 国产精品免费一区二区 | 久久综合九色综合欧美狠狠 | 欧美综合国产精品久久丁香 | 青青草精品 | 国产欧美精品一区二区色综合朱莉 | 一区天堂 | 天天干天天干 | 久久青青 | 视频一区 国产精品 | 精品一区二区三区在线视频 | 日韩精品1区2区3区 国产精品国产成人国产三级 | 国产亚洲精品精品国产亚洲综合 | 成人妇女免费播放久久久 | 久久精品视频一区二区三区 | 91影院| 国产一区二区三区久久 | 一级黄色片美国 | 国产高清久久 | 91免费入口 | 亚洲一区二区精品视频 | 日韩成人在线一区 | 亚洲天堂中文字幕 | 天天干夜夜拍 | 一级毛片视频免费观看 | 欧美操操操 | av天天干| 秋霞在线一区二区 | www.天堂av.com | 在线国产一区二区 | 亚洲精品在线播放 | 色播久久| 性色av一区 | 成人国产午夜在线观看 | 国产91综合| 九色www | 91精品免费视频 | 日韩中文在线观看 | 神马久久久久久久久久 |