全球首個法律o1大模型發布,System2范式下慢思考法律專家|港科大&北大
OpenAI o1風格的推理大模型,有行業垂直版了。
HK-O1aw,是由香港生成式人工智能研發中心(HKGAI)旗下AI for Reasoning團隊(HKAIR) 聯合北京大學對齊團隊(PKU-Alignment Team)推出的全球首個慢思考范式法律推理大模型。
HK-O1aw的推理能力,在多個法律場景的測試中得到證明。該模型在合同法、消費者權益保護法等多個法律領域中均展現出色的表現,并能靈活適應各類法律咨詢場景。
以下是HK-O1aw模型用戶體驗演示:
提問1:拿衣服去干洗后,干洗店弄壞了衣服,根據香港法例,可否向店鋪索償?應該以什么渠道索價?
在個案咨詢場景中,針對“干洗店洗壞衣服”的情形,用戶咨詢HK-O1aw如何利用香港法例進行消費者維權。HK-O1aw通過“分析香港法律條例——分析索償途徑——小額錢債審裁處的適用性——民事法庭的訴訟程序”完整的邏輯鏈條進行思考。最終提供用戶答案:可以進行索賠,首先建議直接聯系店鋪索賠,若無果則向消費者委員會投訴,或通過法律途徑解決。
提問2:商業為什么需要調解和仲裁?
在法律知識解答場景中,針對用戶提出“商業為什么需要調解和仲裁”,HK-O1aw的推理能力幫助它把問題進行拆分,按商業調解和商業仲裁的定義和功能、調解和仲裁各自的優點、適用性驗證的思路進行深度思考,并給出最終答案。
推理能力的實現,進一步保障了大模型在法律場景下法律條例引用、事實判斷、決策意見的準確性,分析角度的完備性,讓大模型在法律服務中更加專業可靠。
像這樣,一直以來都是耗時耗力且成本高昂法律糾紛處理,如今可以慢慢交給法律推理大模型來干了。
深度推理:HK-O1aw法律大模型的核心競爭力
早期市場上的法律大模型在深度推理能力上有所欠缺。
早期的法律大模型即便能夠提供豐富的法律知識,但面對現實社會中的復雜法律糾紛,它們往往在關鍵邏輯上出現疏漏,最終難以解決法律場景下的實際問題。
HK-O1aw通過采用O1風格的數據集和訓練設置,實現法律模型深度推理能力的躍升,這使得法律大模型能夠深入分析復雜的法律文本和案例,提供邏輯縝密的法律意見,滿足行業對深度分析和復雜問題解決的迫切需求。
O1風格是什么?
它指的是一種類似于OpenAI o1模型的長考能力,它側重于慢思考(slow thinking)和鏈式推理(Chain of Thought, CoT)。在法律領域,O1風格專注于深入分析和推理,以應對法律文本和案例的復雜性。這種風格的模型技術難點主要體現在以下幾個方面:
- 復雜性處理:法律文本常包含專業術語和復雜的邏輯結構,O1風格的模型必須能夠進行深入的思考和推理。
- 長鏈推理:為了在復雜案件中進行全面分析和判斷,O1風格的模型必須能夠支持更長的推理鏈條。
- 準確性和可靠性:O1風格的模型必須確保模型在推理過程中的一致性和可靠性,以避免錯誤判斷。
- 可解釋性:O1風格的模型需要提供可解釋的模型輸出,以便法律專業人士理解和信任模型的結論。
想要訓練出邏輯超強的模型,豐富并且高質量的數據集必不可少。
依托于經過嚴格清洗和預處理的法律材料,HKAIR團隊為HK-O1aw構建了15959個包含“問題-思考-答案”的三元組,全部以簡體中文呈現,并以結構化的JSON格式存儲,并在Hugging Face平臺上開源(詳見文末鏈接)。這種設計旨在模擬法律專業人士的思考過程,增強法律大模型的深入分析能力。
數據集中的問題類型廣泛,涵蓋案例分析、法律應用和法律概念解釋等多個方面,難度級別為中級到高級,對于法律專業人士和法學院學生來說具有挑戰性。
HKGAI團隊介紹
HKAIR Lab隸屬于香港生成式人工智能研發中心(HKGAI)。HKAIR Lab 由香港科技大學首席副校長郭毅可教授和跨學科學院韓斯睿助理教授指導,成員主要由香港科技大學跨學科學院的博士研究生和研究員團隊組成。HKAIR Lab 與北大對齊團隊在 HK-O1aw 和“慢思考”范式下,就生成式人工智能如何賦能法律應用場景展開了合作。
為了把握未來機遇并應對挑戰,HKAIR研究團隊將持續對HK-O1aw進行優化。計劃中包括引入法律領域專家參與模型的訓練與評估,這將促進模型對法律概念的深入理解,提升其推理能力,并拓寬模型在多樣化法律場景中的應用范圍。
HK-O1aw模型開源資源鏈接:
模型地址:https://huggingface.co/HKAIR-Lab/HK-O1aw。
數據集地址:https://huggingface.co/datasets/HKAIR-Lab/HK-O1aw-SFT-16K。
代碼地址:https://github.com/HKAIR-Lab/HK-O1aw/。