HK-O1aw团队 投稿
量子位 | 公众号 QbitAI
OpenAI o1风格的推理大模型,有行业垂直版了。
HK-O1aw,是由香港生成式人工智能研发中心(HKGAI)旗下AI for Reasoning团队(HKAIR) 联合北京大学对齐团队(PKU-Alignment Team)推出的全球首个慢思考范式法律推理大模型。
HK-O1aw的推理能力,在多个法律场景的测试中得到证明。该模型在合同法、消费者权益保护法等多个法律领域中均展现出色的表现,并能灵活适应各类法律咨询场景。
以下是HK-O1aw模型用户体验演示:
提问1:拿衣服去干洗后,干洗店弄坏了衣服,根据香港法例,可否向店铺索偿?应该以什么渠道索价?
在个案咨询场景中,针对“干洗店洗坏衣服”的情形,用户咨询HK-O1aw如何利用香港法例进行消费者维权。HK-O1aw通过“分析香港法律条例——分析索偿途径——小额钱债审裁处的适用性——民事法庭的诉讼程序”完整的逻辑链条进行思考。最终提供用户答案:可以进行索赔,首先建议直接联系店铺索赔,若无果则向消费者委员会投诉,或通过法律途径解决。
提问2:商业为什么需要调解和仲裁?
在法律知识解答场景中,针对用户提出“商业为什么需要调解和仲裁”,HK-O1aw的推理能力帮助它把问题进行拆分,按商业调解和商业仲裁的定义和功能、调解和仲裁各自的优点、适用性验证的思路进行深度思考,并给出最终答案。
推理能力的实现,进一步保障了大模型在法律场景下法律条例引用、事实判断、决策意见的准确性,分析角度的完备性,让大模型在法律服务中更加专业可靠。
像这样,一直以来都是耗时耗力且成本高昂法律纠纷处理,如今可以慢慢交给法律推理大模型来干了。
深度推理:HK-O1aw法律大模型的核心竞争力
早期市场上的法律大模型在深度推理能力上有所欠缺。
早期的法律大模型即便能够提供丰富的法律知识,但面对现实社会中的复杂法律纠纷,它们往往在关键逻辑上出现疏漏,最终难以解决法律场景下的实际问题。
HK-O1aw通过采用O1风格的数据集和训练设置,实现法律模型深度推理能力的跃升,这使得法律大模型能够深入分析复杂的法律文本和案例,提供逻辑缜密的法律意见,满足行业对深度分析和复杂问题解决的迫切需求。
O1风格是什么?
它指的是一种类似于OpenAI o1模型的长考能力,它侧重于慢思考(slow thinking)和链式推理(Chain of Thought, CoT)。在法律领域,O1风格专注于深入分析和推理,以应对法律文本和案例的复杂性。这种风格的模型技术难点主要体现在以下几个方面:
复杂性处理:法律文本常包含专业术语和复杂的逻辑结构,O1风格的模型必须能够进行深入的思考和推理。
长链推理:为了在复杂案件中进行全面分析和判断,O1风格的模型必须能够支持更长的推理链条。
准确性和可靠性:O1风格的模型必须确保模型在推理过程中的一致性和可靠性,以避免错误判断。
可解释性:O1风格的模型需要提供可解释的模型输出,以便法律专业人士理解和信任模型的结论。
想要训练出逻辑超强的模型,丰富并且高质量的数据集必不可少。
依托于经过严格清洗和预处理的法律材料,HKAIR团队为HK-O1aw构建了15959个包含“问题-思考-答案”的三元组,全部以简体中文呈现,并以结构化的JSON格式存储,并在Hugging Face平台上开源(详见文末链接)。这种设计旨在模拟法律专业人士的思考过程,增强法律大模型的深入分析能力。
数据集中的问题类型广泛,涵盖案例分析、法律应用和法律概念解释等多个方面,难度级别为中级到高级,对于法律专业人士和法学院学生来说具有挑战性。
HKGAI团队介绍
HKAIR Lab隶属于香港生成式人工智能研发中心(HKGAI)。HKAIR Lab 由香港科技大学首席副校长郭毅可教授和跨学科学院韩斯睿助理教授指导,成员主要由香港科技大学跨学科学院的博士研究生和研究员团队组成。HKAIR Lab 与北大对齐团队在 HK-O1aw 和“慢思考”范式下,就生成式人工智能如何赋能法律应用场景展开了合作。
为了把握未来机遇并应对挑战,HKAIR研究团队将持续对HK-O1aw进行优化。计划中包括引入法律领域专家参与模型的训练与评估,这将促进模型对法律概念的深入理解,提升其推理能力,并拓宽模型在多样化法律场景中的应用范围。
HK-O1aw模型开源资源链接:
模型地址:
https://huggingface.co/HKAIR-Lab/HK-O1aw
数据集地址:
https://huggingface.co/datasets/HKAIR-Lab/HK-O1aw-SFT-16K
代码地址:
https://github.com/HKAIR-Lab/HK-O1aw/