史鹏：万象法律大模型的构建与应用探索丨第八届新兴法论坛经典演讲

律新社编者按

随着人工智能和数字技术的不断进步，法律服务行业正在经历一场历史性的变革，法律科技的快速发展和广泛应用为整个法律行业带来了前所未有的机遇和挑战。技术的广泛应用、先进理念的深入整合以及创新模式的持续探索，共同推动了法律服务向智能化和精细化方向发展。华宇元典作为万象法律大模型的构建与应用探索的先行者，为法律从业者和法律服务行业带来了强大的赋能。

2024年4月27日，“乘势·破局第八届新兴法律服务业高峰论坛”召开，华宇元典副总经理史鹏作“万象法律大模型的构建与应用探索”主旨演讲。他从目前法律大模型发展过程中遇到的问题出发，详细介绍了华宇元典的解决策略，并通过对各类创新的应用场景的展示，深入探讨了如何通过技术提升法律工作的质量和效率，凸显了法律大模型在实际法律服务中的巨大潜力。史鹏的主题分享整理如下：

part 01

法律大模型面临的挑战

目前，法律大模型在发展中遇到了多个亟需解决的问题。

首先，大模型与行业应用需求之间存在显著的知识鸿沟。鉴于法律领域的知识复杂性，大模型完全掌握相关法律知识具有极大的挑战性。

其次，保障客户数据安全至关重要，特别是在处理政法机关的内部数据、企业的商业数据以及个人隐私数据等敏感信息时，显然不能直接公开于互联网供大模型调用。

最后，直接面向专业领域提供服务时存在可信风险。若大模型直接回答当事人的咨询，可能会引发误导；因此，确保服务的可信度是亟待解决的问题。

为了深入研究大模型在法律场景下的具体问题，并为后续选择合适的基础模型及提升法律服务能力提供依据，华宇元典与清华大学、北京大学等机构合作，共同构建了一个针对法律场景下大模型的评测体系。该体系涵盖了安全性及四项核心能力，旨在全面评估并优化大模型在法律领域的应用效能。

在构建法律大模型评测体系的过程中，华宇元典着重考虑了四个核心能力——理解、记忆、推理和生成，模拟了法律专业人士在处理法律任务时的思维过程。同时，安全是法律领域极为关键的一环，如果缺乏安全性，法律大模型的能力将无法得到有效应用。因此，华宇元典采用了一个包含安全性在内的三元架构评测体系，对市场上主流的通用大模型进行了在法律场景下的应用评估。结果显示，尽管各个模型在不同能力上各有所长，但总体而言，它们很难完全满足法律场景的需求。

part 02

技术探索与实践应用的交响

为了更好地将大模型的能力整合到法律场景中，并提升其在该场景下的应用能力，华宇元典进行了一系列的选择和尝试，其中主要包含三个关键技术：

1. 检索增强技术（RAG）：利用这项技术可以扩展大模型的能力边界，增强其在法律领域的应用。

2. 构建知识库：通过构建包含互联网知识和客户私有化数据的知识库，并以外挂知识库的形式，进一步拓展大模型的知识边界。

3. Prompt指令工程：拓展大模型的应用边界，使其更好地理解法律场景和意图，更有效地完成特定的法律任务。

基于这些关键技术，华宇元典通过不断地实践，落地了法律大模型构建和应用的路径，大致分为以下四个步骤：

1. 研究通用大模型：对市面上的通用大模型进行评估。

2. 法律数据精调训练：利用掌握的法律数据对模型进行精调训练，以适应法律领域的特定需求。

3. 知识增强：结合检索增强技术和知识库，利用数据融合、法律图谱知识向量化等能力，进一步增强大模型的法律领域应用能力。

4. 应用能力研发：将上述能力应用于法律场景，开发出服务于法官、律师等法律专业人士的智能化产品。

part 03

探索具体应用场景，为法律服务赋能

万象大模型的八大核心能力包括法律问题理解、法律知识增强、法律要素解析、法律文本生成、法律知识推理、法律材料分析、法律内容归纳、模型合规管制等。利用这些能力，华宇元典目前在七个行业，包括法院、检察院、公安及企业等，研发了超过30个应用场景。

应用场景一：万象数字助理

该工具旨在为法官提供伴随式办案辅助，例如辅助法官在审理二审案件时，更好地理解一审案件的事实和争议焦点。它具备了阅读裁判文书的能力，并能够概括和总结判决书中的主要内容，以表格化的形式列举文书中的当事人信息，生成案情事实的摘要。即使面对数十页的文书或大量裁判文书，万象数字助理也能进行深入的阅读和分析，从而辅助法官处理案件。

应用场景二：万象卷系统

该系统能够对卷宗材料进行整体分析，自动生成阅卷笔录和阅卷分析报告。这一过程不仅提升了案件处理的效率，而且增强了整个案件处理流程的连贯性和全面性。

应用场景三：庭审笔录修正服务

当前，法庭内广泛采用的语音转写技术在生成笔录时，常会遇到语气词、重复词以及内容不连贯等问题。该工具正在尝试利用大模型的能力提供文字修正服务，包括纠正错别字、补充标点、去除无意义的语气助词和重复内容，并根据结构化数据对笔录进行补充和改写。

应用场景四：万象文书

尽管使用大模型辅助生成完整的裁判文书较为困难，但是可以辅助法官生成裁判文书中的关键段落。例如，可以根据庭审笔录中原告和被告的主张自动归纳争议点。

应用场景五：万象公文

结合大模型的能力，华宇构建了一个包含百万量级文档的知识库，辅助用户编写、扩写和续写公文。在法律大模型的应用场景中，除了为法院和检察院提供服务外，华宇元典还针对企业提供了一系列智能化的法律服务工具。

应用场景六：企业合同智能起草与审查

该工具支持企业业务人员自主上传合同模板，并通过对话形式实现合同内容的生成和修改。此外，该工具还能审视合同的交易概要，识别合同中的关键履约要素，并提示可能存在的风险点，从而帮助企业在合同制定阶段进行风险控制。

应用场景七：企业合规智能化管理

该工具能够智能化地从合规义务清单、合规风险识别清单、内部规章制度等文本内容中提取相关的法规条文和内部规章，并构建一个全面的内外规全景图；有助于企业法务部门更有效地管理内部制度，并实现数据的动态更新，以适应不断变化的合规要求。

应用场景八：元典问达

最近，华宇元典正积极邀请法律专业人士体验其测试阶段的新产品——元典问达。与以往传统的法律检索产品相比，华宇元典的核心目标是利用大模型的能力和检索增强技术，通过理解问题直接总结答案；并且希望提供的答案不仅准确，而且所依赖的知识是完整、可信的，并且可以查证。

华宇元典始终秉持开放合作的理念，积极寻求与政法机关、律所、高校、企业等合作伙伴的合作，深入探索法律人工智能场景的应用，共同推动法律大模型的发展，创造更多创新的法律服务场景。

↓欢迎添加客服微信进一步交流↓

相关阅读

● 八仙过海，百家争鸣！百余法律科技创新者论道AI乘势与破局丨第八届新兴法律服务业高峰论坛盛大举行

● 10+细分赛道，近百家创新机构全解读！律新社《新兴法律服务业精品指南（2023中国市场）》正式发布

● 趁势东风！全景式剖析AI浪潮下新兴法律服务业变革丨律新社《新兴法律服务业发展报告（2023）》正式发布

● 持续创新彰显典范！2023年度律新社新兴法律服务业7大奖项隆重发布

● 孙常龙：大模型时代的法律服务探索丨第八届新兴法论坛经典演讲

END

长按识别二维码