在当今数字化与智能化飞速发展的时代,法律服务行业正经历着前所未有的变革。随着AI技术的广泛应用,法律服务的模式和效率正在被重新定义。传统法律服务中依赖人工的繁琐流程逐渐被智能化工具所替代,法律从业者需要适应这一变化,掌握新的技术和工具以提升自身的竞争力。同时,数据作为法律服务的新要素,其合规管理和有效利用也成为行业发展的重要课题。
2025年2月23日,在“专业服务创新与发展论坛暨律新社2024年度标杆案例颁奖典礼”上,北京金诚同达(上海)律师事务所高级合伙人张云燕作“AI时代的法律实践和数据合规 跨法域法律大模型”主题演讲。她聚焦跨法域法律大模型与数据合规,带来了精彩的分享。张云燕律师的主题分享整理如下:
法律服务行业发展趋势
法律服务市场正在发生深刻的变化,头部律所凭借其强大的资源和品牌优势,市场份额不断扩大,强者恒强的趋势愈发明显。数据显示,中国法律服务市场规模从2017年的约1500亿元增长到2023年的2820.4亿元。然而,这种增长并非均衡分布,Top10律所的市场份额已达71.9%,行业内的竞争形势愈发激烈。大型律师事务所凭借优质客户资源和技术创新能力,正在加速数字化转型,而中小律师事务所则面临专业化和品牌化的挑战,竞争处于劣势。
区域竞争格局也呈现出不均衡的特点。律师事务所主要集中在一线城市和部分二线城市,存在明显的区域发展不均衡现象。同时,一些大型律师事务所开始向海外市场扩张,进一步加剧了市场竞争。未来,预计市场将出现大所兼并小所、大所与大所竞争的局面,律师事务所需要不断提升了解、管理和服务客户的能力,以适应新的竞争环境。
跨法域法律大模型的应用场景
在这样的背景下,跨法域法律大模型应运而生。该模型以多模态模型的算力和算法为基础,结合公域数据和代表性私域数据(如学院、大型律所和法律传媒机构的数据),通过专业人员训练生成不同法域的法律问答、文书生成和检索尽调的产品。模型采用区块链技术进行标识和存储,确保信息安全和数据治理合规。
跨法域法律大模型的核心功能包括检索、文书生成、问答、电子存储、分类分析管理、预判和检验、行业信息分析和推荐等。
跨法域法律大模型的商业模式涵盖功能型产品、平台撮合和赋能机构等多个层面。To B端,律所可以利用内部积累的合同文书等保密数据定制专用的法律大模型,替代中低年级律师进行基础法律咨询服务,同时协助律师办案和处理文本。AI律师助理及数字人律师的开发则将律师从低效能且对其专业助益较少的工作中解放出来,颠覆了律所的传统宣传模式。跨法域法律大模型还提供了法律文档管理平台,解决律所文档电子化管理缺失的问题,通过智能化采集、检测文档完整性和合规性、加密上链保存等技术手段,确保文档的安全性和合规性。To C端,公共法律服务及法律撮合平台则针对民众在线咨询法律问题后难以找到合适律师的痛点,结合法律咨询平台与律师选择平台,为民众提供便利可靠的法律服务。
核心优势:五大核心竞争力
跨法域法律大模型具备五大核心竞争力:丰富的公私域语料、专业的法律团队、法律科技研发基础、区块链与人工智能专业背景以及全球视野的跨法域大模型。
自2015年起,张云燕数字资产法律服务团队就开始法律科技产品的研发,推动司法业务与人工智能、大数据等现代科技手段的深度融合。张云燕数字资产法律服务团队专注于Metaverse、区块链、Web3.0、加密货币等领域的法律服务,为国家级版权交易保护联盟链提供合规咨询并参与平台共建,成为行业的先驱和领导者。核心技术团队成员及合作伙伴拥有多年区块链及人工智能领域的开发落地经验,掌握领先的算法、巨大的算力及人工智能前沿技术。
全球视野的跨法域法律大模型项目符合市场需求,商业化可行性大,同时可提升内地和香港两地民众的法律意识和获取法律服务的便利度,促进法律行业的效能提升,并且促进两地经贸更加高效有序的合作发展。项目定位以中国内地和香港两地的法律法规、文本、案例等数据和专家经验训练法律大模型,支持普通话、粤语和英语的语音识别、转写、翻译、文本输入及文本生成,可同时为两地的市民、企业、律师、律所及司法和仲裁机构提供智能化法律服务。
跨法域法律大模型的应用和意义
跨法域法律大模型不仅能提高法律服务效率,辅助律师和法律从业者处理大量的法律文档、进行法律检索和分析,从而提高法律服务的效率,降低法律服务成本,还能够促进法律普及,为公众提供便捷的法律咨询服务,帮助企业和个人更好地理解和遵守法律,减少法律纠纷和风险。
此外,该模型还能提升司法系统效率,辅助司法系统进行案件审理、法律文件处理和法律分析,提升司法系统的效率和公正性。对于创新与创业企业而言,跨法域法律大模型提供了更便捷和高效的法律支持,助力企业顺利开展业务,促进经济活力和创新发展。
在投资决策咨询方面,使用双法系大模型可以大幅降低跨法域法律咨询的成本并提高效率,从而促进内地和香港的经贸合作,促进沪港经济联通,实现对外开放的高质量新发展。
数据合规
数据合规是法律大模型不可或缺的重要组成部分。法律模型的生成内容源于数据,数据合规面临的问题至关重要。目前,我国已初步建立数据合规的法律框架与监管体系,其中《网络安全法》《数据安全法》《个人信息保护法》构成我国数据合规的核心法律框架,为企业数据处理提供基本遵循。相关配套法规如《民法典》《密码法》《电子商务法》等丰富完善了数据合规的法律体系。金融、医疗等行业有自身数据合规的特殊要求,如《中国人民银行金融消费者权益保护实施办法》规范金融数据保护。这些行业规定针对特定领域的数据特点,提出更细致严格的合规标准,确保行业数据安全。
监管体系方面,网信办、工信部、公安部、市场监督管理局等多部门共同参与数据监管,各司其职又相互协作。数据监管常以专项活动形式开展,如“App违法违规收集使用个人信息专项治理”等,这种执法方式集中力量解决突出问题,但时间不确定、执法从严从重,对企业合规提出更高要求。随着数据跨境流动增加,我国对数据出境实施严格监管和审查,要求进行安全评估,维护国家安全,防止数据泄露等风险,保障我国数据主权和利益。
数据产权的三权分置是数据合规的重要内容。2022年12月,党中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》,提出“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”,即数据三权分置方案。申卫星教授提出,在数据所有权和数据用益权分离的基础上,以数据用益权为基础性权利,将数据资源持有权、数据加工使用权、数据产品经营权的“三权分置”方案纳入数据所有权与用益权分离的理论框架中,形成从“两权分离”到“三权分置”的确权思路。如果数据产品的创造性达到知识产权的保护门槛,也可以适用知识产权法保护路径,数据产品开发者对其创造的数据产品享有所有权。赋予数据来源者一定程度的数据所有权,将会极大激励来源者创造数据的积极性,从而使得未来的数字经济迸发出持久发展的活力。
各模型目前训练过程中存在的普遍数据质量问题包括数据来源合法性和数据质量与真实性等方面问题。开源数据集虽来源广泛,但可能存在数据质量参差不齐、数据权属不明等问题。网页爬取数据涉及合理使用边界问题,过度爬取或未经授权爬取他人网页数据可能构成侵权。第三方商业数据虽经过加工,但其合法性和质量仍需审查,可能存在数据造假或授权不完整情况。训练数据的准确性直接影响大模型的输出结果,若数据存在错误或偏差,可能导致模型生成错误内容。数据来源单一或类型单一,可能导致模型生成内容缺乏多样性,无法满足不同场景需求。部分数据可能因时间过长而失去时效性,导致模型生成内容与现实情况脱节。
数据安全与隐私保护同样重要。大模型训练数据量大,存储系统易成为黑客攻击目标,一旦遭受攻击,可能导致数据泄露。内部人员权限管理混乱,可能使未经授权的人员访问或篡改数据,导致数据泄露或滥用。此外,训练数据中可能包含大量个人信息,若未妥善处理,可能侵犯个人隐私。
↓扫码观看演讲视频↓
