法律行业的AI革命:Harvey如何提升效率与精确度

在数字化浪潮的推动下,人工智能正以其独特的方式重塑着传统行业的未来,生成式大语言模型(以下简称“LLM”)已经成为推动行业创新的关键力量。

这些模型以其卓越的语言理解与生成能力,正在重新定义信息处理的边界。特别是在法律领域,一个曾经高度依赖人工分析和文档处理的行业,AI技术的介入正在引发一场革命。

生成式AI的应用已经从理论走向实践,它们能够分析庞大的法律文档,生成合同文本,甚至提供复杂的法律咨询,极大地提高了工作效率和准确性。

图片

在这样的技术革新浪潮中,Harvey公司以其基于OpenAI GPT-4模型构建的法律AI产品,以其前沿的法律科技解决方案,迅速崭露头角,成为行业的领跑者。

Harvey公司不仅代表了生成式AI在法律服务领域的应用前沿,更是这一技术商业化的典范。它通过结合深度的法律专业知识与先进的AI技术,为法律行业带来了革命性的变化。
成立背景

在法律行业这个与大模型能力天然适配的领域,作为一个典型的 text-in/text-out 的场景,法律行业的数据以文本为主,并且多为绝对事实和真实案件,很适合大模型学习。同时,法律工作的强知识性和逻辑性,也适合作为大模型的训练数据。

使用 AI 来为法律行业降本增效的探索一直在持续,主要原因是培养、雇佣律师的成本都非常高。

图片

LLM 出现前的法律 AI (以 NLP 为主)主要运用于合同管理、诉讼预测、法律研究等领域,其中最为成功的 DocuSign 主要是电子签名领域。而国内主要是北大法宝、裁判文书网等,主要用于案例检索。

LLM 对于法律 AI 软件能力有两方面的提升:


  • LLM 可以用对话式的搜索方式,并且可以对数据内容进行总结提炼,以答案式回答细节问题。


  • 从“提取”到 “生成”,生成能力可以应用于起草法律合同、为法官提供判决建议等。

Harvey正是在这样的背景下催生而成立的一家公司,其是由 OpenAI 创业基金首批投资的项目之一,基于 OpenAI 和 ChatGPT 技术构建,使用自然语言处理、机器学习和数据分析来自动化和增强法律工作的各个方面。

Harvey的主要方式是 To Lawyer,即以大型律师事务所作为目标客户,为律师事务所及其客户打造个性化定制的 LLM 工具,切入法律行业高价值、高壁垒的工作流。

图片

Harvey 可以提高律师的效率,使他们能够完成更高质量的工作,并将更多时间花在工作中高价值的部分上。

Harvey 为所有法律工作流程提供了统一而直观的界面,使律师能够用简单的英语描述任务,而不是使用一套复杂而专业的工具来完成小众任务。

而在今年的福布斯AI 50强中,仅有一家法律领域AI公司入选,那就是Harvey。

这家成立于 2022 年的初创公司迄今已获得超过 1 亿美元的资金,其客户包括普华永道这样的顶级会计师事务所和 A&O Shearman这样的顶级律所。
团队构成与专业背景

2022 年 11 月,Harvey 成立了一支包括两位创始人在内的五人团队。

Harvey 的创始人是Winston Weinberg和Gabriel Pereyra,Weinberg曾是证券和反垄断诉讼律师,而Pereyra是AI领域研究科学家。

图片

俩人曾是室友,Pereyra向Weinberg展示了AI模型成果,Weinberg开始将AI技术应用于法律工作,最终两人决定创办Harvey。

截至 2024 年 5 月,Harvey 现在拥有约 120 名员工,其中许多人被聘为领域专家,围绕特定法律任务构建定制的工作流程和流程。

Harvey AI组建了一支经验丰富的法律和技术专家团队,约30%的成员有法律背景,为法律行业打造公司基于人工智能的平台。

(1)Winston Weinberg——联合创始人兼首席执行官

Winston Weinberg是Harvey的联合创始人人兼首席执行官。在创办 Harvey 之前,Weinberg 曾就职于知名律师事务所 O'Melveny & Myers担任合伙人,专攻反垄断和证券诉讼。在法律领域的从业经验让他对律师和律师事务所面临的挑战和痛点有着深刻的洞察。

图片

Weinberg 对 Harvey 的愿景是利用人工智能来自动化耗时的任务、增强文档分析并为律师提供有价值的见解,从而改变法律服务的提供方式。通过解放律师的时间,Weinberg 相信 Harvey 可以让他们专注于更有价值的工作,并为客户提供更好的结果。

(2)Gabriel Pereyra——联合创始人兼总裁

Gabriel Pereyra是Harvey的联合创始人兼总裁。他在人工智能研究方面拥有深厚的背景,曾在 Meta、DeepMind 和 Google 等公司工作过。他拥有南加州大学计算机科学学士学位,并曾在牛津大学攻读神经科学博士学位,全额由 DeepMind 资助。

在 Harvey ,Pereyra负责监督公司的技术愿景和战略。Pereyra 热衷于利用 AI 来增强人类能力并改变行业。他认为,通过自动化某些法律工作流程,Harvey AI 可以帮助律师提高工作效率,专注于真正为客户带来利益的更高价值的工作。
主要服务

和大部分AI公司不同,Harvey产品未向外部展示,采用隐身策略,该产品仍处于早期试用阶段。

除了部分早期试用客户外,很少有人见过 Harvey 产品。Harvey的创始人Winston Weinber和Gabriel Pereyra也很少接受媒体采访。

采用这种异常的隐身策略主要与Harvey的业务模式有关,Harvey主要为其服务的大型律师事务所建立高度定制的模型。AI 模型的定制一直是 Harvey 的标志,也是与其他流行法律 AI 产品的关键区别。

不过,目前Harvey 正在从专注于为大型律师事务所提供高度定制的 AI 模型转向开发更具商业可行性的产品。最近在Microsoft Azure 市场上推出了其产品,并在 Azure 上提供其产品的 Harvey 版本。

图片

(1)主要功能

Harvey提供的模型主要功能包括:AI 助理、法律研究、工作流程自动化、合同分析、公司简介、问题列表等等。

  • AI 助理:Harvey 可以通过自然语言指令帮助起草、分析、回答问题等处理任何类型的法律文件。Harvey 生成的每个回应均包含指向其来源的内嵌引用链接,可以针对50+份文档提出复杂的问题。
  • 法律研究:用户可以从Harvey获取法律、监管和税务等多个领域的复杂研究问题的答案。所有答案均基于原始资料,并引用了最相关的部分。
  • 工作流程自动化:Harvey 协调了数百个高度专业化的模型,以完成超出单个 LLM 范围的完整工作流程,类似于律师在复杂问题上共同合作的方式。
  • 合同分析:Harvey可以一次性将数千个文档转换为结构化数据进行分析。
  • 公司简介:Harvey可以整理以 10-K、10-Q、8-K 等要求为基础的详细公司简介。
  • 问题列表:Harvey可以根据选定的关键主题或常见问题立即起草自定义问题列表。

图片

(2)定制法律AI模型

针对大型律师事务所的定制AI模型,Harvey采用构建平台的模式,允许公司在所有私人数据上安全地训练生成式人工智能系统,与其现有的法律技术软件和工作流程相结合,并不断向其法律人员学习。

Harvey让律师事务所能够训练、评估和部署尊重数据隐私、道德墙和客户隐私的生成式人工智能系统,同时仍然保持高度准确性和性能。

Harvey为合作伙伴最复杂的用例构建“超专业化”系统。例如,与普华永道合作,Harvey在每个税收管辖区建立基础模型,这些模型可以回答有关税法和立法的复杂税务问题,以及进行税务尽职调查和更复杂的基于情景的评估。

该系统融入了普华永道更广泛的税务实践,模型利用普华永道的其他第三方供应商的知识产权和内部软件解决方案,并可以历史格式生成报告。”

(3)判例模型

为了从定制模型走向商业化模型,Harvey也进行了判例模型的研究,Harvey团队先使用了常见的技术手段——通过 API 微调基础模型并构建检索增强生成 (RAG) 系统,但发现这样只能解决简单的问题,对大多数律师没有价值。

图片

为了解决这个问题,Harvey 与 OpenAI开发了一个完全定制的模型,从头开始构建,以帮助律师研究判例并建立法律论据。

Harvey 与 OpenAI增加了所需的背景深度,首先从特拉华州的判例开始,然后扩展到包括所有美国判例。他们添加了相当于 100 亿个 token 的数据来支持定制训练的判例模型。

Harvey判例模型能帮助完成需要复杂推理、广泛领域知识和超出单个模型调用能力的任务,例如起草文件、回答有关复杂诉讼场景的问题以及识别数百份合同之间的重大差异。

在Harvey判例模型和 GPT-4 输出的并排结果对比中, 97% 的律师喜欢判例法模型的输出。它提供一个更长、更完整的答案,并深入探讨了问题所问的细微差别,涵盖了更多相关的判例。

判例模型不仅不会编造判例,而且每一句话实际上都得到了它所引用的判例的支持。

(4)主要用户

公开披露的标杆客户包括 Allen & Overy 及普华永道(PwC)。

图片

Harvey 和 Allen & Overy、普华永道等大型事务所密切合作,一方面可以借助这些事务所的大客户资源基础实现 GTM;另一方面则是获得优质数据集,基于事务所的实际使用实践来共同打磨产品,使产品更为贴合目标客户的需求。

根据官网信息,除了现在众所周知的普华永道(PwC)和 A&O Shearman 之外, Harvey的用户还包括:Bridgewater、CMS、Cuatrecasas、Gleiss Lutz、KKR、MacFarlanes、O'Melveny、Reed Smith、Repsol、T-Mobile、Vinson & Elkins等等世界顶级法律团队。

红杉资本在官方博客上表示,目前有 1.5 万家律师事务所正在排队使用 Harvey 的 AI 产品。
估值及融资情况

Harvey最新融资估值达7.15亿美元,历史融资合计超1亿美元。

种子轮融资:2022年11月,Harvey完成种子轮融资,金额为500 万美元,此轮融资由OpenAI Startup Fund领投,Google AI负责人Jeff Dean、Mixer Labs联合创始人Elad Gil以及一批天使投资人跟投。

A轮融资:2023年4月,Harvey完成A轮融资,金额为2100 万美元,估值达1.5亿美元,此轮融资由红杉资本领投,OpenAI Startup Fund、Conviction、SV Angel 和 Elad Gil 参投。

B轮融资:2023年12月,Harvey完成B轮融资,金额为8000万美元,估值达7.15亿美元,此轮融资由 Elad Gil 和 Kleiner Perkins 共同领投,OpenAI Startup Fund 和 Sequoia 也参与其中。

最新消息:2024年6月,Harvey计划融资6亿美元,估值至少20亿美元。该融资计划尚未完成,计划融资资金用于收购法律研究服务公司vLex,以训练自己的产品。
小结

“AI+法律”受法律行业自身的特点,可能是最快全面铺开的AI应用场景之一。

而Harvey是赛道中最受关注的公司,Harvey 旨在成为整个法律工作流程中的综合 AI 助手,包括合同分析、诉讼支持、法规合规、文件起草等。

同时Harvey目前主要提供定制AI模型,满足律师事务所内部信息保密的需求。

Harvey的差异化优势在于其法律专业训练数据的深度、模型的定制化能力、针对法律行业的专业化特性、企业级安全性,以及与全球知名律师事务所建立的合作伙伴关系。这些因素共同塑造了Harvey作为一个为法律行业量身打造的、具有明显差异化的人工智能平台。

图片

但是,从投资者角度,Harvey作为新兴技术成长势力,其未来也面临着很多不确定性,不仅包括数据安全、产品实用性以及商业化标准等等问题,还面临着传统巨头基于历史积累的客户与资金优势,可能通过收购或者研发快速切入,如汤森路透 Thomson Reuters 收购的 Casetext。

Harvey未来的发展如何,我们将持续跟进,共同关注。