12月19日,由创业黑马主办的“第16届创业家年会”在北京举办,年会主题为“AI新纪元 破局向未来”。近屿智能创始人&CEO方小雷 以《用AI做新式招聘》做了演讲。
以下内容为创业家&i黑马编辑过的演讲节选:
我们是做AI面试的公司。AI面试分级,我们2017年开始创业,一直做到2020年市面上出现了很多仿品。仿品会讲,微表情研究,就是通过微表情判断这个人是不是在撒谎。现在回过头来看,大家会觉得很荒唐,但是在当时有很多人真的会上当,所以当时我很痛苦。
有次我在南京遇到了我们的董事,黑马基金的胡翔总。胡总说,我帮你想过这个问题了,你可以按照自动驾驶对AI面试进行分级,这样就可以把自己定位在一个级别上,也可以把竞品按照他们的特征,定位在另一个级别上。于是我设计了L1到L5级别的AI面试分级,当时我们已经在L4级别,用篇章级别语义识别判断一个候选人的完整语义,再对表情和声音进行判断,综合在一起就是一个多模态算法。2019年我们发布了第一代的篇章级别语义识别算法,比Open AI的GPT 1还要早三个月。
2022年我们非常痛苦,因为我们的AI面试官产品好像走入了一个死胡同。
第一,在市面上我们看到了很多的“面经”,就是很多人参加完AI面试后,把参加的题目发到网上,后面的候选人可以看到这个题目提前做准备,这基本是个无解的作弊问题。
第二,不能追问。就是问了个问题后,AI面试官不能给候选人任何回应,只能机械的跳到下一个预设好的问题。从候选人角度来讲,看不到AI面试官的任何智能。
第三,AI面试官是单向的,只能她问候选人问题,候选人不能问AI面试官问题。
所以当时陷入了一个死胡同,我希望能达到L5级别,就是既能多轮对话回答候选人问题,又能千人千问规避题目泄露导致的作弊问题,还能对候选人进行多轮的实时追问。
结果2023年上半年突然大模型时代突然来临,Mate的LLaMA也开源了,我们马上基于LLaMA的开源算法进行增量预训练和SFT,达到了L5级别的AI面试。
在AI面试里最核心的价值是什么呢?就是AI面试报告中呈现的全自动的AI得分和对候选人的深度解析。到今天为止我们绝大多数竞品还是用关键词识别来判断一个候选人回答问题的质量。甚至位了保证得分的质量还会请一个人类面试官躲在AI面试官后面打分,但是如果有海量的候选人同时参加AI面试,那么请很多人类躲在AI面试官背后打分就来不及了。
这是我们的产品优势。我们的AI面试官能回答候选人的问题,每个候选人会看到不同的面试问题,即使针对同一个胜任力进行提问。我们可以一轮又一轮地对候选人进行全自动的即时追问,而且追问过程中候选人不会遇到幻觉。这是一个非常关键的问题。假设用一些闭源算法的API,包括ChatGPT在内,至少会有10%到20%的候选人会遇到各种各样的幻觉问题。但如果用我们自己训练的模型,这个幻觉问题就没有了。我们去年帮中原银行面试了1万人,今年又面试了1.4万人,没有任何候选人遇到幻觉问题。
我们的算法迭代路径开始于2018年。那一年,我们训练出了第一代模型,当时还是叫篇章级别的语义识别算法。我们去融资,谈了69家VC,没有人投我们。原因是多方面的,一方面大家会请CV(视觉识别)的人判断NLP的项目,大家都不理解我们做什么,甚至不相信NLP已经能够做到篇章级别了。另一方面,被投资人咨询到的HR不会说他们需要一个AI面试官。他们通常会说,我需要一个AI解析工具帮我筛选简历就够了。但我个人做了十多年的甲方HR出来创业,我觉得简历解析是做出来的,因为我们发布的招聘广告都没有很认真地撰写并且持续迭代,另外一边,我们收到的简历70%到80%的内容有水分,特别是候选人的工作业绩和工作经验这两个部分,用JD和简历做匹配,就能挑出好的候选人,这从底层逻辑来讲就不Work。
我是一个在AI行业有一定时间的创业者。现在AI还是在一个持续不断迭代的过程之中,可用于训练大模型的数据还远远没有达到用尽的状态。大家想一个问题,为什么大厂让大家以几厘甚至几毫的价格去调用他们的API呢?很核心的一个原因就是他们需要在AI应用过程中产生的数据,这些数据才是真正宝贵的财富。如果你把这些数据持续不断迭代训练到大模型基座里,大模型才能执行更多的替代人类的智能决策的任务。所以现在还远远没有到数据枯竭的状态,我们每天用AI,就是帮AI创造更多的数据。
但是有部分私有情景,比如AI面试官,就不可能用大厂的API。因为客户有非常严苛的信息安全要求,所以我们需要基于一个开源基座,自己训练模型,然后去使用自己的模型。像我们这样的场景非常多,凡是对信息安全要求高的公司都需要开源基座进行一定程度的训练,有的时候运气比较好,到了微调层面就可以结束了,有的要到增量预训练阶段。很多AI应用效果不好的原因是,大家以为是用一个Prompt加上一个API,呈现一个结果就是一个好的产品了,这个也太容易了。如果大厂想做这件事,随时都可以做,毫无壁垒可言。
基于基座至少进行了SFT,这时你的产品才会有商业价值,才会有壁垒。而这个才是我们做AI应用的关键之一,无论是做AI Agent还是copilot,你要去积累的东西,不断形成自己的壁垒,才能产生数据的积累,产生一个飞轮效应。
朱啸虎是我们的天使轮投资人。到今天为止投了我们三次,领投一轮,跟投两轮。朱总当时对我们有两个关键判断。
首先是算法。当时我们谈了很多投资人,大家很难判断出来一个领先的算法是什么样子。我跟朱总讨论了这个问题。朱总说解决这个问题很简单,于是请团队在卡内基梅隆大学找了一位NLP的博士,对我们进行了技术尽调,确认我们独立发明了篇章级别的语义识别算法。朱总是唯一从美国调人来研究我们技术的投资人。
其次是需求。他找了一位PWC的Partner问了HR的同事,如果朱啸虎投了AI面试的产品,你们会不会用?PWC的HR说不会的,我们用Hirevue很多年,很好用的,为什么要换呢?于是朱总确认这个市场存在,只是在中国还没有开始,于是他就投了。
最后分享一下,我的创业感受。
第一,千万不要憋大招。我2017年从加拿大回国创业,一开始想做背景调查的项目,一直在打磨产品,把钱都花完了。当你有一个简单产品时,应该立刻推向市场去做验证,这个动作非常关键。我在很多大公司工作过,花钱总是大手大脚,以前我的助理对我的备注是花钱小能手—Lucas,不过我现在已经非常抠门了。
第二,以前创业最重要的事情就是股权融资,持续的股权融资。我2017年回国时,我们有概率拿到比较好的投资。2022年时投资人已经不看好SaaS模式。2023年时,行业内HR的巨头也上市了,但股价直接跌了90%,大家对于HR行业不那么看好了。我们从2023年到2024年遇到的都是战略规划的Worst Case Scenario,也就是最差的计划。这时候股权融资已经不可能,那就需要一个平衡的战略,做现金流业务的同时,去保持AI产品的持续迭代。
在不同的阶段里,大家既要能生存,也要能发展。以上是我的分享内容,感谢大家。
[本文作者i黑马,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]