旗下微信矩阵:

明略科技吴明辉:企业迎接大模型时代,要解决知识工程问题

2024-06-07 13:28 · 互联网     

2024年1月,德勤发布报告《Now decides next:Insights from the leading edge of generative AI adoption》,对2800多名具备AI技术知识的商业和技术*展开调研。数据显示,绝大多数(79%)受访者认为,未来3年内,生成式AI将推动组织与行业的重大变革。

在具体落地形式上,目前多数企业依赖于现成的解决方案。其中,71%的受访者选择“具有集成生成式AI的生产力应用程序”,68%的受访者选择“标准化生成式AI应用程序”,61%的受访者选择“具有集成生成式AI的企业平台”,56%的受访者选择“公开可用的大语言模型”。

可以看到,将AI融入工作流程已成为众多企业的共识。但当大模型扎根企业时,现实的阻力却不容忽视:缺乏高质量的行业数据、与业务场景适配不足、员工对AI心存戒备等等,这些痛点正考验着企业的决心与智慧。

明略科技长期致力于提供基于大数据和人工智能的产品与服务,推动组织高效运转、加速创新,创造人机协同的美好世界。2023年8月,明略科技推出一站式大模型AI智能助理——小明助理Copilot,经过内部的试水与打磨,95%的员工已在日常工作中高频应用,周活达到70%以上,初步实现“与大模型同频”。

近日,作为企业级大模型应用的开发者与早期使用者,明略科技创始人、CEO吴明辉受邀莅临混沌学园,结合企业自身实践与行业观察,就大模型落地企业的方法论,展开深度分享,以下为核心要点整理:

明略科技创始人、CEO 吴明辉

参数越大,效果越好?

在同其它企业CEO、CIO、CMO聊天时,我发现大家对于大模型的出现都感到很兴奋,很多公司都建立了人工智能小分队,但尝试几次后发现效果并不理想。

现在,OpenAI已经把参数做得非常高,它拥有的是互联网上的通识知识。如果训练得足够好,它可以拥有优秀本科毕业生同等的认知能力。但即使拥有了这种认知能力,就能确保大数据在企业中做好很多工作吗?

答案是否定的。

值得注意的是,大量的模型参数并不能确保在工作中有效转化成生产力。有些任务,即使用很小参数的模型也能解决。

在无法判断一个大模型效果好坏时,我建议大家可以向大模型提出一个问题进行检测,“美国的哪一个州跟其他的州不接壤”,这个问题的正确答案是阿拉斯加和夏威夷,它需要大数据知道美国的地理情况以及州和州之间的关系。

我们讲大模型的迭代能力,就是要提高它的推理能力,而推理的过程需要信息。

现在,参数在不断提高的过程中并没有增加信息,不断提高参数只是让模型的推理能力变强大了。做个类比,模型是f,信息是x,只有把正确的x给到强大的模型f,才有可能算出正确的y,才有可能辅助企业的理性决策和下一步行动,这是部分企业认为大模型不好用的核心原因。

今天人们想将大模型应用到公司当中,但是大模型并不知道公司原有的生产资料和信息系统。一个好的大模型,需要人们将信息找过来。

大模型落地企业的核心:知识工程

管理大师野中郁次郎在《创造知识的企业》一书中提到,每个企业有暗默的知识,也有显性的知识,企业最核心的就是要把这些知识管理好。

在大模型时代,这些知识不仅存在于每位员工的大脑中,存在于企业的文档库中,甚至存在于每次会议的录音当中。有一天,大语言模型可以直接执行录音里面的知识。这就如同一个优秀的高校毕业生在你身边当助手,你需要做的就是每天用资料同它交互,就可以大幅提升效率。未来,企业的知识管理逻辑也将发生巨大的变化。

企业迎接大模型时代的第 一个命题,就是要解决知识工程问题。

现代认知心理学将知识分为两类,一类是陈述性知识,一类是程序性知识。例如,大象是一种动物,这是陈述性知识。把大象放到冰箱里面分几步,这是程序性知识。编程知识也属于程序性知识。

当人们问大模型提问,“湖南和湖北的两个省会,哪个人口更多?”一些大模型往往会卡住,因为它根本没有理解这句话的意思。但如果通过操作把它的CoT(思维链)能力调出来,大模型就有能力将答案推理出来。如同一名刚入职的新员工,只要公司把任务拆得足够细,他就能做好。大模型的学习、发展和应用的过程,同人类从小的学习发展过程非常相像,两者是完全可以类比的。

Prompt(提示词工程)和CoT(思维链)技术是大模型能力发现的重要组成部分,其革命性意义可以媲美人类文字和印刷术的发明。CoT的重点是把程序写清楚。在小明助理Copilot中,只要简要地表明你的目标,它就可以将Prompt模板写出来,非常方便。

Prompt和CoT的出现,实现了大模型和大模型之间互相学习的设想,只要读懂了你的指令,大模型就可以将这些指令执行得非常好,并且下一个人可以立足于训练成熟的AI继续发展,每个人都站在巨人的肩膀之上。

除此之外,还有更高级的用法,比如Agent。Agent的本质就是模型和信息,好的Agent可以把大语言模型和Memory、Tools、Planning的能力有机地组织起来。

连接大模型与知识的理想方式

在整理数据和知识时,企业不仅要考虑如何规划数据、知识,同时也要考虑权限问题。我的建议是按照两个维度四象限的逻辑进行分析,包括数据的公开程度、执行任务的推理复杂性等。对于低密集又需要高难度推理能力的,可以直接使用在线大模型;对于高密集且推理能力不高的,例如财务信息、HR信息、研发产品信息等,可以部署一个私有化模型。企业要做的,就是把对应的密集问题想明白、分好级。

在企业中,真正想把信息系统整理好,并且和大模型连接起来,需要解决诸多难题。最简单的方法就是使用Copilot。

Copilot是什么?pilot的意思是驾驶员,Co-pilot的意思是联合驾驶或副驾驶。举个例子,人们最理想的状态是让汽车变成无人驾驶,但成本和代价很大。在Copilot模式中,主驾驶还是人,副驾驶的职能是协助人做一些决策和操作,甚至完成主驾托管的任务,但最后的决定权仍在人类手中。明略开发小明助理Copilot的意义就在于此。

通过小明助理Copilot,今年公司员工已经做到了广泛使用大模型,平均每个员工一天使用10次以上,大家不仅可以用GPT解决工作生活中遇到的一些问题,还可以应用到自己的生产环境中,用于提升生产效率,公司团队绝大多数的同学都已经拿到了大模型的船票。

如同《异类》一书中提出的1万小时定律,只要比别人多花一些时间做某件事情,未来就有机会享受到某个领域的竞争红利。每一项新技术的出现都是有红利的,最终大家也一定都会使用到,但更早接触的人会比别人多一些机会和时间。

彭博社是全球最 大的金融信息服务商,明略科技旗下的秒针系统是中国最 大的广告领域信息服务商,两者有着一定的共通之处。彭博社的创始人迈克尔·布隆伯格创业初期,立志将终端机卖给每一个金融机构,希望帮助大家快速获取互联网上的金融信息,这也成就了彭博社今天在全球金融信息服务领域的霸主地位。很多公司都在拥抱新技术,它们可能是将某一项新技术用到了*,或者是第 一个使用新技术从而颠覆了上一代产品,最终走出了新的曲线。

(免责声明:本文转载自其它媒体,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。请读者仅做参考,并请自行承担全部责任。)