金融大模型被认为是AI大模型产业化的第一站。
金融行业具有丰富的结构化数据、丰富的应用场景和良好的数字基础设施等一系列特征,这些都是融合AI技术的有利因素。因此,当AI大模型开始爆发时,各行各业都会认为金融是AI大模型的天然港湾。
从2023年到现在,中国金融模型市场的发展确实印证了这一判断。据相关数据显示,目前中国市场已应用近20个大型金融模型,头部金融机构或已应用人工智能模型,或已展示其人工智能模型的R&D和应用计划。
要知道,在降本增效的背景下,金融机构仍需兼顾移动金融、数字系统自主替代等多项数字化投资目标。能够分配给AI模型的资源并不丰富,AI给金融机构带来的投资回报仍然非常有限。金融行业高效推出大型模型真的值得吗?
我记得我在2023年参加一个金融科技峰会时,与一位银行代表进行了交流。他提出,金融机构做AI大模型最根本的驱动力是省心。在移动互联网时代到来之前,全球金融业普遍低估了新技术的影响。后来被Apple Pay、支付宝、微信等移动互联网平台分销。防止类似情况再次发生是推动金融机构增加更多人工智能模型的根本动机。
如果是这样的话,金融业快速转向大模式是不够的。同时,还需要听到远处的风声,并能够从长期目标追溯短期行动计划。
今天,从这个角度出发,我们来谈谈金融行业快速运用后的大模式。接下来它将走向何方?
大金融模式已经从1.0的高速覆盖转向2.0的最优价值。摩托罗拉VE70
从全球市场到中国市场,生成式人工智能带来的重大模式变革在一年多的时间里掀起了金融业的技术创新浪潮。
在国际上,OpenAI将金融行业视为GPT科技的第一站。例如,它与摩根士丹利合作推出了基于GPT四号的投资顾问机器人。
在中国金融行业,AI大模型以前所未有的态势高速覆盖。在短短一年多的时间里,处于领先地位的银行、券商和保险机构都完成了金融大模型的应用。
例如,中国工商银行宣布建立首个全栈式自主可控的千亿级AI大规模模型技术体系,在多个金融业务领域实现创新应用。例如,在网点运营方面,推出了基于大模型的网点员工智能助手。中国农业银行人工智能推出了类似于ChatGPT的人工智能大模型应用ChatABC,并在技术问答场景中进行了内部试点。通过接入百度“文心一言”,邮储银行将大语言模型应用于智能风控、智能运营、智能投研、智能营销等场景。
在民营银行层面,网商银行将大模型技术应用于产业金融层面,从而识别出小微企业的信用画像。在保险行业,众安保险构建了“人多人合”的体系,将大模型带入智能客服、到期提醒、智能运营等业务场景。
从技术和解决方案提供商的角度来看,中国市场已呈现多元化的金融模型技术供应渠道。腾讯云和蚂蚁金服都推出了金融大模型解决方案。面向金融行业,我们不仅需要大模型的落地,还需要基础设施更新的需求。2023年,华为推出了基于盘古大模型的金融级PaaS解决方案,并发布了包括数据AI化、业务AI化、IT AI化三大类10个场景的金融大模型解决方案。
在开源大模型层面,度小满开放了轩辕大模型,该模型在拥有1760亿参数的Bloom大模型基础上进行训练,并已应用于度小满的各个业务场景,覆盖了从营销、客服、风控、办公到研发的场景,并在一系列大模型评测中取得了领先地位。
可以看出,大金融模式已经快速走过了以高速覆盖为特征的1.0时代。第一阶段,大金融模式的相关技术和解决方案迅速发布,头部金融机构竞相试用,为大金融模式在中国的发展奠定了良好的基础。
金融宏观模型第一阶段的发现是显而易见的,例如,技术的快速发展和用户的高度热情。同时,金融模式的业态覆盖非常完整,从银行到保险、证券等领域,且相关技术能力供应链得到完善。既考虑了闭源模式,又考虑了开源模式,且各种部署方式齐全,支持金融模式的软硬件基础设施较为完备。
但下一步,金融宏观模型需要从探索阶段1.0进入阶段2.0,这必须要求回报率并反映长期发展价值。
在这一阶段,大金融模式需要面对的挑战更加复杂,战略方法论的问题也将浮出水面。
已经暴露的挑战
纵观金融大模型的落地过程,我们会发现其中所展现的优劣势逻辑与此前AI技术在金融行业落地的逻辑如出一辙。在第一阶段,行业会直观地感觉到AI非常有用。但接下来,人工智能能否带来足够的投资回报,能否深入到业务的核心领域,则是更大的挑战。
目前,大金融模式也遇到了类似问题。首先,大模式带来的智能错觉、数据污染等问题,与金融行业对专业性和安全性的极高需求难以匹配。
其次,由于金融行业极高的保密级别和安全合规要求,往往需要将大规模模型部署私有化,同时禁止模型学习大量数据,禁止数据过度流动。这又产生了两个问题。一是私有化部署给金融机构的R&D和运维成本带来了巨大压力。另一个是安全级别高、数据使用受限带来了金融大模型效果不佳等问题。
对于金融机构来说,不仅开发和训练大型模型的成本过高,而且模型的场景部署成本压力也很大。目前,财务宏观模型仍处于探索阶段,难以带来实际的业务反馈,因此其部署往往在组织内部或边缘业务中。因此,部署成本不断放大,但商业价值却迟迟未能实现。
最后是金融行业的高安全性与不成熟的大规模模型技术之间的差距。一般情况下,金融宏观模型不能部署在金融核心业务中。例如,大模型加持的智能客服不仅可以取代客服人员,还可能造成人工客服需要频繁唤醒、客服需要重新了解用户需求的现象。在风控等行业的应用端,虽然大模型显示出巨大的潜力,但并不能真正应对更复杂的风险异常。
在这种情况下,大金融模式很可能像许多金融科技一样在运行一段时间后被边缘化,热度相对消退。
我们如何突破技术和产业之间的长期壁垒?这可能需要金融模型从远处听到一些风声。
从未来出发,回望当下。
在著名的《银行4.0》中,布雷特·金在第一章讨论了第一性原理的回归。也就是说,我们需要回到问题的起源和设计的本质。在金融场景中,我们首先需要了解银行的设计目的是什么,然后讨论银行应该如何发展。
如果我们想打破大金融模式可能面临的壁垒,我们也必须有这样一种意识:去思考、去判断,甚至去假设大金融模式未来能给金融带来什么,然后从未来反推到现在。
即使这个未来相对遥远,至少远方的风不会把我们带进死胡同。
那么,AI大模型能给金融带来什么?
这个问题可以从两个维度来理解,一个是技术维度,一个是应用维度。
从技术角度来看,大语言模型的技术升级路径已经相对确定,业界对其技术开发范式和工程实践已达成明确共识。
例如,最近我们阅读了杜小满金融科技委员会执行主席兼数据智能应用部总经理杨青撰写的《大语言模型:原理与工程实践》。该书除了明确提出大语言模型的多项关键技术外,还指出了其在涌现和推理能力方面的特点,以及广受关注的大语言模型的缩放规律。随着模型训练能力的提高,大语言模型将继续具有智能涌现的效果。这一技术锚点是金融行业追求的长期价值,也是杜小满等金融科技提供者探索大语言模型的价值关注点。
从应用的角度来看,当前金融大模型的应用场景有很多,但归根结底可以归纳为三个方面:
这三种能力的最大化就是金融模式可能带来的长期价值。例如,在未来,由大语言模型驱动的智能客服可能会成为智能顾问和一对一金融服务专家。它不仅可以完成业务对接、信息通知等基础功能,还可以根据用户需求给出定制化的金融解决方案,实现金融定制能力从大用户、企业用户向普惠用户的转变。
将技术维度与应用维度相结合,我们可以在三个方面锚定金融大模型的未来:
1.企业和个人信贷服务的智能化普及。
2.金融客服较少甚至无人服务。
3.金融机构的极致综合智能。职工医保新政策生效
如果说移动金融直接向用户开放了银行和券商,拉近了金融与用户的距离,那么AI大模型金融就是让用户走得更远,让用户的所有诉求和资产都能与金融服务连接起来。
用远方的风测量现在的路。
一段时间以来,在金融大模型领域一直存在着撤退与实用主义之间的争论。
所谓退群,就是金融机构要更加关注算法本身,关注模型的表现,从大模型入手,用大模型的锤子在金融业务中找到钉子。联想官网
务实就是从金融行业的应用场景出发,优先考虑金融应用智能化的安全合规和成本控制,然后在此基础上适配大模型的能力,让大模型为金融服务。
在某种程度上,他们都有正确的因素,但也许他们还可以增加新的想法。因为两者都更注重短期选择,忽略了大金融模式的出发点是产业的代际升级,是寻求像移动金融那样的长期变革。
大金融模型需要补充的思想是,除了务实之外,它还需要服务于未来,它需要从最终可能实现的理想化目标中一步步推导出当前的工作。让远方的风吹动眼前的脚步。
从这个角度来看,金融机构需要考虑到大模型的效率,同时考虑到未来随时可能出现的更多AI技术创新。让自己的数字架构和软硬件基础设施适应随时到来的AI技术迭代。具体而言,“服务未来”的财务模型可能包括以下三个行动:
1.为大金融模式打下坚实基础。这包括其自身的研发体系,以及与技术供应商建立开放有效的合作关系,以避免因过度保守而导致技术搁浅。
2.兼顾大金融模型的工程力和想象力。面向大语言模型的长期发展,金融行业不应局限于拥有大模型,还需要锤炼对大模型的工程控制,可以随时锤炼成符合自身需求的状态,同时积极探索有创意的大模型。它不仅在内部酝酿变革,还在放过外部机会。
3.建立一个长期而明确的智能目标。对于大金融模式,我们应该正视其短期的局限性和长期的可能性。战略上回归大模型本身的第一优先原则,然后以此为目标反推每一步的进度。
当大模型出现在金融行业面前时,我们的第一感觉是惊讶和遐想。然而,在实践中应用大模型时,往往过于关注眼前,例如是否使用大模型、覆盖的业务场景以及投资回报。此时,不断涌现的挑战和不明确的价值往往会滋生矛盾,使金融机构陷入两难境地。只要远处的风吹进来,长期的财务智能反映了现在,大多数问题都会找到解决方案。
未经允许不得转载:科技让生活更美好 » 金融大模型,要听见远方的风