金融业需要什么样的大模型？

文|数科社林木

电影《奥本海默》里有句台词：（原子弹）不是一种新武器，而是一个新世界。这句话用来形容过去一年大模型的“爆炸”发展再恰当不过。

自ChatGPT发布以来，大模型成为整个人工智能的新底座，激起了新一波技术革命浪潮。在不到一年的时间里，通用大模型的爆发开始席卷各行各业，金融业作为数字化需求强烈的数据密集型行业，成为大模型率先落地发力的最优场景之一。

这个9月，金融大模型翻涌的海浪上又多了两个重量级新玩家。

9月8日，蚂蚁集团在上海外滩大会发布了工业级金融大模型（AntFinGLM)，同时推出了两个配合模型层的产业应用“支小宝”和“支小助”。12天后，同在上海，华为首发了包括AI for Data、AI for Business、AI for IT三大类10个场景的金融大模型方案。

随着金融业新世界的大门开启，金融、科技巨头们不断涌入，一场从通用大模型走向行业大模型的适配之战也随之打响。

金融业到底需要什么样的大模型？通用大模型从通识阶段走向专识阶段，又将面临着哪些挑战？

01 一个认知能力的引擎

近年来，拥抱数字化和新技术一直是金融行业反复强调和推动的重要命题。

某种角度来看，金融是一个特殊的信息处理行业，因而随之信息技术的快速更迭，金融领域所涉及到的功能、要素、产品和市场也会发生内在潜移默化的改变。

回顾过去十年的行业发展轨迹，互联网金融的出现，让辨别式AI在智能营销、智能风控、智能投研、智能客服等金融领域落地生花。基于机器学习驱动的建模能力不断赋能金融产业链的变革与创新，同时也为人工智能的渗透融入打下根基。

金融业对大模型并不陌生，生成式AI的横空出世，意味着行业新一轮AI革命浪潮已经到来。

“大模型已经不单单是一个知识的容器，它更成为一个认知能力的引擎。”9月8日，复旦大学教授、博导、上海市数据科学重点实验室主任肖仰华在外滩大会上，分享了对于通用大模型在适配和优化层面的思考。

肖仰华表示，今天的大模型已经非常擅长解决以前人工智能会碰壁的语言理解等常识类问题，甚至还具备了一定的自识反思能力和泛化组合能力，“我们不仅仅把大模型当做一个某类数据处理的基础模型，已经把它当作未来适应复杂环境的自治智能体的一个大佬。”

在他看来，这些能力恰恰是行业的认知所需要的，今天一个通用语料训练出来的大模型，已经成为行业垂语认知的一个重要基座。如金融领域的智能解决方案，过往思路是收集整个行业的数据来构建，整个关注点仍在于行业数据和知识，但大模型却是颠覆了这一认知。

肖仰华以医生诊断疾病举例，一个医生想胜任他的工作，首先要认知什么是健康，“我们发现其实行业的很多问题恰恰是建立在通用的认知能力基础上。”因此他认为大模型亦是如此，通用认知的理解非常重要，没有通识能力，是不可能发展出专业认知能力的。

当下已由感知智能转换到认知智能的大模型显然已具备了这一条件。相比以识别能力为主的传统AI模型，生成式AI的认知智能体现在理解、分析和决策三个维度上。

比如，它可以通过前文来预测下一个词语，对文本中不同的词语赋予不同的权重值，能够在生成文本时综合考虑到文本中的上下文关系，生成更连贯、合理的文本，赋予了其内容生产能力。这就注定了其会在智能交互环节大放异彩。

此外，生成式AI还可以从已有数据中学习样本的统计特征，并在此基础上生成新的数据，这种增强学习的过程，对于金融领域的智能投顾、风险控制等都无异于一种新的驱动力。

数据训练是大模型提升性能不可或缺的重要一环，OpenAI 团队所提出的大模型遵循的“伸缩法则”指出，当参数规模增加、数据集规模增加并延长模型训练时间，大模型的性能就会提升，并且如不受其他两个因素制约时，大模型性能与每个单独的因素都呈现幂律关系。

作为数据密集型行业，金融业沉淀了如金融交易数据、客户信息、市场分析、风控数据等海量数据，又催生出大量高效处理的技术需求。因此，大模型落地金融业，无疑是一场双向奔赴。

02 还有“最后一公里”要走

尽管大模型的问世带给诸多行业巨大的想象空间，但当下对于金融业而言，通用大模型拿来就可用吗？答案显示是否定的。

在肖仰华看来，金融领域的本质是一类复杂决策，远远比开放闲聊的任务要困难得多，“你会发现通用模型里面的专业知识是远远不够的，通用大模型好比是一个夯实的知识底座，宽广有余，但纵深不足。”

除了专业力上的欠缺，肖仰华还提到一个非常值得关注的问题，即大模型“幻觉”——指大模型在生产内容的过程中，可能会由于训练语料及模型的原因，产生事实性的错误。

“行业中经常是希望大模型按照给出的规范、制度、文档回答问题，而不是从通用领域习得的知识回答问题，从技术上是叫Closed QA，而不是Open QA。”他认为，正是因为大模型擅长发挥创造，就很有可能跳出给定的内容去胡编乱造，缺乏领域的忠实度。

当下来看，这种“幻觉”无疑是通用大模型落地部分行业的障碍之一，尤其像数据敏感度较高的金融领域。

为了解决这一问题，OpenAI采取的做法是通过加强迁移学习和对抗训练，以提高回答的准确性和靠程度，GPT-4的内容准确性比GPT-3.5已增高了40%。而行业中的常见方法是通过对模型进行领域知识的微调，利用更加精确的数据来纠正模型的偏差，也就是构建垂直领域模型。

肖仰华给出的应对思路在于注重大模型和相关技术的协同。他表示，在大模型协助下，行业中很多任务被分成提示、生成、评估三个子任务，大模型主要在生成阶段发力，而在提示和评估阶段，仍有很多传统系统发挥价值的余地。

譬如知识图谱技术，图谱中的知识往往擅长表达的是专业知识、私密知识，和可理解、可控的符号知识，它和大模型所表达的恰成一种紧密的互补关系。利用知识图谱做事后评测、验证以及增强提示，可以进一步改善大模型的“幻觉”问题。

这种应对思路在当前一些重量级金融大模型身上已然被验证，如蚂蚁的金融科技团队过去几年在构建金融知识图谱上做了大量投入。

以支小宝团队为例，首先基于一些研报、新闻、大V资讯以及高质量权威合作数据源和数据库，通过合作的专家，对于领域专业知识进行了提炼和萃取，形成了一个标准化基础知识层。然后算法工程师再在此基础上做关联和整合，尝试建构金融现象之间的因果逻辑，最终匹配金融专业要求的知识图谱得以形成。

肖仰华表示，要把通用大模型的适配和优化当成一个系统工程，从数据层面、知识层面、架构层面、评估评测层面、生态体系等各个方面去寻找思路解决问题，“我们仍然有漫长的路要走，才能走完这最后的一公里。”

03 风起云涌的适配之战

眼下，大模型从通识阶段走向专识阶段才刚刚迈出一小步，这个落地过程必然少不了金融机构与金融科技巨头的涌入、实践和推动。

目前来看，大模型技术发展先行一步的海外市场，从金融垂类大模型的构建，到将如信息管理、智能推荐、细分领域问答等各个金融场景的应用，已有多个成功落地赋能行业的案例。

作为首个金融垂类大模型，BloombergGPT在3月的发布，为金融大模型的适配之战打响了第一枪。国际金融服务巨头Morgan Stanley（摩根士丹利）和 OpenAI 合作推出了一款基于 GPT-4 技术的聊天机器人，并利用该机器人管理其面向客户的庞大知识库。

在智能投顾领域， OpenAI 向 ChatGPT Plus 用户开放的用于投资的第三方插Portfolio Pilot，能帮助用户更加清晰的了解自己的投资组合，并获得投资建议。Broadridge 子公司 LTX 推出的 BondGPT，能帮助客户回答各种与债券相关的问题，还能根据特定数据筛选输出可视化图表。

回过头再来看开启“千模大战”的国内市场，在金融大模型的落地脚步同样响应迅速。半年时间，一众传统金融机构、金融科技巨头和互联网大厂纷纷躬身入局。相关统计数据显示，目前国内参数在10亿规模以上的大模型数量已有116个，其中金融行业大模型约18个。

从模型训练的参数量来看，国内不乏一些“千亿级”玩家：度小满开源的轩辕大模型，在1760亿参数的Bloom大模型基础上训练而来；恒生电子的Light-GPT利用了超过4000亿个Token的金融领域数据；蚂蚁金融大模型囊括的金融语料更是超过了5000亿。

互联网大厂与金融科技巨头多深耕人工智能领域已久，在技术落地应用上无疑占据着先发优势，如自带“安全基因”的蚂蚁和360，在对抗黑灰产和可信AI研究领域有着多年经验和投入。

此外，也有像华为、马上消费、星环科技这种“另辟蹊径”布局金融领域大模型的玩家。华为依托于盘古大模型，以金融级PaaS解决方案的方式切入金融场景；马上消费的天镜大模型则凭借着“三纵三横”技术布局扎根金融行业全链路；数据库厂商星环科技在自研金融大模型“无涯Infinity”的同时，还提供了一站式的企业自建大语言模型工具链，尝试两条腿并行。

9月19日，国内首个金融行业大模型标准在南京正式发布。该标准由中国信通院牵头，联合腾讯云、奇富科技、科大讯飞等四十多家企业共同编制，不仅涵盖了金融大模型的关键能力要求，还详细规定了其在数据合规性、可追溯性、私有化部署、风险控制等方面的要求。

不难看出，在政策加持和企业助推之下，金融大模型的适配之路越发明朗，正从一小步变成一大步。

举报/反馈

蓝鲸财经

615万获赞 31.1万粉丝

原创财经新闻报道+财经信息服务平台

蓝鲸财经官方账号,优质财经领域创作者

关注