这本关于金融大模型的书,让懂行的、不懂行的都看明白了观点
关于金融领域大模型,现在市面上的书不多,有一部算一部的,也不过寥寥几本。
原因无他,就像远古时期的人类刚刚才发现使用石斧那样,一开始也是只知其用,但要说出背后的原理,甚至是像教科书般地记录传承下来,这就太难了。
如今,我们在AI时代也是如此,哪怕大模型已经来了,甚至不少人已经用上了大模型,但是真要从技术基础、工作原理来为金融大模型著一本书的话,恐怕还是会难倒不少英雄汉。
就更不用说第一部大模型著作了,不仅仅是编写难,更要经受无数金融人和大模型AI技术人才的诸多拷问,因为它承载的行业意义,是启蒙书、是教科书般的存在。
不过现在看来,这部由中国科学技术出版社出版、马上消费金融股份有限公司组编的著作——《金融大模型》,已经获得了不少行业从业者的认可。
▲“开学季”大模型系列图书受热捧
图片来源:京东App截图
无论你是懂大模型的、还是懂金融的,又或者像我一样,知其然而不知其所以然的,只要耐心读下去,你会发现大模型、金融大模型的想象力好像才显露了冰山一角……
两条启蒙线
讲清大模型和金融大模型
对于《金融大模型》的行业价值,中国工程院院士蒋昌俊在推荐序中,有一段总结很到位:
《金融大模型》一书,结合自身的“天镜”大模型的研发和应用实践,系统地介绍了金融大模型的技术基础、工作原理和实践探索,从理论到实践,从技术到应用,从过去到未来,展示了金融大模型发展的生动实践和光明前景,也为读者朋友全方位认识和了解金融科技创新成果提供了重要窗口……
进一步简化来看,书中主要有两条接力递进的系统主线:
一是从人工智能的历史演进到大模型的“涌现”,再到金融大模型的应运而生,以及金融大模型的时代机遇。
在这条主线中,《金融大模型》从历史视角和技术思维出发,明确了一个很深刻的思考:大模型是一门技术,而不是科学,科学是以发现本质规律为目标的,而技术是以解决某个问题为目标的。
这一下子就把AI,从“最初的问题是,机器能思考吗?”的哲学高度,跳转到了更加务实明确的大模型技术难度上。大模型由此迎来了更快的发展机遇和趋势,产业生态聚沙成塔,金融大模型“百花齐放”,越来越多的应用场景出现了新的生命力和创新可能性。
可以说,《金融大模型》就是以技术为“奇点”,连接了AI和大模型、金融大模型的过去未来。
那么现在和未来是什么样呢?第二条主线就从大模型的底层技术、标准体系构建和能力评估,一步步递进到了金融大模型的底层技术逻辑、标准与评估体系构建、应用实例等领域。
暂且不说内容,单从写作的角度看,这本书对于大模型和金融大模型发展走向的展示视角,立意高远,所以在阐述时,才能对金融大模型分析,既系统详尽,又主线分明,精准填补上了金融行业大模型理论研究的空白。
比如在讲技术时,《金融大模型》不仅提到了人工智能的三大技术流派、金融大模型的底层技术等原理问题,而且还给出了更加具体的金融大模型技术搭建和评估等实操方法论,并以马上消费的“天镜”大模型为例进行技术解构。
又比如在谈LLM的应用落地和挑战时,无论是金融知识管理应用,还是客户服务与互动中的应用,又或是未来发展等。这本书介绍的都非常之全面,展示出了金融大模型更多的长远想象力,整体读下来颇有一种眼界放开的既视感。
也难怪有人称《金融大模型》的发布,为外界提供了一个深入了解金融大模型的窗口。通过这本书,整个金融业可以更好地把握住大模型的发展趋势,为未来的金融科技创新做好准备……
一本金融大模型的技术教科书
应用参考指南
2024年政府工作报告提出,要加快发展新质生产力。
那么何为新质生产力?其实指的是在人类社会发展过程中,由掌握新技能的劳动者、不断进化的新劳动工具、新劳动资料,以及新业务的创新驱动而形成的新型生产力。
而今,摆在时代眼前的创新生产工具,就是AI和大模型!所以“人工智能+”也被首次写入了政府工作报告。
那么金融大模型如何搭建并优化?又有什么挑战?自然就成了行业最关心的话题。
为此,《金融大模型》选择从“道”与“术”的角度出发,先是以马上消费发布的“天镜”大模型为范例,提出了三纵三横大模型技术布局,也就是数据智能、多模态智能和实时人机协作;持续学习、模型安全/合规/可信和组合式AI系统技术。
然后又对金融大模型的底层技术逻辑、全栈开发和标准与评估体系构建展开了详细分析。当中,非常有创新价值的是,《金融大模型》依据人力资源领域的多维度评估思路,阐释一种综合性的评估方法,主要包括:通用能力、专业知识和场景应用三部分……
此外,对于当前大模型在应用场景里的一些挑战,诸如大模型幻觉问题、数据隐私等,书中也进行了相关介绍,并给出了一些应对解决思路。
以大模型幻觉为例,可以把重点放到如何实现自动化提高训练语料数据的质量上;在推理阶段,则可以尝试改进解码策略、借助外部知识和度量不确定性的办法来减少幻觉的产生……
当然,书中最亮眼的,还要属对金融大模型应用图谱的描绘。大类上涵盖了金融知识管理、投资决策辅助、客户服务与互动,以及金融合规与风险管理中的应用等四个方面。
至于细分的应用场景领域就更多了,以在投资决策辅助中的应用为例,其中就又包括了资产价值的预测;在新闻和社交媒体数据分析中的应用;在宏观经济趋势的文本分析中的应用等等。
看到这,相信有不少人都已经感受到了《金融大模型》“教科书”般地实用参考价值。
不仅手把手地教大家怎么去理解金融大模型的技术逻辑,怎么搭建并落地应用金融大模型,同时,还帮助行业避坑金融大模型发展中技术缺陷。
对部分银行金融机构们来说,几乎就完全可以对照着来设计,或选择搭建自己的金融大模型结构。
至于那些已经搭建完成的金融机构来说,也可以借助这些案例和实践经验,从中找到更多的应用方向灵感,为行业提供更加明确的实用参考价值。
或许正因如此,中国工程院院士蒋昌俊才会评价道,《金融大模型》一书的出版,是马上消费技术沉淀、行业思考的重要成果,也是科技企业创新精神和社会责任的重要体现……
站在科技交叉点上
《金融大模型》看见未来
其实,如果只是对过去和现在大模型的映照,或许还不足以让《金融大模型》这本书,获得如此多行业大佬们的倾力支持。
毕竟对于早已身处AI时代的人们来说,未来怎样才能更快、更好和更安全,这才是关键。
所以,从针对大模型安全与伦理等行业热点话题,到大模型的未来发展,以及金融和大模型落地结合带来的全新探索,《金融大模型》也提出了自己独特的前沿观察和未来思考。
比如对于大模型的未来发展,书中提到了几点优化的方向:大模型的数据问题、评价问题、代码能力和大模型的知识迁移等。
其中,数据质量算是最关键的问题了。毕竟,机器学习模式都是数据喂出来的,训练数据的质量是模型质量的最大影响因子。但是据相关研究,如果按照当前大模型消耗数据的速度,高质量的公共领域语言数据,例如书籍、新闻报道等,将在2026年左右耗尽。
那么如何破解呢?《金融大模型》试着给出了相关的“解题”思路,比如提高数据的使用效率、利用高质量的小数据训练出同等质量的模型。又比如合成数据,即自己创造出供自己继续训练的数据,同时还有获取特定行业文本数据和突破语言模型的限制等等。
此外,立足于未来视角,书中还大胆畅想了一下,金融和大模型的结合所能带来的未来改变:通过数据信息来辅助决策制定、助力人机协作进化,以及与区块链结合等安全技术方面。
尤其是和区块链的结合,“大模型可以通过帮助分析区块链交易数据,识别出可能的洗钱模式,例如频繁的小额交易就是一种常见的洗钱手段;通过识别与已知的洗钱地址有关的交易,在一定程度上也可以帮助检测区块链的洗钱交易……”
可以说,这些前沿观察和思考不仅为学界提供了新的启发,拓展了新的研究思路,而且还为政府和企业在大模型生态建设方面描绘出了一张新的发展蓝图,让各方对于未来的金融科技发展方向和目标都更加明确,也为整个社会的科技创新和经济发展提供了强大的动力。
毕竟,以大模型为代表的人工智能背后,是新质生产力的创新,不仅将重新定义金融服务的内涵和外延,还将带来金融制造的新模式和新业态。也正是在这样的大背景下,作为全国首部金融领域的大模型著作,马上消费推出的《金融大模型》才显得如此地宝贵和稀缺……