近年来,以大语言模型为代表的人工智能(AI)技术飞速发展,引起社会各界高度关注。自历史长河深处一路走来的金融业,因其与信息和数据的高度相关性,与大语言模型有着很多天然的契合。人工智能与金融的交叉融合,能否让金融这个古老行业绽放出新的生命力?
11月12日,清华五道口在线大讲堂邀请到清华大学五道口金融学院副院长、金融学讲席教授张晓燕,带来“人工智能在金融领域的应用”主题讲座。张晓燕基于她对人工智能技术发展的深入研究,分析了大语言模型在金融领域的应用前景和落地路径,以及由此而来的风险和挑战。
张晓燕表示,所谓大语言模型,是一种用于处理自然语言信息的大型人工智能模型。这些模型在大规模文本数据上进行训练,学习语言的语法、语义和上下文信息,使它们能够理解和生成人类语言并执行多种任务。大语言模型的核心特点体现在一个“大”字:第一是模型参数量大,通常达到千亿级别;第二是数据集大,目前代表性的大语言模型都能达到万亿级的训练数据量;第三是对算力的要求高,算力成本动辄要耗费上千万美元。
与人工智能技术在发展早期只能应用于某些小众领域不同,基于大语言模型为主而开发的生成式AI工具目前已经得到广泛使用。该领域的明星公司OpenAI近日宣布,其开发的ChatGPT平台每周活跃用户数量已突破1亿,有92%的财富500强企业在使用其产品。麦肯锡公司发布的调查显示,79%的受访者在工作中使用过生成式AI工具,其中金融服务业和科技行业的受访者使用频率最高。高盛预测,生成式AI将在未来10年带来7%的全球GDP增长,与此同时,全球超过3亿个就业岗位将受到大语言模型的冲击。“大语言模型技术带来了全球经济生产效率的提升,”张晓燕说。
那么,大语言模型将对金融行业带来哪些影响?张晓燕认为,金融是一个信息和数据高度密集的领域,需要处理很多信息并快速做出决策,同时大量的金融服务也需要语言沟通,“因此大语言模型在金融行业的落地是非常自然的。”从选股、择时、宏观经济预测、政策推演,到风险评估、市场分析、文档处理等等,大语言模型在金融领域有着广泛的应用前景。目前一些金融行业的大型企业正在基于自身的雄厚数据基础,开发金融垂直领域的大语言模型,比如彭博社的BloombergGPT。这类基于垂直领域“语料”训练出的大语言模型,在处理金融专业任务上的表现要比通用模型好很多。当大语言模型发展到一定阶段,或许类似这种从通用走向垂直的发展思路也会在其他行业和领域推而广之。
尽管大语言模型在各行各业具备广泛的应用前景,但是也不能忽视其带来的风险与挑战,例如在数据安全方面,对大语言模型的不当使用可能会导致个人隐私和商业机密泄露;模型输出的内容,存在真实性、公平性、合规性方面的问题。AI工具在金融行业的大规模应用还会带来技术和监管方面的风险。对于现在很多在校学生利用ChatGPT写作业,甚至用它写论文的现象,张晓燕特别提醒说,教育目的是为了让学生培养独立思考的能力、批判性思维和解决问题的能力,对ChatGPT的依赖可能会让学生丧失培养这些能力的机会,这也是一个巨大的挑战。“我们在运用任何AI工具的时候,都应该抱以一个公正客观的态度,对于它的局限性要有清楚的认知。”
在主题分享结束后,张晓燕还围绕大语言模型广泛应用背景下的金融人才培养、金融风控,人力资本发展,给金融市场带来的潜在风险等话题,分享了自己的专业见解和判断。