来源:雪球App,作者: GARP-China,(https://xueqiu.com/4003821804/282885325)
本文编译自GARP风险智库 Technologies主题博客"Pros and Cons of Generative AI: A Quantitative Analysis"一文。Mike van de Graaf是澳大利亚维多利亚财务公司风险执行董事。本文仅代表作者个人观点,不代表TCV 的观点。
人工智能正在改变风险建模的格局。金融机构正在评估他们是否可以通过部署大语言模型(LLM)如ChatGPT等来获得优势,但LLM是否真的比传统建模方法更有效呢?
如今,如果你是一个精通技术的金融机构,你需要评估应用人工智能,特别是像ChatGPT这样的大语言模型(LLMs)的风险和机会。
大语言模型(LLM)是否能够提供更深入的洞察,并进一步提高生产效率?为了找出答案,我对澳大利亚联邦政府债券进行了定量风险分析。我使用了公开可用的数据,并在我的个人电脑上运行了ChatGPT4——OpenAI生成式人工智能技术的最新版本。
我是看看ChatGPT4如何通过无监督的机器学习方法识别收益曲线的聚类。ChatGPT4的语言界面是否有助于从数据集中分离出异常曲线?它与编写程序并手动生成解决方案的传统方法相比如何?哪种方法会更有效率?
应用:ChatGPT4和机器学习
作为第一步,我让ChatGPT4从澳大利亚储备银行的网站中为我收集数据并存入文件。有趣的是,ChatGPT4创建了一个带有模拟利率的文件。它指出替换的原因是“无法访问RBA网站” 。
因此,我不得不手动下载利率。但从这里开始,事情进展得非常迅速。在上传收益数据文件后,我向ChatGPT4发出了以下请求:
[>] 请对 2023 年 3 年期和10 年期逐日收益率走势进行聚类分析。
这个请求并没有解释“收益率”,我也没有告诉系统如何构造逐日的变动。我的初步想法是,这可能对于ChatGPT4来说太过宽泛了。但为什么不从这里开始,看看会发生什么呢?
在对我的请求进行了大约15秒的“分析”后,ChatGPT4出人意料地提供了3年期与10年期收益率走势的聚类和异常值的即时数据,并给出了以下图表:
ChatGPT4 很顺利地通过了这一关。我仔细验证了输出结果,一切正常。因此,我现在有信心提交这个后续请求:
[>] 请提供对2023 年的逐日收益率变动数据的聚类分析,并在图表中绘出由此得出的收益率曲线聚类图。
经过更多的分析和几个步骤,ChatGPT4给出了以下图表:
如上图所示,ChatGPT4 绘制出的图形是正确的,因为我们预期共同的走势是"平行 "的,即在整个期限内收益率曲线的走势大致相同。将这些与我创建的单独图形进行比较,我验证了输出结果。(这些聚类图线代表了相关风险计量的情景分析)。
当然,我们知道 "风险存在于尾部",所以我也对一些不平行的日线图形(出现概率较低的日线图形)很感兴趣。例如,曲线中的扭曲部分,即短期和长期之间的移动变化。为了进一步了解尾部风险,我向ChatGPT4 提交了以下请求:
[>] 请绘制 2 年期和 10 年期差异最大且过零的日收益率曲线。
在分析了我的问题后,ChatGPT4 制作了一张图表,该图表描述了最大的差异,但它的两年点和10 年点都是负数。它并没有围绕零点旋转,因此是错误的。此外,它只绘制了两年期和 10 年期的点。为了解决这些问题,我对我的问题进行了提示设计,ChatGPT4 回复了以下图表:
这一次,系统的分析是正确的。ChatGPT4 生成的2020-2023 年期间 "严重但可信"的扭曲情景可用于任何类型的相关分析。当然,也可以根据数据生成类似的情景,在不同的经济和利率周期中建立自己的曲线。
Python and SciKit: 基准
作为本次比较练习的基准,我使用了 Python 3.12 编程语言。为了快速解决Python 中的一些数据结构例程并设置我的编码环境,我得到了 ChatGPT 3.5 的帮助。这些内容在 Python 手册中都有介绍,但手册已经过时了!
这使我能够使用开源库来加速各种任务,如读取输入数据文件和转换文件格式。我还使用了 SciKit 库,该库拥有大量机器学习模型,包括我通过Kmeans 算法对收益率曲线进行聚类所需的无监督 ML 模型。
从开始到结束大约六个小时,我就能够对数据进行聚类分析、显示图表和中心点,以及用 Python 生成包含结果的数组。我感受到编程的成就感与过去截然不同。
进一步的想法
回到本次练习的初衷,哪种方法更有效?ChatGPT4 在一次持续了整整五分钟的对话中完成了6 小时的 Python 工作。生产力提高了 72 倍!
显然,我确实需要再次加快编程速度,但使用 ChatGPT4 根本不需要编写任何代码。ChatGPT4 生成了代码供我查看和复制,以防万一我将来想使用它。
任何有关人工智能的结论都必须以 "现阶段"为前提。正如我们所看到的,在模型原型设计阶段,大语言模型(LLM )已能显著提高生产率。但是,大型科技公司用于构建和训练最大型人工智能模型的计算和数据集也在以指数级的速度提高。
要充分发挥大语言模型( LLM )的作用,需要综合运用各种技能。数据科学家与经验丰富的风险经理(如金融风险管理师- FRM持证人)之间的合作可以带来巨大的收益。
大语言模型(LLM)仍然需要得到正确的解决方案的提示,并且必须接受局限性测试。生成式人工智能模型的结果也必须经过人工的验证。换句话说,对人工智能增强型风险解决方案的开发和实施提供适当的治理仍然至关重要。
生成式人工智能的未来已经到来,其优势显而易见。虽然有些人可能仍然对这种先进技术的风险持谨慎态度,但领先的金融机构至少会对其进行尝试,因为他们明白,要帮助人工智能做出决策,仍然非常需要人类的智慧。
获得全球领先的FRM®认证,成为备受青睐的金融风险经理。