分析师:AI目前还写不出高质量的分析研报 - FT中文网
登录×
电子邮件/用户名
密码
记住我
请输入邮箱和密码进行绑定操作:
请输入手机号码,通过短信验证(目前仅支持中国大陆地区的手机号):
请您阅读我们的用户注册协议隐私权保护政策,点击下方按钮即视为您接受。
为了第一时间为您呈现此信息,中文内容为AI翻译,仅供参考。
FT商学院

分析师:AI目前还写不出高质量的分析研报

据伯恩斯坦研究所称,金融机器人错误太多、缺乏预测能力,而且往往忽视整体大局。

也许有一天,卖方研究部门会像斯坦利•库布里克(Stanley Kubrick)的《2001太空漫游》中“发现一号”的内部那样:没有办公桌,通体白色、极简。里头坐着一台类似“哈尔”(HAL)的服务器,只要一声令下,便可提供关于XYZ.com未来三年财务前景的报告。

FTAV 等人已经反复讨论过 AI 是否能取代勤奋工作的伦敦金融城分析师(程序员也有类似讨论)。总体而言,大家对他们的前景多持悲观看法,更别提金融记者了。

但如果让AI模型分析一家企业或一个行业、构建预测性财务模型并撰写研究报告呢?伯恩斯坦(Bernstein)与法国兴业银行(Société Générale)对此进行了测试。AI模型起初表现不错,但随后一切变得有些混乱。

由印度研究部主管韦努戈帕尔•加雷(Venugopal Garre)领衔的伯恩斯坦团队首先得决定采用哪些模型:

我们梳理了市面上一大批AI工具,挑选出最常用的那些,同时也纳入了一些相对小众的产品。常见的候选包括谷歌Gemini、Grok 和 ChatGPT,我们还加入了 Perplexity、微软(Microsoft)的Copilot、Claude、Meta AI、深度求索(DeepSeek),以及其他一些工具(包括面向金融领域的垂直大型语言模型)。

加雷通过各种测试,力图模拟股票分析师的思维过程,并按其“类人”特质为之打分。AI能否不仅从公开数据(包括财报电话会议记录)中提取信息,还能将其加以综合并作出判断?团队想看看ChatGPT、Gemini或其他模型是否能构建用于预测结果的财务模型,并为某家公司撰写首次覆盖报告。

接着,加雷设计了一系列测试,包含基础版和进阶版,先从在未向这些 AI 提供任何信息的情况下进行的“搜索并返回”任务开始。

在这一阶段,当模型为展示而提取公开数据时,一切进展总体顺利。尽管在分类上出现了一些小问题,导致AI回答之间不一致,但总体而言,他发现AI模型在生成财务数据图表方面表现不错。

例如,Grok 为印度公司迪克森科技(Dixon Technologies)制作了一张带双坐标轴的精美交互式图表。

大型语言模型擅长从海量文本中挖掘有用信息,甚至能洞察任一主题随时间的语气变化。为特定公司上传三年期的季度财报电话会议实录后,这款AI工具被要求列出所有投资者担忧,并在另一项任务中给出管理层应对这些担忧的评分。总体而言,它们表现良好。而在按管理层回答问题的自信度来评估管理质量时,Gemini“尤为突出”。

此后,情况开始有些走样。画漂亮的图、判断财报电话会的基调,只占分析师工作的一小部分。只有结合大量数据与自身经验,做出长期行业预测,分析师才能构建用于前瞻性预估的关键财务模型。

这类提示实在难以应对:

以卖方分析师身份对股票xyz发起首次覆盖,给出评级(买入、持有或卖出)及其理由。提供每股收益(EPS)预测、目标价及其测算依据。(已提供财报电话会议纪要与财务数据,以及公司所属行业信息)

基于ABC行业某家公司的财务数据与业务拆分,请构建一个基础模型,列出可调整的关键驱动因素,用于预测未来两年的收益。(已提供该公司过去十年的财务数据)

尽管输入了相关数据并多次优化提示,这些模型仍然返回错误信息和漏洞百出的电子表格。“在建模方面,AI 彻底失败了,”加雷对我说。“会计中的细微差别太多,而且各国之间差异很大。”人类能理解这些,但计算机要掌握这些微妙之处需要大量学习。

大多数 AI 工具根本无法建立模型。经过反复引导,Gemini 倒是给出了一些用 Python 构建财务模型的代码,但仍因报错而无法运行。对于那些确实设法做出了模型的工具,加雷表示,它们几乎没有可预测性。

最终,无论加雷提供了多少数据和提示,十余个模型都无法对公司的前景作出恰当分析。公司的首次覆盖报告深度仍然不足。

人工智能也无法恰当地评估管理举措的结果,例如与中国公司成立合资企业这一举动所涉及的各种地缘政治考量。

该组的整体平均分表现不佳。AI乐观派会念叨他们的口头禅:这些模型只会越来越好。现实派则会说,AI就像Excel,只能提升生产力——而这已足以带来改变。

卖方分析师——公平地说,加雷也希望他们继续留在场内——多少会感到些许安慰。

版权声明:本文版权归FT中文网所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。

为AI编程“抓虫”的初创企业获得投资者青睐

随着AI生成软件的激增,简街集团领投测试公司Antithesis的1.05亿美元融资。

科技行业内部加速采用AI

公司先在自己内部试用最新工具,以便想潜在客户展示其潜力。
18分钟前

学生热情拥抱人工智能,学校却持谨慎态度

出于对作弊及对人工智能削弱批判性思考的担忧,教育机构正采取更为谨慎的做法。

下一款重磅药会来自中国吗?

在创纪录投资和供应链改善的推动下,中国生物制药行业正在蓬勃发展。

想让智利再次伟大的强硬派

何塞•安东尼奥•卡斯特迎合了选民对犯罪和移民问题的愤怒情绪。如果当选,他将成为智利35年民主史上最右翼的总统。

FT社评:印度劳动法的重磅改革

印度劳动法改革虽然可能造成短期成本,但从长远来看将通过更好地利用近10亿适龄劳动人口为其发展打下坚实基础。
设置字号×
最小
较小
默认
较大
最大
分享×