近期,多家金融机构公布大模型招投标信息。10月10日,工商银行披露了该行软件开发中心“NLP大模型产品新技术采购项目”入围信息。10月23日,招商银行也披露了“招商银行预训练基础大语言模型采购项目”结果。此外,建行、邮储等银行也于近期披露了与大模型相关的项目或招投标结果。
大模型是一种用于处理自然语言信息的大型人工智能模型。近年来,伴随着生成式人工智能在全球的迅速发展,我国相关创新和应用步伐加快,其在金融领域的价值潜力也被普遍看好。业内专家认为,金融行业数据资源丰富、场景多元,拥有与大模型深度结合的前景。
“当前,大模型在金融业的应用仍处于起步阶段。”中关村科金技术副总裁张杰表示,眼下大模型在金融业的尝试仍以服务于内部需求为主,在此基础上再逐渐建立属于自己的体系。对于大模型在金融业的应用,业内人士认为,大模型可以读懂财经报道,读懂分析师撰写的年报等,并从这些内容里提炼出事实、事件和观点等,最后根据客户的个性化需求,有针对性地迅速生成专业性文章。
近期,有多家公司发布了可用于金融场景的大模型,如中关村科金发布了国内首个企业知识大模型。在国际上,美国彭博社推出的大模型,涵盖了3630亿词的金融文本和3450亿词的通用文本。在业内看来,这样大体量的金融知识库是在金融领域较为领先的尝试。
清华大学人工智能研究院常务副院长、欧洲科学院外籍院士孙茂松表示,未来我国金融领域不能没有大模型。据介绍,金融大模型属于垂直领域大模型,对算力和算法要求相对较低,但对金融专业知识和数据的要求较高。“通用基础大模型对数字不太敏感,但金融业对数字的精准性要求很高,而且图表较多。”孙茂松表示,这些问题需要逐步解决。另外,当前大模型主要基于文本,但在行业领域,知识图谱更靠谱。如何将知识图谱在大模型的通用领域和专业领域的应用有机结合起来,仍然需要更多的研究和技术。
业内人士认为,企业在引入大模型或搭建企业知识中台的时候,可以用两种技术路线来组合:一种是领域大模型技术,另一种是外挂知识库技术。张杰建议,企业可以分三个步骤逐步开展。第一步在基础大模型之上,针对具体应用场景搭建场景提示工程,快速进行技术验证。第二步建立企业知识库,通过基础大模型、外挂企业知识库,再在具体场景下调整提示词,进而解决大模型事实问题回答不好的“幻觉”问题。第三步成本较高,但能在具体的场景下把性能做到极致并开发出增量应用,即把领域知识注入大模型中形成领域大模型,同时把上层提示工程上升为人工智能应用开发平台。