近日,在云栖大会,工商银行总行金融科技部副总经理金海旻围绕“工银智涌”大模型技术体系,分享了该行在大模型领域的应用成果。
据了解,该体系涵盖四个方面,具体为千卡规模AI算力底座、大小模型协同算法矩阵、专属金融数据知识工程体系、规模化应用范式解决方案。
在算力建设上,金海旻提及该行的多项进展:模型实例的弹性扩缩容时间从小时级降至分钟级;支持千亿全参模型使用TB级数据二次训练;具备快速适配主流大模型的能力,且已兼容“阿里千问”系列在内的十多种业界主流大模型。
针对大小模型协同算法矩阵,金海旻表示,该行构建了基础模型的测评集和工具平台,用于对引入的基础模型开展测评把关;同时通过强化学习、微调、二次训练等方法,结合业务场景需求,构建多尺寸、多模态、多类型的算法矩阵。此外,该行还参考MOE混合专家门控网络的思路,创建了智能中控模型,该模型可根据任务需求调度不同参数规格的模型。
金海旻指出,高质量数据是打造高质量AI应用的关键。为此,该行以“构建最懂银行的大模型”为目标,形成世界、行业、领域、企业、任务五层知识架构,搭建数据采集、清洗、管理、应用全流程知识工程流水线。同时,通过模型蒸馏、知识合成等方法,生成思维链数据。目前,已建成万亿级token的高质量金融数据集,还借助模型回流数据反哺训练,形成“数据构建-模型迭代”双向促进的正向循环。
为快速构建AI应用,该行提炼了规模化“1+X”应用范式解决方案。其中,“1”为金融智能中枢,采用多智能体协同的框架,支持多级智能体协作网络的构建,能针对复杂金融任务进行拆解、规划与执行,其端到端成功率已超90%;“X”指多种可供智能体直接组装调用的工程化解决方案,常见类型包括知识问答、数据分析、文档编写、API调用等。目前,知识问答的用户满意度通常可达90%,对话式查询准确率能达到95%。
此外,金海旻强调,安全是金融行业的生命线。为此,“工银智涌”搭建起贯穿模型引入、数据标注、模型训练至场景应用的全流程安全防护体系,融合传统网络安全、数据安全与生成式人工智能的内容安全、模型安全。目前,该行已自主构建了安全测评集、敏感词库、正向价值训练集和安全检测的工具集。
依托前述算力、算法、数据、范式、安全等基础支撑,金海旻表示该行已初步探索出大模型在金融行业端到端赋能的实施路径,具体可分为两大层面。
在理论层面,该行提出“两阶六步”金融大模型创新方法论与“3-1-N”基于范式AI规模化转换方法论,以“All in Chat”的理念,实现人工智能从局部应用向端到端业务赋能转变,助力业务模式创新。
在实践层面,该行实施“领航AI+”行动战略,组建科技与业务融合的专项团队,围绕投资交易增效、营销拓客优化、风险防控强化、工作效率提升四大方向推进应用。例如,针对银行图像和视频识别场景,该行推出了商户智能审核助手,突破了传统OCR技术在复杂场景下的局限性与滞后性,提升了识别准确性与处理效率;此外,该行还深度融合通义灵码,为软件工程师打造了AI辅助编程助手,AI生成的代码占比超30%,提升了研发的质量。
截至目前,该行已在金融市场、对公营销等20余个业务领域实现大模型端到端赋能,覆盖超400个场景,打造上千个专业领域智能体,累计调用量达15亿次。
责任编辑:陈爱
免责声明:
中国电子银行网发布的专栏、投稿以及征文相关文章,其文字、图片、视频均来源于作者投稿或转载自相关作品方;如涉及未经许可使用作品的问题,请您优先联系我们(联系邮箱:cebnet@cfca.com.cn,电话:400-880-9888),我们会第一时间核实,谢谢配合。