AFAC2026金融智能大赛开赛：四道真实场景题，探路AI落地金融

2026/07/01 15:41阅读量 2

AFAC2026金融智能创新大赛启动，设置四道来自真实金融场景的赛题，包括交易行为识别、复杂文档还原、稀疏反馈自动化实验和金融长文本高效问答。大赛强调回归基础研究，探索Agent在产业约束下的实际价值，吸引产学研共同参与，为金融AI落地提供实战沙盒。

事件概述

AFAC2026金融智能创新大赛（简称AFAC2026）正式开赛。大赛由中国计算机学会、北京大学、蚂蚁集团、NVIDIA等近30家机构联合发起，自2023年首届举办以来已累计吸引超1.5万支队伍、近5万名选手。今年挑战组设置四道赛题，全部源自真实金融业务场景，旨在探索大模型在产业约束下交付实际价值的能力。

核心赛题

赛题一：市场参与者交易行为识别与资金流向分析

要求选手利用harness框架，从L2行情数据中识别机构交易行为意图，如挂单、撤单、拆单背后的真实目的。出题方认为，资金识别不仅靠数学，还需理解博弈与人性；大模型可帮助发现人类未总结的隐含模式，但需借助工程手段处理海量高频数据，避免撑爆模型上下文。该赛题不强调成本优化——若策略有效，潜在收益可让成本显得微不足道。

赛题二：复杂金融文档还原挑战

设计端到端文档解析系统，将金融文档图片（如保险PDF）完整、准确、有结构地转换为Markdown。难点在于超大图、密集表格、多级标题和超长文档。蚂蚁集团提供了专门优化的多模态模型FinixDoc-VL（基于Qwen3-VL 4B级别），配套开源的FinixDocBench评测榜单（综合得分81.43）。出题方强调，拼接解析SOP需像侦探办案般整体性拆解。

赛题三：稀疏反馈下的自动化实验挑战

以金融图学习为沙盒，让Agent在有限预算约束下自动化完成机器学习实验，优化任务表现。出题方指出，金融图学习的搜索空间缺乏连贯语义，通用大模型的语言先验帮助有限；优秀的方案可能来自更精良的3B级专业模型，而非昂贵大API。该赛题考察在Token消耗与性能间寻求极致平衡。

赛题四：金融长文本Agent的动态记忆压缩与高效问答挑战

选手需基于海量金融长文档，实现精准问答，同时将Token消耗纳入评测。难点包括结构复杂（交叉引用、表格、附录）以及高追溯性要求（答案必须可回溯来源）。推荐方案为Agent工程路线：文档预处理→索引构建→题目解析→证据检索→推理作答→校验汇总。出题方强调，B端海量文档调用场景下，Token成本控制是决定落地可行性的关键。

赛事背景与意义

AFAC2026大赛的核心宣言是“全员回归基础研究”，在真实约束下探索Agent如何交付产业价值。出题委员会由蚂蚁集团联合学界专家组成，共享贴近真实业务的数据与沙盒，旨在连接产业与学界。蚂蚁集团副总裁尹俊指出，金融AI落地的难点在于合规、风控与价值证明，但也因此形成自带护城河的赛道，为复合型人才提供差异化竞争力。大赛主办方表示，Agent时代更依赖工程洞见与业务理解，而非纯粹的算力堆砌，当前正处于技术孵化期，研究品味决定了天花板。