AFAC2026金融智能大赛开赛:四道真实场景题,探路AI落地金融
AFAC2026金融智能创新大赛启动,设置四道来自真实金融场景的赛题,包括交易行为识别、复杂文档还原、稀疏反馈自动化实验和金融长文本高效问答。大赛强调回归基础研究,探索Agent在产业约束下的实际价值,吸引产学研共同参与,为金融AI落地提供实战沙盒。
事件概述
AFAC2026金融智能创新大赛(简称AFAC2026)正式开赛。大赛由中国计算机学会、北京大学、蚂蚁集团、NVIDIA等近30家机构联合发起,自2023年首届举办以来已累计吸引超1.5万支队伍、近5万名选手。今年挑战组设置四道赛题,全部源自真实金融业务场景,旨在探索大模型在产业约束下交付实际价值的能力。
核心赛题
赛题一:市场参与者交易行为识别与资金流向分析
要求选手利用harness框架,从L2行情数据中识别机构交易行为意图,如挂单、撤单、拆单背后的真实目的。出题方认为,资金识别不仅靠数学,还需理解博弈与人性;大模型可帮助发现人类未总结的隐含模式,但需借助工程手段处理海量高频数据,避免撑爆模型上下文。该赛题不强调成本优化——若策略有效,潜在收益可让成本显得微不足道。
赛题二:复杂金融文档还原挑战
设计端到端文档解析系统,将金融文档图片(如保险PDF)完整、准确、有结构地转换为Markdown。难点在于超大图、密集表格、多级标题和超长文档。蚂蚁集团提供了专门优化的多模态模型FinixDoc-VL(基于Qwen3-VL 4B级别),配套开源的FinixDocBench评测榜单(综合得分81.43)。出题方强调,拼接解析SOP需像侦探办案般整体性拆解。
赛题三:稀疏反馈下的自动化实验挑战
以金融图学习为沙盒,让Agent在有限预算约束下自动化完成机器学习实验,优化任务表现。出题方指出,金融图学习的搜索空间缺乏连贯语义,通用大模型的语言先验帮助有限;优秀的方案可能来自更精良的3B级专业模型,而非昂贵大API。该赛题考察在Token消耗与性能间寻求极致平衡。
赛题四:金融长文本Agent的动态记忆压缩与高效问答挑战
选手需基于海量金融长文档,实现精准问答,同时将Token消耗纳入评测。难点包括结构复杂(交叉引用、表格、附录)以及高追溯性要求(答案必须可回溯来源)。推荐方案为Agent工程路线:文档预处理→索引构建→题目解析→证据检索→推理作答→校验汇总。出题方强调,B端海量文档调用场景下,Token成本控制是决定落地可行性的关键。
赛事背景与意义
AFAC2026大赛的核心宣言是“全员回归基础研究”,在真实约束下探索Agent如何交付产业价值。出题委员会由蚂蚁集团联合学界专家组成,共享贴近真实业务的数据与沙盒,旨在连接产业与学界。蚂蚁集团副总裁尹俊指出,金融AI落地的难点在于合规、风控与价值证明,但也因此形成自带护城河的赛道,为复合型人才提供差异化竞争力。大赛主办方表示,Agent时代更依赖工程洞见与业务理解,而非纯粹的算力堆砌,当前正处于技术孵化期,研究品味决定了天花板。
相关信息
各赛题报名及详情请访问官方页面:
