← Back to Blog

如何自动分类银行交易(2026 指南)

为什么手动分类交易是一场必输的仗?2024–2026 年到底发生了什么,让自动分类终于变得可靠?以及如何免费设置。

10 min readTimur Shagiakhmetovcategorization · ai · how-to

每一个个人理财应用都有一个共同的“秘密问题”:一旦分类开始让人觉得不对劲,人们就会停止使用它。比如把“杂项(Misc)”标成“餐厅(Restaurants)”或把 Square 扣款解析不了、把十个月订阅全都挤进“服务(Service)”——用户就放弃了。做得好的自动分类是财务跟踪器里最重要的功能;做得很差,它就是这些应用失败的原因。

这是 2026 年关于“自动分类交易”的指南:它是什么,为什么早期的解决方案那么差;2024 年和 2025 年发生了什么,让它终于变得可靠;以及如何把它设置为免费或低成本。

“自动分类”到底是什么意思

银行对账单中的每一笔交易其实就是一行数据:日期、商户描述符、金额,有时还有备注(memo)。分类就是给这一行附上有意义的标签——比如杂货、餐饮、交通、订阅、收入、转账——这样你才能按类别汇总消费、围绕它制定预算,并发现异常。

手动分类能处理前 30 笔交易,但超过之后就不再可行。一个典型家庭每月在所有卡和账户上可能产生 80 到 200 笔交易,而商户描述符很少是品牌名本身。例如 “CTV*PARAMOUNT” 对应 Paramount+,“DG*ZWIFT” 对应骑行应用,“TST*REDLOBSTER” 对应 Red Lobster,“PAYPAL *AMAZON” 对应 Amazon。手动做这件事相当于每月一次 30 分钟的家务,但几乎没有人能持续下去。

为什么早期的分类会那么差

在 2024 年之前很主流的个人理财应用 Mint 使用的是基于规则的系统。它会把对账单里的商户描述符匹配到一份人工维护、精心挑选的正则表达式和商户代码列表;新的商户或格式古怪的描述符就会掉进一个通用类别。主要有三个问题:

  • 商户数据库需要人工维护。新品牌、区域性商户,以及“白标”(white-label)的支付处理商会不断把它搞乱。
  • 同一个商户对应的类别依赖上下文。比如 Whole Foods 的一笔 40 美元扣费属于杂货;而同样 40 美元在 Starbucks 属于餐饮;同一家咖啡连锁在公司自助餐厅里扣的一笔 40 美元,可能会被当作工作费用报销。基于规则的系统无法判断这些。
  • 订阅和循环扣费通常由另一个“检测层”处理,但这个检测层经常和分类器互相打架。比如每月 Spotify 扣费,可能在一个页面是“音乐(Music)”,在另一个页面则被当成“订阅(Subscriptions)”。

2024–2026 年到底发生了什么

两个方面结合在一起:

用于分类的“大语言模型”

到 2024 年末,语言模型已经便宜且足够准确,能以近似人类的精度逐笔完成交易分类。一个读过大部分公开互联网内容的模型知道: “CTV*PARAMOUNT” 是 Paramount+ 且属于流媒体订阅;“TST*” 描述符是餐厅的收银系统;“USPS”代表物流/邮寄;而周六早上在 Whole Foods 发生的 40 美元扣费,更可能是杂货而不是办公室费用。

关键是:语言模型还能利用上下文——比如同一商户出现的频率、该商户通常对应的金额区间,以及你过去如何手动覆盖(override)分类。

用于解析 PDF 对账单的 OCR

银行对账单的格式在不同国家、不同银行和不同账户类型之间差异巨大。早期的分类器需要 CSV 导出,但很多小银行没有 CSV,国外银行的对账单也经常拿不到 CSV。现代的 AI 驱动解析器可以直接从 PDF 抽取结构化数据,包括跨多列的版式、关于费用的脚注,以及会在跨页时“绕来绕去”的表格。

把两者结合起来,你第一次获得了端到端的自动化:把一份对账单 PDF 投进去,就能拿回一份完整分类后的交易列表,并且能检测订阅、标出循环扣费(包括按季度、按年那类月度跟踪器常会漏掉的情况)。

2026 年如何设置自动分类

选项 A:连接银行聚合器应用(Plaid)

像 Monarch Money、Copilot Money 和 YNAB 这样的应用会使用 Plaid 来自动拉取交易。每个账户的设置大约需要 5 分钟。连接后,交易会每天出现,应用会在导入时对它们进行分类。质量因应用而异——有些应用仍然严重依赖基于规则的逻辑——但目前最好的几款出厂就能做到大约 90% 的准确率。

代价在于隐私:你需要把银行登录信息交给第三方聚合器。聚合器的安全记录不错,但如果你希望银行凭据在银行之外任何地方都不被暴露,那么这就完全行不通。

选项 B:把对账单上传给 AI 跟踪器

MyVault 是最简单的“不使用聚合器”的选择:从你银行的网站下载 PDF 或 CSV 对账单,上传之后,AI 会在一分钟内完成全部分类。任何步骤都不会涉及银行凭据。你上传的文件,就是你报税季下载的那份文件。免费档可以覆盖大多数轻度用户。

选项 C:用电子表格 + AI 助手自己做

如果你偏爱 DIY,并且只有一到两个简单账户,那么电子表格加上一条 AI 提示词就能做掉大部分工作。把交易导出为 CSV,粘贴到 ChatGPT 或 Claude,并向它发送一个要求“按类别分类”的提示,然后接受结果。它适用于一次性审计,但作为每月工作流会比较脆弱。

如何让任何分类器变得更好

没有任何自动分类器能在第一次就做到完美。随着时间,你可以用一些习惯明显提高质量:

  • 选择少量、稳定的类别列表。12 到 15 个类别比 50 个要好得多。类别越多,你越有更多机会“和自己意见不一致”。
  • 只要发现分类错误,就要纠正——即便你并不在意那笔特定交易。现代分类器会从你的修正中学习:只纠正一次 Spotify 扣费,就等于让模型知道你所有 Spotify 扣费接下来都应该在同一个位置。
  • 为含糊商户设定规则。Amazon、PayPal 和 Venmo 是最常出错的三类——你可能会在 Amazon 上买杂货、电子产品、书籍和礼物。要么给它们单独一个“兜底”类别,要么接受你之后可能需要手动重新分类。
  • 把转账归为“转账”,而不是“收入”或“支出”。如果你把从支票账户转到储蓄账户当作一边是收入、一边是支出来处理,那么总额会被重复计算(double-count)。

好的分类究竟能解锁什么

当交易能被可靠地分类,你终于可以回答那些真正重要的问题:我在餐饮上到底花了多少,而不是杂货?收入里有多少比例被用在订阅上?每月交通预算是在上升吗?我这次度假总共花了多少钱。那些数字回头看很明显,但没有分类它们是看不到的;而它们正是每一个真正好用预算的基础。

试试 MyVault 免费——上传一份银行对账单,看看支出会不会自动分类出来。无需银行登录。 MyVault