Cách tự động phân loại giao dịch ngân hàng (Hướng dẫn 2026)
Vì sao phân loại giao dịch thủ công là một trận thua, điều gì đã thay đổi trong 2024–2026 để phân loại tự động trở nên đáng tin cậy và cách thiết lập để dùng miễn phí.
Mọi ứng dụng tài chính cá nhân, không ngoại lệ, đều có một vấn đề “bí mật”: khi việc phân loại bắt đầu cảm thấy sai, người dùng sẽ ngừng sử dụng. Một khoản phí được gắn nhãn “Misc” nhưng đúng ra phải là “Restaurants”, một khoản phí Square mà ứng dụng không thể giải mã, mười tháng phí đăng ký bị dồn vào “Service” — và người dùng bỏ cuộc. Làm tốt, phân loại tự động chính là tính năng quan trọng nhất của một trình theo dõi tài chính. Làm tệ, nó chính là lý do khiến các ứng dụng này thất bại.
Đây là hướng dẫn cho năm 2026 về phân loại giao dịch tự động: nó là gì, vì sao các giải pháp trước đó lại tệ đến vậy, điều gì đã thay đổi vào 2024 và 2025 khiến cuối cùng nó đáng tin cậy và cách thiết lập để dùng miễn phí hoặc chi phí thấp.
“Phân loại tự động” thực sự nghĩa là gì
Mỗi giao dịch trên sao kê ngân hàng là một dòng dữ liệu: ngày, mô tả đơn vị bán, số tiền, đôi khi có thêm ghi chú. Phân loại là quá trình gán cho dòng đó một nhãn có ý nghĩa — Tạp hóa, Ăn uống, Phương tiện đi lại, Gói đăng ký, Thu nhập, Chuyển khoản — để bạn có thể cộng chi tiêu theo từng danh mục, tạo ngân sách dựa trên đó và nhận ra bất thường.
Phân loại thủ công có thể hoạt động cho 30 giao dịch đầu, nhưng sau đó sẽ không còn đúng nữa. Một hộ gia đình điển hình tạo ra khoảng 80 đến 200 giao dịch mỗi tháng trên tất cả thẻ và tài khoản, và mô tả đơn vị bán hiếm khi trùng với tên thương hiệu — “CTV*PARAMOUNT” cho Paramount+, “DG*ZWIFT” cho ứng dụng đạp xe, “TST*REDLOBSTER” cho Red Lobster, “PAYPAL *AMAZON” cho Amazon. Làm thủ công là một việc cần khoảng 30 phút mỗi tháng mà gần như không ai duy trì được.
Vì sao phân loại tự động trước đó lại tệ
Mint — ứng dụng tài chính cá nhân thống trị trước năm 2024 — dùng hệ thống theo luật (rules-based). Mã mô tả đơn vị bán hàng trên sao kê được đối chiếu với danh sách biểu thức chính quy và mã đơn vị bán đã được con người dày công tạo. Các đơn vị mới hoặc mô tả hiển thị kỳ lạ sẽ rơi vào một danh mục chung. Có ba vấn đề:
- Cơ sở dữ liệu đơn vị bán hàng phải được cập nhật thủ công. Các thương hiệu mới, doanh nghiệp theo vùng và các bộ xử lý thanh toán “trắng nhãn” thường làm nó “bối rối” liên tục.
- Danh mục của một đơn vị bán phụ thuộc vào ngữ cảnh. Khoản phí 40$ ở Whole Foods là tạp hóa; khoản 40$ ở Starbucks là ăn uống; khoản 40$ ở chuỗi cà phê đó trong căng tin công ty có thể được hoàn lại như một khoản chi phí công việc. Hệ thống theo luật không thể biết được.
- Các gói đăng ký và khoản phí lặp lại được xử lý bằng một lớp phát hiện riêng, thường lại mâu thuẫn với phần phân loại danh mục. Một khoản phí Spotify hàng tháng có thể hiển thị thành cả “Music” và “Subscriptions” tùy bạn xem ở màn hình nào.
Điều gì đã thay đổi trong giai đoạn 2024–2026
Hai thứ kết hợp với nhau:
Mô hình ngôn ngữ lớn (LLM) cho phân loại
Vào cuối năm 2024, mô hình ngôn ngữ đã trở nên đủ rẻ và đủ chính xác để phân loại giao dịch từng cái một với độ gần sát như con người. Một mô hình đã đọc phần lớn internet công khai sẽ biết rằng “CTV*PARAMOUNT” là Paramount+ và là một gói streaming; các mô tả “TST*” là điểm bán hàng cho nhà hàng; “USPS” là vận chuyển; và một khoản phí 40$ ở Whole Foods vào sáng thứ Bảy có khả năng là tạp hóa nhiều hơn là chi phí văn phòng.
Điểm quan trọng là mô hình ngôn ngữ cũng có thể dùng ngữ cảnh: đơn vị đó xuất hiện thường xuyên thế nào, dải số tiền thường gặp cho đơn vị đó, và người dùng trước đây đã chỉnh sửa/override phân loại ra sao.
OCR cho các sao kê PDF
Định dạng sao kê ngân hàng khác nhau rất lớn giữa các quốc gia, ngân hàng và loại tài khoản. Các bộ phân loại cũ thường cần xuất CSV, thứ không có sẵn ở nhiều ngân hàng nhỏ và với sao kê từ ngân hàng nước ngoài. Bộ phân tích AI hiện đại có thể trích xuất dữ liệu có cấu trúc trực tiếp từ PDF, bao gồm cả bố cục nhiều cột, ghi chú về phí ở dưới trang, và các bảng bị “gãy” khó hiểu qua nhiều trang.
Kết hợp hai yếu tố này, lần đầu tiên bạn có được sự tự động hóa đầu-cuối: thả vào một sao kê PDF, nhận lại một danh sách giao dịch đã phân loại hoàn chỉnh, trong đó gói đăng ký được phát hiện và khoản phí lặp lại được gắn cờ.
Cách thiết lập phân loại tự động trong năm 2026
Phương án A: kết nối ứng dụng bộ tổng hợp ngân hàng (Plaid)
Các ứng dụng như Monarch Money, Copilot Money và YNAB dùng Plaid để kéo giao dịch tự động. Thiết lập mất khoảng 5 phút mỗi tài khoản. Khi kết nối xong, giao dịch sẽ xuất hiện hằng ngày và ứng dụng sẽ phân loại chúng ngay khi nhập. Chất lượng khác nhau — một số ứng dụng vẫn dựa nhiều vào logic theo luật — nhưng những ứng dụng tốt nhất hiện nay đã gần 90% chính xác “ngay từ đầu”.
Đổi lại, là bài toán quyền riêng tư: bạn phải cung cấp thông tin đăng nhập ngân hàng cho một bên tổng hợp. Các bộ tổng hợp có hồ sơ bảo mật tốt, nhưng với người dùng không muốn thông tin đăng nhập của họ nằm bất kỳ nơi nào ngoài ngân hàng, thì đây là một điều không thể chấp nhận.
Phương án B: tải sao kê lên một trình theo dõi dùng AI
MyVault là lựa chọn đơn giản nhất không cần bộ tổng hợp: tải một sao kê PDF hoặc CSV từ website ngân hàng của bạn, tải lên và AI phân loại mọi thứ trong dưới một phút. Không có thông tin đăng nhập ngân hàng tham gia ở bất kỳ bước nào — tệp bạn tải lên chính là tệp mà bạn sẽ tải xuống cho mùa làm thuế. Bậc miễn phí dành cho hầu hết người dùng phổ thông.
Phương án C: tự làm với bảng tính và một trợ lý AI
Với người dùng tự làm theo hướng DIY và chỉ có 1–2 tài khoản đơn giản, bảng tính cộng với một prompt AI duy nhất có thể làm phần lớn công việc. Xuất giao dịch ra CSV, dán vào ChatGPT hoặc Claude với một prompt yêu cầu phân loại, rồi chấp nhận kết quả. Cách này phù hợp cho các đợt rà soát một lần nhưng sẽ khá mong manh nếu coi là quy trình hàng tháng.
Làm sao để bất kỳ bộ phân loại nào cũng tốt hơn
Không có bộ phân loại tự động nào hoàn hảo ngay từ lần chạy đầu. Một vài thói quen có thể nâng chất lượng theo thời gian một cách đáng kể:
- Chọn danh sách danh mục nhỏ và ổn định. 12 đến 15 danh mục hoạt động tốt hơn nhiều so với 50. Danh mục càng nhiều thì càng có nhiều cơ hội để bạn tự mâu thuẫn với chính mình.
- Luôn sửa các lỗi phân loại, ngay cả khi bạn không quan tâm nhiều đến chính giao dịch đó. Các bộ phân loại hiện đại học từ các chỉnh sửa của bạn — sửa một lần khoản phí Spotify bị xếp sai sẽ dạy mô hình rằng toàn bộ khoản Spotify của bạn nên ở cùng một nơi trong tương lai.
- Đặt quy tắc cho các đơn vị bán hàng mơ hồ. Amazon, PayPal và Venmo là những kẻ gây rối nhiều nhất — bạn có thể dùng Amazon cho tạp hóa, điện tử, sách và quà tặng. Hoặc bạn tạo một danh mục chung cho riêng chúng, hoặc chấp nhận rằng bạn sẽ cần phân loại lại thủ công.
- Hãy phân loại các khoản chuyển khoản là chuyển khoản, không phải thu nhập hay chi tiêu. Nếu bạn xem một giao dịch chuyển từ tài khoản vãng lai sang tiết kiệm như thu nhập ở một bên và chi tiêu ở bên kia thì tổng số sẽ bị đếm trùng.
Phân loại tốt thật sự mở ra được điều gì
Khi các giao dịch được phân loại đáng tin cậy, bạn cuối cùng có thể trả lời những câu hỏi quan trọng: tôi thực sự chi bao nhiêu cho ăn ngoài so với tạp hóa; tỷ lệ nào trong thu nhập của tôi đi vào gói đăng ký; ngân sách đi lại hằng tháng của tôi có đang tăng lên không; và tôi đã chi cho kỳ nghỉ đó tổng cộng bao nhiêu. Những con số này nhìn thì “hiển nhiên”, nhưng nếu không phân loại thì chúng lại vô hình — và đây là nền tảng của mọi ngân sách thực sự hữu dụng.
Hãy thử MyVault miễn phí — tải lên một sao kê ngân hàng và xem chi tiêu của bạn được phân loại tự động. Không cần đăng nhập ngân hàng. MyVault