智慧發票解析與自動化複式記帳系統:融合 OCR、NLP 與 LLM 的個人財務管理解決方案
成員:陳O靜、陳O軒、張O勝、蕭O宸、陳O、張O學、李O輝
專題網頁:https://ittrainingclub.pse.is/114-7-25-AI
艾鍗官網:https://www.ittraining.com.tw/
聯絡信箱:service@ittraining.com.tw
<專題摘要>
本專題旨在開發一套整合 OCR、自然語言處理與深度學習技術的個人化自動記帳系統,解決傳統記帳手動輸入與分類耗時的問題。系統核心功能包含紙本與電子發票的辨識、資訊擷取、語意分類及複式記帳格式的自動生成。
在發票辨識階段,系統採用 YOLOv11 進行紙本發票的定位與切割,並以 Tesseract OCR 擷取日期、金額、品項等關鍵欄位。對於電子發票,則解析 QR Code 中的標準欄位與商品明細。所有資訊將經過標準化與結構化處理。
在分類階段,系統引入兩種語意理解策略:其一為 Few-shot Learning,利用Sentence-BERT 對品項名稱進行語意嵌入,結合 KNN 分類器對應至預設會計科目;其二為 Zero-shot Learning,透過 MobileBERT直接生成對應分類,增強模型對新類型品項的泛化能力。系統亦可查詢統一編號對應之行業別,輔助分類邏輯。最終資料將輸出至 Google Sheets,以複式記帳格式自動記錄,提供高效率、低錯誤率的個人財務管理新方案。