บทความภายใน/วิชาสัมมนา
ข้อมูลนักศึกษา
- ชื่อ-นามสกุล
- นางสาวนภัสสรณ์ วุฒิโรจน์รังษี
- รหัสนักศึกษา
- 166490431001
- หลักสูตร
- เทคโนโลยีดิจิทัลมีเดีย
- รุ่น
- 2566
วันที่กิจกรรม
20 กุมภาพันธ์ 2569 15:05
วันที่บันทึก
20 กุมภาพันธ์ 2569 09:47
ชื่อบทความ
ระบบอัจฉริยะสำหรับการจัดหมวดหมู่บัญชีอัตโนมัติจากข้อมูลใบกำกับภาษีด้วยปัญญาประดิษฐ์
รายละเอียด
งานวิจัยนี้มีวัตถุประสงค์เพื่อพัฒนาและประเมินระบบอัจฉริยะสำหรับการสกัดข้อมูลจากเอกสารใบกำกับภาษีและการจัดหมวดหมู่บัญชีอัตโนมัติ โดยมุ่งเปรียบเทียบประสิทธิภาพของเทคนิคการสกัดข้อมูลสองแนวทาง ได้แก่ การรู้จำอักขระด้วยแสงแบบดั้งเดิม (Optical Character Recognition - OCR) และการใช้แบบจำลองภาษาขนาดใหญ่ (Large Language Model - LLM) ภายใต้กรอบโครงสร้างข้อมูลมาตรฐานในรูปแบบ JSON ที่กำหนดโดยผู้วิจัย กระบวนการวิจัยเริ่มจากการรับเอกสารในรูปแบบภาพหรือ PDF และปรับปรุงคุณภาพภาพก่อนเข้าสู่ขั้นตอนการสกัดข้อมูล โดยแนวทาง OCR ใช้การแปลงข้อความร่วมกับกฎเชิงคำสำคัญเพื่อดึงข้อมูล ส่วนแนวทาง LLM ใช้การประมวลผลเชิงความหมายเพื่อสร้างข้อมูลเชิงโครงสร้างตาม JSON ที่กำหนด ผลลัพธ์จากทั้งสองแนวทางถูกนำมาเปรียบเทียบกับข้อมูลอ้างอิงที่ตรวจสอบโดยผู้เชี่ยวชาญ เพื่อประเมินประสิทธิภาพด้วยตัวชี้วัด Accuracy, Precision, Recall และ F1-score ผลการวิจัยคาดว่าจะช่วยให้เข้าใจข้อดีและข้อจำกัดของแต่ละเทคนิคในการสกัดข้อมูลภาษาไทยจากเอกสารที่มีรูปแบบหลากหลาย และสนับสนุนการพัฒนาระบบต้นแบบที่สามารถนำไปประยุกต์ใช้ในงานบัญชีดิจิทัลได้อย่างมีประสิทธิภาพ คำสำคัญ ระบบอัจฉริยะ การจัดหมวดหมู่บัญชีอัตโนมัติ ข้อมูลใบกำกับภาษี โมเดลภาษาขนาดใหญ่