A21 Labs เสนอแนวทาง S-RAG แปลงเอกสารไม่มีโครงสร้างเป็นตารางก่อน เพื่อให้คิวรีได้ง่าย
Body
AI21 Labs บริษัทปัญญาประดิษฐ์จากฝั่งอิสราเอล ผู้สร้างโมเดลปัญญาประดิษฐ์ LLM ตระกูล Jurassic นำเสนอแนวทางการใช้เอกสารภายในมาตอบคำถาม (Retrieval-Augmented Generation - RAG) โดยมีแนวทางคือการแปลงข้อมูลที่ได้จากเอกสารต่างๆ ในองค์กรมาเป็นตารางฐานข้อมูลให้คิวรีได้ เรียกว่า Structured RAG หรือ S-RAG
S-RAG ต้องการตัวอย่างคำถามระหว่างการใส่เอกสาร เพื่อให้ปัญญาประดิษฐ์วิเคราะห์ได้ว่าควรดึงข้อมูลอะไรออกมาใส่ตาราง จากนั้นเมื่อผู้ใช้ถามคำถามจริงก็จะดึงข้อมูลจากตารางรูปแบบเดียวกับการแปลงคำถามเป็น SQL เดิมๆ
AI21 Labs ระบุว่าเทคนิค RAG แบบ embedding แบบเดิมๆ นั้นตอบคำถามหลายประเภทได้ไม่ดี โดยเฉพาะด้านการเงินและการกำกับดูแลต่างๆ เช่น ยอดเงินลงทุนของบริษัทในเครือทั้งหมด, หรือจำนวนครั้งที่เกิดอุบัติเหตุในโรงงาน การทำ embedding เอกสารแต่ละชุดไปตรงๆ ไม่สามารถสรุปยอดรวมออกมาได้
กรณีที่ S-RAG ทำงานได้ดีมากๆ คือคำถามเกี่ยวกับเอกสารค่อนข้างใช้บ่อยและตรงกันทุกเอกสาร เช่น รายงานทางการเงินก็มักดูรายได้และผลกำไร แต่ถ้าคำถามเจาะจงบางส่วนลงไป S-RAG ก็จะคิวรีเอกสารที่เกี่ยวข้องแล้วใช้การค้นหาแบบเดิมๆ ต่อไป
ที่มา - AI21 Labs
lew Sun, 16/11/2025 - 22:19
Continue reading...
Body
AI21 Labs บริษัทปัญญาประดิษฐ์จากฝั่งอิสราเอล ผู้สร้างโมเดลปัญญาประดิษฐ์ LLM ตระกูล Jurassic นำเสนอแนวทางการใช้เอกสารภายในมาตอบคำถาม (Retrieval-Augmented Generation - RAG) โดยมีแนวทางคือการแปลงข้อมูลที่ได้จากเอกสารต่างๆ ในองค์กรมาเป็นตารางฐานข้อมูลให้คิวรีได้ เรียกว่า Structured RAG หรือ S-RAG
S-RAG ต้องการตัวอย่างคำถามระหว่างการใส่เอกสาร เพื่อให้ปัญญาประดิษฐ์วิเคราะห์ได้ว่าควรดึงข้อมูลอะไรออกมาใส่ตาราง จากนั้นเมื่อผู้ใช้ถามคำถามจริงก็จะดึงข้อมูลจากตารางรูปแบบเดียวกับการแปลงคำถามเป็น SQL เดิมๆ
AI21 Labs ระบุว่าเทคนิค RAG แบบ embedding แบบเดิมๆ นั้นตอบคำถามหลายประเภทได้ไม่ดี โดยเฉพาะด้านการเงินและการกำกับดูแลต่างๆ เช่น ยอดเงินลงทุนของบริษัทในเครือทั้งหมด, หรือจำนวนครั้งที่เกิดอุบัติเหตุในโรงงาน การทำ embedding เอกสารแต่ละชุดไปตรงๆ ไม่สามารถสรุปยอดรวมออกมาได้
กรณีที่ S-RAG ทำงานได้ดีมากๆ คือคำถามเกี่ยวกับเอกสารค่อนข้างใช้บ่อยและตรงกันทุกเอกสาร เช่น รายงานทางการเงินก็มักดูรายได้และผลกำไร แต่ถ้าคำถามเจาะจงบางส่วนลงไป S-RAG ก็จะคิวรีเอกสารที่เกี่ยวข้องแล้วใช้การค้นหาแบบเดิมๆ ต่อไป
ที่มา - AI21 Labs
lew Sun, 16/11/2025 - 22:19
Continue reading...