กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


News

news Typhoon เปิดตัวโมเดล OCR สำหรับดึงข้อมูลจากเอกสารและรูปภาพ รองรับภาษาไทยและอังกฤษ

News 

Active member

Staff member
Moderator
Collaborate
Typhoon เปิดตัวโมเดล OCR สำหรับดึงข้อมูลจากเอกสารและรูปภาพ รองรับภาษาไทยและอังกฤษ
Body

ทีม Typhoon จาก SCB 10X เปิดตัวโมเดล OCR สำหรับดึงข้อมูลจากรูปภาพและเอกสาร PDF ชื่อ Typhoon OCR ชูจุดเด่นเข้าใจทั้งภาษาไทยและภาษาอังกฤษ โดยมีประสิทธิภาพในภาษาไทยที่เหนือกว่า GPT-4o และ Gemini 2.5 Flash

โดยเบื้องหลังใช้สถาปัตยกรรมเป็น Vision Language Model (VLM) ซึ่งเข้าใจทั้งภาษาและรูปภาพ ขนาด 7 พันล้านพารามิเตอร์ พัฒนาต่อยอดจาก Qwen2.5-VL-7B-Instruct และได้รับแรงบันดาลใจจากแนวทางอย่าง olmOCR ซึ่งร่วมใช้ข้อมูล metadata จากไฟล์ PDF ในระหว่างการดึงข้อมูล

Typhoon OCR รองรับการดึงข้อมูลจากเอกสารที่มีความซับซ้อนอย่างงบการเงิน อินโฟกราฟิก และเอกสารราชการได้ รวมถึงรองรับตัวเลขไทย

สำหรับผู้ที่สนใจใช้ Typhoon OCR สามารถทดลองใช้ได้ผ่านหลากหลายช่องทาง เช่น


ที่มา — Typhoon Blog

pittawat Tue, 05/20/2025 - 22:54

Continue reading...
 



กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
Back
Top Bottom