กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


News

ข่าว Typhoon เปิดตัวโมเดล OCR สำหรับดึงข้อมูลจากเอกสารและรูปภาพ รองรับภาษาไทยและอังกฤษ

  • ผู้เริ่มหัวข้อ ผู้เริ่มหัวข้อ News 
  • วันที่เริ่มต้น วันที่เริ่มต้น

News 

Active member

สมาชิกทีมงาน
Moderator
Distributor
Typhoon เปิดตัวโมเดล OCR สำหรับดึงข้อมูลจากเอกสารและรูปภาพ รองรับภาษาไทยและอังกฤษ
Body

ทีม Typhoon จาก SCB 10X เปิดตัวโมเดล OCR สำหรับดึงข้อมูลจากรูปภาพและเอกสาร PDF ชื่อ Typhoon OCR ชูจุดเด่นเข้าใจทั้งภาษาไทยและภาษาอังกฤษ โดยมีประสิทธิภาพในภาษาไทยที่เหนือกว่า GPT-4o และ Gemini 2.5 Flash

โดยเบื้องหลังใช้สถาปัตยกรรมเป็น Vision Language Model (VLM) ซึ่งเข้าใจทั้งภาษาและรูปภาพ ขนาด 7 พันล้านพารามิเตอร์ พัฒนาต่อยอดจาก Qwen2.5-VL-7B-Instruct และได้รับแรงบันดาลใจจากแนวทางอย่าง olmOCR ซึ่งร่วมใช้ข้อมูล metadata จากไฟล์ PDF ในระหว่างการดึงข้อมูล

Typhoon OCR รองรับการดึงข้อมูลจากเอกสารที่มีความซับซ้อนอย่างงบการเงิน อินโฟกราฟิก และเอกสารราชการได้ รวมถึงรองรับตัวเลขไทย

สำหรับผู้ที่สนใจใช้ Typhoon OCR สามารถทดลองใช้ได้ผ่านหลากหลายช่องทาง เช่น


ที่มา — Typhoon Blog

pittawat Tue, 05/20/2025 - 22:54

Continue reading...
 



กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม ด้านล่าง