กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


Alibaba เปิดตัว Qwen2.5-VL โมเดลวิเคราะห์และดึงข้อมูลจากรูปภาพ รวมทั้งเป็น Agent บนอุปกรณ์

news Alibaba เปิดตัว Qwen2.5-VL โมเดลวิเคราะห์และดึงข้อมูลจากรูปภาพ รวมทั้งเป็น Agent บนอุปกรณ์

News 

Active member

Staff member
Moderator
Collaborate
Alibaba เปิดตัวโมเดลปัญญาประดิษฐ์ใหม่ในตระกูล Qwen2.5 ชื่อว่า Qwen2.5-VL โดย VL ย่อมาจาก Vision Language เป็นรุ่นถัดจาก Qwen2-VL มีความสามารถเข้าใจวิดีโอ รูปภาพ ข้อความ และเป็น Agentic ที่ทำงานแทนได้ด้วย

ตัวอย่างความสามารถที่พิเศษขึ้นของ Qwen2.5-VL เช่น การรู้จักภาพสถานที่ ฉากภาพยนตร์ รายการทีวี สินค้า, สามารถระบุลักษณะวัตถุในภาพตามเงื่อนไข และส่งออกเป็นไฟล์ JSON ได้, ระบุตัวอักษรที่หลากหลายแบบในภาพเดียวได้, สามารถส่งออกไฟล์เอกสารออกมาเป็นฟอร์แมตที่ต้องการได้, สามารถดึงข้อมูลจากวิดีโอออกมาได้ และทำหน้าที่เป็น Agent รันบนคอมพิวเตอร์หรือสมาร์ทโฟนได้

Qwen2.5-VL มี 3 โมเดลย่อยแตกต่างที่ขนาดพารามิเตอร์ได้แก่ 3B, 7B และขนาดใหญ่ที่สุด 72B ดูข้อมูลเพิ่มเติมได้ที่ Hugging Face

ที่มา: Alibaba

Alibaba เปิดตัว Qwen25VL โมเดลวิเคราะห์และดึงข้อมูลจากรูปภาพ รวมทั้งเป็น Agent บนอุปกรณ์-1.webp


ความสามารถของ 72B เทียบกับ Gemini 2 Flash ชนะหลายรายการ

Alibaba เปิดตัว Qwen25VL โมเดลวิเคราะห์และดึงข้อมูลจากรูปภาพ รวมทั้งเป็น Agent บนอุปกรณ์-2.webp


โมเดลเล็ก 7B ก็สูงกว่า GPT-4o Mini ในหลายหัวข้อ

Alibaba เปิดตัว Qwen25VL โมเดลวิเคราะห์และดึงข้อมูลจากรูปภาพ รวมทั้งเป็น Agent บนอุปกรณ์-3.webp


Topics:
Alibaba Cloud
LLM

Continue reading...
 



กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
Back
Top Bottom