Alibaba อัปเดตโมเดลตระกูล Qwen3 ชุดใหญ่ ทั้งงาน Visual, Translation จนถึงโมเดลยักษ์ 1T พารามิเตอร์
Body
Alibaba ออกโมเดลปัญญาประดิษฐ์ใหม่ชุดใหญ่ในซีรีส์ Qwen3 ซึ่งทั้งหมดเป็นโมเดลโอเพนซอร์ส มีรายละเอียดดังนี้
Qwen3-VL โมเดลที่สามารถเข้าใจรูปภาพ-ข้อความ โมเดลหลักคือ
จุดเด่นของ Qwen3-VL คือทำงานบนสมาร์ทโฟนได้ดี, สามารถแปลงภาพจับหน้าจอ เขียนออกมาเป็นโค้ดได้, OCR รองรับ 32 ภาษา, context 256K สเกลได้ถึง 1M, ทำความเข้าใจภาพได้ทั้ง 2D และ 3D ฯลฯ
โมเดลอื่นที่ประกาศพร้อมกันโดยกลุ่มนี้เปิดให้ใช้งานผ่าน API เท่านั้นได้แก่
นอกจากนี้ Alibaba ยังออก Qwen3Guard โมเดลสำหรับปรับการสนทนาให้มีความปลอดภัย คล้ายกับ Llama Guard ของ Meta
ที่มา: Simon Willison Blog
arjin Wed, 24/09/2025 - 15:40
Continue reading...
Body
Alibaba ออกโมเดลปัญญาประดิษฐ์ใหม่ชุดใหญ่ในซีรีส์ Qwen3 ซึ่งทั้งหมดเป็นโมเดลโอเพนซอร์ส มีรายละเอียดดังนี้
Qwen3-VL โมเดลที่สามารถเข้าใจรูปภาพ-ข้อความ โมเดลหลักคือ
Qwen3-VL-235B-A22B
ทำงานได้ทั้งโหมด Instruct และ Thinking ผลทดสอบคะแนนดีกว่า Gemini 2.5 Proจุดเด่นของ Qwen3-VL คือทำงานบนสมาร์ทโฟนได้ดี, สามารถแปลงภาพจับหน้าจอ เขียนออกมาเป็นโค้ดได้, OCR รองรับ 32 ภาษา, context 256K สเกลได้ถึง 1M, ทำความเข้าใจภาพได้ทั้ง 2D และ 3D ฯลฯ
โมเดลอื่นที่ประกาศพร้อมกันโดยกลุ่มนี้เปิดให้ใช้งานผ่าน API เท่านั้นได้แก่
Qwen3-Coder
รุ่นอัปเกรด ทำคะแนนทดสอบ SWE-Bench สูงขึ้นเป็น 69.6, Qwen3-LiveTranslate-Flash
โมเดลสำหรับการแปลภาษา ทำงานเร็ว แปลภาษาจากภาพหรือข้อความบนจอได้ รองรับถึง 18 ภาษา และ Qwen3-Max
ระบุว่าเป็นโมเดลขนาดใหญ่ที่สุดที่เคยมีมา พารามิเตอร์มากกว่า 1T ฝึกฝนมากกว่า 36T โทเค็นนอกจากนี้ Alibaba ยังออก Qwen3Guard โมเดลสำหรับปรับการสนทนาให้มีความปลอดภัย คล้ายกับ Llama Guard ของ Meta
ที่มา: Simon Willison Blog
arjin Wed, 24/09/2025 - 15:40
Continue reading...