กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


News

news Alibaba Cloud เปิดตัว Qwen3-Embedding ค้นหาข้อมูลได้แม่นกว่า OpenAI Text Embedding แม้โมเดลเล็กมาก

News 

Active member

Staff member
Moderator
Collaborate
Alibaba Cloud เปิดตัว Qwen3-Embedding ค้นหาข้อมูลได้แม่นกว่า OpenAI Text Embedding แม้โมเดลเล็กมาก
Body

Alibaba Cloud เปิดตัวโมเดล Qwen3 Embedding และ Qwen3 Reranking สำหรับการค้นหาเอกสารตามความหมายในเนื้อความ โดยชูจุดเด่นว่าโมเดลเหล่านี้ค้นหาเอกสารได้แม่นยำแม้จะมีโมเดลขนาดเล็กจนสามารถรันเองในองค์กรได้

Qwen3 Embedding มี 3 ขนาด ได้แก่ 0.6B, 4B, และ 8B แม้แต่ตัวเล็กที่สุดคือ 0.6B นั้นก็ยังได้คะแนน MMTEB (ทดสอบการค้นหาเอกสารจากเอกสาร 500 ชุด กระจาย 250 ภาษา) สูงกว่า text-embedding-3-large ของ OpenAI ที่น่าจะได้รับความนิยมสูงมาก ขณะที่โมเดลขนาดใหญ่ก็สามารถเอาชนะโมเดลรุ่นใหม่ๆ ได้

ทั้ง Embedding และ Reranking ฝึกจาก Qwen3 ทั้งคู่มาฝึกต่ออีก 3 ขั้น ได้แก่ การฝึกแบบ weakly supervised ด้วยข้อมูลที่สร้างขึ้นมา, จากนั้นฝึกด้วยข้อมูลคุณภาพสูง, และนั้นสุดท้ายนำโมเดลหลายๆ เวอร์ชั่นจากการฝึกขั้นที่สองมารวมกัน

ตัว Embedding นั้นจะรับเอกสารทั้งก้อนแล้วคืนค่าเป็น vector อย่างเดียว ขณะที่ Reranking นั้นจะรับค่าเป็นคำสั่งและตัวเอกสารเข้าไปพร้อมกัน จากนั้นจะคืนค่าเป็นคะแนนว่าเอกสารนั้นเกี่ยวกับคำสั่งหรือไม่

โมเดลทุกรุ่นเปิดให้ดาวน์โหลดไปใช้ด้วยไลเซนส์ Apache 2.0

ที่มา - QwenLM

lew Fri, 06/06/2025 - 13:45

Continue reading...
 



กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
Back
Top Bottom