Mistral เปิดตัว Mistral Large 3 รุ่นใหญ่ และ Ministral 3 รุ่นเล็ก คะแนนดีในกลุ่มโมเดลเปิด
Body
Mistral บริษัทปัญญาประดิษฐ์จากฝรั่งเศส เปิดตัวโมเดลชุดใหม่ Mistral 3 เป็นโมเดลแบบเปิด (open weight) ที่ประกอบด้วยโมเดล 2 กลุ่มคือ
Mistral Large 3 โมเดลรุ่นใหญ่ขนาดพารามิเตอร์ 675B ที่เบนช์มาร์คชนะ DeepSeek-V3.1 และ Kimi K2 (ชนะแบบเฉียดๆ แต่ก็ชนะ แพ้ในเรื่องเขียนโค้ด) ถือเป็นโมเดลแบบเปิด กลุ่ม non-reasoning ที่มีผลงานดีเป็นอันดับสองร่วมบน LMArena (ที่หนึ่งตอนนี้คือ DeepSeek-V3.2 แบบ non-reasoning)
ความสามารถของ Mistral Large 3 ย่อมทำให้มันกลายเป็นโมเดลกลุ่มเปิดระดับท็อปๆ ในตอนนี้ อยู่ในลีกเดียวกับ DeepSeek-V3.1, Kimi K2 และ Z.ai GLM 4.6
Mistral ยังร่วมมือกับ NVIDIA พัฒนาการบีบอัดโมเดลให้รันบน Blackwell NV72 ได้มีประสิทธิภาพมากขึ้น หรือถ้าเครื่องเล็กลงหน่อยก็สามารถยัดลงเครื่องที่มี NVIDIA A100 จำนวน 8 ตัวได้ด้วย


Ministral 3 โมเดลไซส์เล็กสำหรับรันในเครื่อง edge machine มีให้เลือก 3 ขนาดคือ 3B, 8B, 14B แต่ละขนาดมี 3 เวอร์ชันย่อยคือ base, instruct, reasoning (รวมเป็น 9 โมเดลย่อย) ให้ประสิทธิภาพดีกว่าโมเดลขนาดใกล้เคียงกันคือ Gemma 3 4B/12B ของกูเกิล และประหยัดโทเคนกว่า Qwen3-VL ของ Alibaba

โมเดลทุกตัวในตระกูล Mistral 3 ใช้สัญญาอนุญาตแบบเปิด Apache 2.0 เปิดให้ใช้งานแล้วบนแพลตฟอร์มคลาวด์ต่างๆ และดาวน์โหลดได้จาก Hugging Face
ที่มา - Mistral
mk Wed, 03/12/2025 - 09:20
Continue reading...
Body
Mistral บริษัทปัญญาประดิษฐ์จากฝรั่งเศส เปิดตัวโมเดลชุดใหม่ Mistral 3 เป็นโมเดลแบบเปิด (open weight) ที่ประกอบด้วยโมเดล 2 กลุ่มคือ
Mistral Large 3 โมเดลรุ่นใหญ่ขนาดพารามิเตอร์ 675B ที่เบนช์มาร์คชนะ DeepSeek-V3.1 และ Kimi K2 (ชนะแบบเฉียดๆ แต่ก็ชนะ แพ้ในเรื่องเขียนโค้ด) ถือเป็นโมเดลแบบเปิด กลุ่ม non-reasoning ที่มีผลงานดีเป็นอันดับสองร่วมบน LMArena (ที่หนึ่งตอนนี้คือ DeepSeek-V3.2 แบบ non-reasoning)
ความสามารถของ Mistral Large 3 ย่อมทำให้มันกลายเป็นโมเดลกลุ่มเปิดระดับท็อปๆ ในตอนนี้ อยู่ในลีกเดียวกับ DeepSeek-V3.1, Kimi K2 และ Z.ai GLM 4.6
Mistral ยังร่วมมือกับ NVIDIA พัฒนาการบีบอัดโมเดลให้รันบน Blackwell NV72 ได้มีประสิทธิภาพมากขึ้น หรือถ้าเครื่องเล็กลงหน่อยก็สามารถยัดลงเครื่องที่มี NVIDIA A100 จำนวน 8 ตัวได้ด้วย


Ministral 3 โมเดลไซส์เล็กสำหรับรันในเครื่อง edge machine มีให้เลือก 3 ขนาดคือ 3B, 8B, 14B แต่ละขนาดมี 3 เวอร์ชันย่อยคือ base, instruct, reasoning (รวมเป็น 9 โมเดลย่อย) ให้ประสิทธิภาพดีกว่าโมเดลขนาดใกล้เคียงกันคือ Gemma 3 4B/12B ของกูเกิล และประหยัดโทเคนกว่า Qwen3-VL ของ Alibaba

โมเดลทุกตัวในตระกูล Mistral 3 ใช้สัญญาอนุญาตแบบเปิด Apache 2.0 เปิดให้ใช้งานแล้วบนแพลตฟอร์มคลาวด์ต่างๆ และดาวน์โหลดได้จาก Hugging Face
ที่มา - Mistral
mk Wed, 03/12/2025 - 09:20
Continue reading...