Ai2 เปิดตัว Olmo 3 โมเดลปัญญาประดิษฐ์แบบเปิดทุกจุด ทุกขั้นตอนการฝึกให้ไปดัดแปลงได้เอง
Body
Ai2 สถาบันวิจัยที่ก่อตั้งโดย Paul Allen ผู้ร่วมก่อตั้งไมโครซอฟท์ เปิดตัว Olmo 3 โมเดลปัญญาประดิษฐ์แบบเปิดอย่างแท้จริง โดยเปิดเผย checkpoint ของทุกขั้นตอนการฝึกโมเดล,ุดข้อมูลที่ใช้ฝึก, และซอฟต์แวร์ต่างๆ ที่จำเป็นต่อการฝึกแต่ละขั้น
โมเดลที่เผยแพร่เพื่อการใช้งาน ได้แก่
แต่นอกจากตัวโมเดลรุ่นที่เปิดให้ใช้งาน ยังมีโมเดลระหว่างทางอีกจำนวนมาก เช่น โมเดล Stage 1 ที่ฝึกจากชุดข้อมูลทั่วไป, Stage 2 ฝึกกับชุดข้อมูลใช้เหตุผล, SFT ฝึกการทำตามคำสั่งในแชต
ประสิทธิภาพโดยรวมของ Olmo 3-Base 32B ใกล้เคียงกับ Qwen 2.5 32B และ Gemma 3 27B
ตอนนี้โมเดลเปิดให้ใช้งานบน playground และมี API ขายบน OpenRouter
ที่มา - Ai2
lew Sat, 22/11/2025 - 09:08
Continue reading...
Body
Ai2 สถาบันวิจัยที่ก่อตั้งโดย Paul Allen ผู้ร่วมก่อตั้งไมโครซอฟท์ เปิดตัว Olmo 3 โมเดลปัญญาประดิษฐ์แบบเปิดอย่างแท้จริง โดยเปิดเผย checkpoint ของทุกขั้นตอนการฝึกโมเดล,ุดข้อมูลที่ใช้ฝึก, และซอฟต์แวร์ต่างๆ ที่จำเป็นต่อการฝึกแต่ละขั้น
โมเดลที่เผยแพร่เพื่อการใช้งาน ได้แก่
- Olmo 3-Base ใช้งานได้หลากหลาย เหมาะกับการนำไปฝึกเพิ่มเติม
- Olmo 3-Think โมเดลคิดก่อนตอบเพื่อให้ได้ผลคำตอบที่ดีที่สุด
- Olmo 3-Instruct โมเดลที่เน้นงานแชตเป็นหลัก
- Olmo 3-RL Zero เป็นการสาธิจการฝึกแบบ reinforcement learning เพื่อสร้างโมเดลแก้ปัญหาเฉพาะทาง โดยเปิดออกมาสี่รุ่นแก้ปัญหา คณิตศาสตร์, เขียนโค้ด, ทำตามคำสั่ง, และแชตทั่วไป
แต่นอกจากตัวโมเดลรุ่นที่เปิดให้ใช้งาน ยังมีโมเดลระหว่างทางอีกจำนวนมาก เช่น โมเดล Stage 1 ที่ฝึกจากชุดข้อมูลทั่วไป, Stage 2 ฝึกกับชุดข้อมูลใช้เหตุผล, SFT ฝึกการทำตามคำสั่งในแชต
ประสิทธิภาพโดยรวมของ Olmo 3-Base 32B ใกล้เคียงกับ Qwen 2.5 32B และ Gemma 3 27B
ตอนนี้โมเดลเปิดให้ใช้งานบน playground และมี API ขายบน OpenRouter
ที่มา - Ai2
lew Sat, 22/11/2025 - 09:08
Continue reading...