IBM เปิดตัวโมเดลภาษา Granite 4.0 Nano รุ่นเล็ก รันในมือถือได้ ประสิทธิภาพดี
Body
IBM เปิดตัวโมเดลภาษา Granite 4.0 Nano เป็นเวอร์ชันไซส์เล็กของ Granite 4.0 ที่เปิดตัวไปก่อนหน้านี้ ลดขนาดพารามิเตอร์ลงจากของเดิมรุ่น Micro 3B ลงมาเหลือ 1B และ 350M ขนาดเล็กพอที่จะรันในสมาร์ทโฟนได้
Granite 4.0 Nano มีทั้งเวอร์ชันใช้สถาปัตยกรรมไฮบริด (Mambo+Transformer) และแบบดั้งเดิม (Transformer) สำหรับรันบนสภาพแวดล้อมที่ยังไม่รองรับ Mambo (เช่น Llama.cpp) คู่แข่งของมันในขนาดใกล้ๆ กันคือ Qwen3-1.7B, Qwen3-0.6B, Gemma-3-1B, Gemma-3-270M, Llama-3.2-1B แต่จุดเด่นของ Granite 4.0 Nano คือประสิทธิภาพที่เหนือกว่า ปฏิบัติตามคำสั่งได้ดีกว่า จากผลเบนช์มาร์คที่วัดออกมาได้
โมเดลเปิดให้ใช้งานบน Hugging Face โดยใช้สัญญาอนุญาตแบบเปิด Apache 2.0
ที่มา - IBM Hugging Face
mk Sat, 01/11/2025 - 14:56
Continue reading...
Body
IBM เปิดตัวโมเดลภาษา Granite 4.0 Nano เป็นเวอร์ชันไซส์เล็กของ Granite 4.0 ที่เปิดตัวไปก่อนหน้านี้ ลดขนาดพารามิเตอร์ลงจากของเดิมรุ่น Micro 3B ลงมาเหลือ 1B และ 350M ขนาดเล็กพอที่จะรันในสมาร์ทโฟนได้
Granite 4.0 Nano มีทั้งเวอร์ชันใช้สถาปัตยกรรมไฮบริด (Mambo+Transformer) และแบบดั้งเดิม (Transformer) สำหรับรันบนสภาพแวดล้อมที่ยังไม่รองรับ Mambo (เช่น Llama.cpp) คู่แข่งของมันในขนาดใกล้ๆ กันคือ Qwen3-1.7B, Qwen3-0.6B, Gemma-3-1B, Gemma-3-270M, Llama-3.2-1B แต่จุดเด่นของ Granite 4.0 Nano คือประสิทธิภาพที่เหนือกว่า ปฏิบัติตามคำสั่งได้ดีกว่า จากผลเบนช์มาร์คที่วัดออกมาได้
โมเดลเปิดให้ใช้งานบน Hugging Face โดยใช้สัญญาอนุญาตแบบเปิด Apache 2.0
ที่มา - IBM Hugging Face
mk Sat, 01/11/2025 - 14:56
Continue reading...