กูเกิลปล่อย Gemma 3n โมเดล AI ขนาดเล็กใช้ได้ทุกแพลตฟอร์ม รองรับ ภาพ, เสียง, วีดีโอในตัว
Body
กูเกิลปล่อยโมเดล Gemma 3n ที่เปิดตัวในงาน Google I/O ที่ผ่านมา โดยโชว์ว่าเป็นโมเดลขนาดเล็กแต่มีความสามารถสูง แข่งขันกับโมเดลขนาดใหญ่กว่า เช่น Llama 4 Marverick 17B 128BE ได้
ตัวโมเดลสามารถนำไปรันบนแพลตฟอร์มหลักๆ ได้ทั้งหมด ทั้ง HuggingFace Transformers, llama.cpp, Google AI Edge, Ollama, และ MLX
ความสามารถ multimodal ของ Gemma 3n ทำให้สามารถแปลงเสียงเป็นข้อความ และแปลภาษาได้ในตัว ทีมงานพบว่าการใช้งานกับภาษาอังกฤษ, สเปน, ฝรั่งเศส, อิตาลี, และโปรตุเกส นั้นใช้งานได้ดี ตอนนี้ยังจำกัดการใส่เสียงไม่เกิน 30 วินาทีแต่มีโอกาสเพิ่มนอนาคต
นอกจากโมเดล LLM แล้ว รอบนี้กูเกิลยังปล่อยโมเดลเข้าใจภาพ MobileNet-V5 รองรับภาพขนาดใหญ่ถึง 768x768 ทำงานได้เร็ว สูงสุดประมวลผลภาพได้ 60 เฟรมต่อวินาทีด้วย Google Pixel
ที่มา - Google Developers
lew Fri, 27/06/2025 - 07:48
Continue reading...
Body
กูเกิลปล่อยโมเดล Gemma 3n ที่เปิดตัวในงาน Google I/O ที่ผ่านมา โดยโชว์ว่าเป็นโมเดลขนาดเล็กแต่มีความสามารถสูง แข่งขันกับโมเดลขนาดใหญ่กว่า เช่น Llama 4 Marverick 17B 128BE ได้
ตัวโมเดลสามารถนำไปรันบนแพลตฟอร์มหลักๆ ได้ทั้งหมด ทั้ง HuggingFace Transformers, llama.cpp, Google AI Edge, Ollama, และ MLX
ความสามารถ multimodal ของ Gemma 3n ทำให้สามารถแปลงเสียงเป็นข้อความ และแปลภาษาได้ในตัว ทีมงานพบว่าการใช้งานกับภาษาอังกฤษ, สเปน, ฝรั่งเศส, อิตาลี, และโปรตุเกส นั้นใช้งานได้ดี ตอนนี้ยังจำกัดการใส่เสียงไม่เกิน 30 วินาทีแต่มีโอกาสเพิ่มนอนาคต
นอกจากโมเดล LLM แล้ว รอบนี้กูเกิลยังปล่อยโมเดลเข้าใจภาพ MobileNet-V5 รองรับภาพขนาดใหญ่ถึง 768x768 ทำงานได้เร็ว สูงสุดประมวลผลภาพได้ 60 เฟรมต่อวินาทีด้วย Google Pixel
ที่มา - Google Developers
lew Fri, 27/06/2025 - 07:48
Continue reading...