DeepMind เปิดตัว Gemini Robotics On-Device โมเดลหุ่นยนต์เวอร์ชันทำงานออฟไลน์ได้
Body
Google DeepMind เปิดตัว Gemini Robotics On-Device โมเดลมองภาพแล้วตอบสนอง (vision language action หรือ VLA) สำหรับรันในหุ่นยนต์
โมเดลเวอร์ชันนี้เป็นเวอร์ชันลดรูปจาก Gemini Robotics ที่เปิดตัวเมื่อเดือนมีนาคม แต่ปรับแต่งให้รันแบบโลคอลในหน่วยประมวลผลของหุ่นยนต์ได้ เหมาะสำหรับงานหุ่นยนต์ออฟไลน์ หรือหุ่นที่ต้องการตอบสนองรวดเร็ว ไม่พึ่งพาเครือข่าย
โมเดล Gemini Robotics On-Device ออกแบบมาสำหรับหุ่นยนต์ที่มีสองแขน (bi-arm robots) พยายามใช้ทรัพยากรน้อย และสามารถนำไป fine-tuning เพิ่มประสิทธิภาพในการทำงานเฉพาะด้านได้ ผลจากการเบนช์มาร์คพบว่าความสามารถลดลงจาก Gemini Robotics ตัวเต็มแต่ไม่เยอะนัก แลกมาด้วยการทำงานแบบโลคอลได้
ที่มา - DeepMind
Continue reading...
Body
Google DeepMind เปิดตัว Gemini Robotics On-Device โมเดลมองภาพแล้วตอบสนอง (vision language action หรือ VLA) สำหรับรันในหุ่นยนต์
โมเดลเวอร์ชันนี้เป็นเวอร์ชันลดรูปจาก Gemini Robotics ที่เปิดตัวเมื่อเดือนมีนาคม แต่ปรับแต่งให้รันแบบโลคอลในหน่วยประมวลผลของหุ่นยนต์ได้ เหมาะสำหรับงานหุ่นยนต์ออฟไลน์ หรือหุ่นที่ต้องการตอบสนองรวดเร็ว ไม่พึ่งพาเครือข่าย
โมเดล Gemini Robotics On-Device ออกแบบมาสำหรับหุ่นยนต์ที่มีสองแขน (bi-arm robots) พยายามใช้ทรัพยากรน้อย และสามารถนำไป fine-tuning เพิ่มประสิทธิภาพในการทำงานเฉพาะด้านได้ ผลจากการเบนช์มาร์คพบว่าความสามารถลดลงจาก Gemini Robotics ตัวเต็มแต่ไม่เยอะนัก แลกมาด้วยการทำงานแบบโลคอลได้
ที่มา - DeepMind
mk Wed, 25/06/2025 - 13:50We’re bringing powerful AI directly onto robots with Gemini Robotics On-Device.It’s our first vision-language-action model to help make robots faster, highly efficient, and adaptable to new tasks and environments - without needing a constant internet connection.
pic.twitter.com/1Y21D3cF5t
— Google DeepMind (@GoogleDeepMind) June 24, 2025
Continue reading...