กูเกิลเปิดตัว Gemini 2.5 Computer Use ควบคุมเว็บและโทรศัพท์
Body
กูเกิลปล่อยโมเดลปัญญาประดิษฐ์ Gemini 2.5 Computer Use ปรับแต่งจาก Gemini 2.5 Pro ให้สามารถเข้าใจอินเทอร์เฟซสำหรับมนุษย์ เช่น เว็บหรือแอปพลิเคชั่นบนโทรศัพท์มือถือ
แนวทางการใช้ปัญญาประดิษฐ์ทำงานตามคำสั่งนับเป็นแนวทางสำคัญของงานปัญญาประดิษฐ์ ที่โปรแกรมจำนวนมากยังไม่มี API ให้คอมพิวเตอร์เชื่อมต่อได้โดยง่าย การใช้ AI ในกลุ่ม LLM เข้ามาทำงานแทนจะทำให้งานหลายส่วนกลายเป็นงานอัตโนมัติได้มากขึ้น
กูเกิลเปิดผลทดสอบ Gemini 2.5 Computer Use เทียบกับ Claude Sonnet 4.5 และ OpenAI Computer-Using Agent ได้ผลทดสอบสูงสุดทุกชุดทดสอบ ยกเว้น OSWorld ที่ตอนนี้ Gemini 2.5 ยังไม่รองรับ นอกจากความถูกต้องของงานแล้ว ยังใช้เวลาน้อยกว่าโมเดลอื่นๆ มาก
ก่อนหน้านี้กูเกิลใช้โมเดลนี้ภายใน ทั้ง Project Mariner, Firebase Testing Agent, และใช้งานบางส่วนใน AI Mode สำหรับการค้นเว็บ แต่รอบนี้เปิดออกมาเป็น API ให้ใช้งานตามจริงกัน
ที่มา - Google
lew Wed, 08/10/2025 - 12:55
Continue reading...
Body
กูเกิลปล่อยโมเดลปัญญาประดิษฐ์ Gemini 2.5 Computer Use ปรับแต่งจาก Gemini 2.5 Pro ให้สามารถเข้าใจอินเทอร์เฟซสำหรับมนุษย์ เช่น เว็บหรือแอปพลิเคชั่นบนโทรศัพท์มือถือ
แนวทางการใช้ปัญญาประดิษฐ์ทำงานตามคำสั่งนับเป็นแนวทางสำคัญของงานปัญญาประดิษฐ์ ที่โปรแกรมจำนวนมากยังไม่มี API ให้คอมพิวเตอร์เชื่อมต่อได้โดยง่าย การใช้ AI ในกลุ่ม LLM เข้ามาทำงานแทนจะทำให้งานหลายส่วนกลายเป็นงานอัตโนมัติได้มากขึ้น
กูเกิลเปิดผลทดสอบ Gemini 2.5 Computer Use เทียบกับ Claude Sonnet 4.5 และ OpenAI Computer-Using Agent ได้ผลทดสอบสูงสุดทุกชุดทดสอบ ยกเว้น OSWorld ที่ตอนนี้ Gemini 2.5 ยังไม่รองรับ นอกจากความถูกต้องของงานแล้ว ยังใช้เวลาน้อยกว่าโมเดลอื่นๆ มาก
ก่อนหน้านี้กูเกิลใช้โมเดลนี้ภายใน ทั้ง Project Mariner, Firebase Testing Agent, และใช้งานบางส่วนใน AI Mode สำหรับการค้นเว็บ แต่รอบนี้เปิดออกมาเป็น API ให้ใช้งานตามจริงกัน
ที่มา - Google
lew Wed, 08/10/2025 - 12:55
Continue reading...