Google อัปเดต Veo 3 สร้างวิดีโอพร้อมเสียง และ Imagen 4 ให้รูปที่มีรายละเอียดมากกว่าเดิม
Body
กูเกิลอัปเดตโมเดลปัญญาประดิษฐ์ที่ใช้สร้างวิดีโอและรูปภาพเวอร์ชันใหม่ Veo 3 สำหรับวิดีโอ และ Imagen 4 สำหรับรูปภาพ รวมทั้งเพิ่มเครื่องมือใหม่สำหรับการใช้งาน
Veo 3 มาพร้อมความสามารถที่สำคัญคือการสร้างวิดีโอที่มาพร้อมเสียง เช่น เสียงการจราจรสำหรับฉากถนนในเมือง, เสียงนกสำหรับฉากในสวน เป็นต้น กูเกิลบอกว่า Veo 3 นอกจากปรับปรุงความละเอียดของผลลัพธ์ที่ได้ วิดีโอยังทำงานตามกฎของฟิสิกส์ที่สมจริงขึ้น หาก prompt เป็นข้อความให้ตัวละครพูด ก็สามารถขยับปากได้ตรงตามคำที่ระบุ
ส่วน Imagen 4 นอกจากสร้างรูปได้เร็วขึ้น 10 เท่าจาก Imagen 3 แล้ว ยังเพิ่มความสามารถในการสร้างองค์ประกอบของภาพที่มีรายละเอียดมาก เช่น ผืนผ้า, หยดน้ำ, ขนสัตว์ ทำได้ทั้งแบบรูปสมจริงหรือแบบรูปวาด สามารถกำหนดอัตราส่วนผลลัพธ์ภาพ และความละเอียดสูงสุดที่ 2k ทำให้สามารถใช้กับงานพิมพ์หรืองานนำเสนอได้ รวมทั้งมีความแม่นยำในการเขียนคำสะกดให้ถูกต้อง ทำให้ใช้สร้างบัตรอวยพร โปสเตอร์ หรือการ์ตูนสั้นได้
เพื่อให้การใช้งาน Veo 3 สะดวกมากยิ่งขึ้นสำหรับคนสร้างวิดีโอจาก AI กูเกิลเลยออกเครื่องมือใหม่ Flow ซึ่งมีฟังก์ชันในการทำงานสร้างวิดีโอ เช่น สร้างวัตถุแล้วบันทึกไว้เพื่อเรียกใช้อ้างอิงในวิดีโอ, คำสั่งกำหนดมุมกล้อง, คำสั่งกำหนดฉากหลังที่ต้องการ กูเกิลยังเปิดชุมชน Flow TV เพื่อให้ศึกษาและแบ่งปัน prompt ในการสร้างผลงานด้วย ทั้งนี้ Flow มีให้ใช้งานก่อนเฉพาะสหรัฐอเมริกา และต้องเป็นลูกค้า Pro กับ Ultra
กูเกิลยังอัปเดตโมเดลรุ่นเก่า Veo 2 ให้รองรับคำสั่งจัดการวัตถุในวิดีโอ, ปรับมุมกล้อง เพิ่มเติม ส่วนโมเดลปัญญาประดิษฐ์แต่งเพลง Lyria 2 ได้ขยายการเข้าถึงสำหรับผู้ใช้งานกลุ่มใหญ่ขึ้น
Veo 3 เริ่มใช้งานได้แล้วสำหรับลูกค้าแผน Ultra ในสหรัฐอเมริกาผ่านแอป Gemini และ Flow รวมทั้งลูกค้าองค์กรที่ใช้งานผ่าน Vertex AI ส่วน Imagen 4 แล้วใช้งานได้แล้วในแอป Gemini, Whisk, Vertex AI และแอปใน Workspace
ที่มา: กูเกิล
arjin Wed, 05/21/2025 - 07:07
Continue reading...
Body
กูเกิลอัปเดตโมเดลปัญญาประดิษฐ์ที่ใช้สร้างวิดีโอและรูปภาพเวอร์ชันใหม่ Veo 3 สำหรับวิดีโอ และ Imagen 4 สำหรับรูปภาพ รวมทั้งเพิ่มเครื่องมือใหม่สำหรับการใช้งาน
Veo 3 มาพร้อมความสามารถที่สำคัญคือการสร้างวิดีโอที่มาพร้อมเสียง เช่น เสียงการจราจรสำหรับฉากถนนในเมือง, เสียงนกสำหรับฉากในสวน เป็นต้น กูเกิลบอกว่า Veo 3 นอกจากปรับปรุงความละเอียดของผลลัพธ์ที่ได้ วิดีโอยังทำงานตามกฎของฟิสิกส์ที่สมจริงขึ้น หาก prompt เป็นข้อความให้ตัวละครพูด ก็สามารถขยับปากได้ตรงตามคำที่ระบุ
ส่วน Imagen 4 นอกจากสร้างรูปได้เร็วขึ้น 10 เท่าจาก Imagen 3 แล้ว ยังเพิ่มความสามารถในการสร้างองค์ประกอบของภาพที่มีรายละเอียดมาก เช่น ผืนผ้า, หยดน้ำ, ขนสัตว์ ทำได้ทั้งแบบรูปสมจริงหรือแบบรูปวาด สามารถกำหนดอัตราส่วนผลลัพธ์ภาพ และความละเอียดสูงสุดที่ 2k ทำให้สามารถใช้กับงานพิมพ์หรืองานนำเสนอได้ รวมทั้งมีความแม่นยำในการเขียนคำสะกดให้ถูกต้อง ทำให้ใช้สร้างบัตรอวยพร โปสเตอร์ หรือการ์ตูนสั้นได้
เพื่อให้การใช้งาน Veo 3 สะดวกมากยิ่งขึ้นสำหรับคนสร้างวิดีโอจาก AI กูเกิลเลยออกเครื่องมือใหม่ Flow ซึ่งมีฟังก์ชันในการทำงานสร้างวิดีโอ เช่น สร้างวัตถุแล้วบันทึกไว้เพื่อเรียกใช้อ้างอิงในวิดีโอ, คำสั่งกำหนดมุมกล้อง, คำสั่งกำหนดฉากหลังที่ต้องการ กูเกิลยังเปิดชุมชน Flow TV เพื่อให้ศึกษาและแบ่งปัน prompt ในการสร้างผลงานด้วย ทั้งนี้ Flow มีให้ใช้งานก่อนเฉพาะสหรัฐอเมริกา และต้องเป็นลูกค้า Pro กับ Ultra
กูเกิลยังอัปเดตโมเดลรุ่นเก่า Veo 2 ให้รองรับคำสั่งจัดการวัตถุในวิดีโอ, ปรับมุมกล้อง เพิ่มเติม ส่วนโมเดลปัญญาประดิษฐ์แต่งเพลง Lyria 2 ได้ขยายการเข้าถึงสำหรับผู้ใช้งานกลุ่มใหญ่ขึ้น
Veo 3 เริ่มใช้งานได้แล้วสำหรับลูกค้าแผน Ultra ในสหรัฐอเมริกาผ่านแอป Gemini และ Flow รวมทั้งลูกค้าองค์กรที่ใช้งานผ่าน Vertex AI ส่วน Imagen 4 แล้วใช้งานได้แล้วในแอป Gemini, Whisk, Vertex AI และแอปใน Workspace
ที่มา: กูเกิล
arjin Wed, 05/21/2025 - 07:07
Continue reading...