กูเกิลออกโมเดลสร้างภาพ Gemini 2.5 Flash Image รวมหลายภาพเป็นภาพเดียวกันได้
Body
ข่าวโมเดลใหม่รายวัน วันนี้ขอเสนอ Gemini 2.5 Flash Image (โค้ดเนมภายใน nano-banana) โมเดลสร้างและแก้ไขภาพตัวใหม่ของกูเกิล สามารถนำภาพหลายๆ ภาพมารวมกันเป็นภาพเดียว และอัพเกรดความสามารถทั้งการสั่งแก้ไข-ดัดแปลงภาพด้วยภาษาธรรมชาติ และการรักษาคาแรกเตอร์ในภาพให้คงเส้นคงวา
จากภาพตัวอย่างของกูเกิล เห็นการรวม 3 ภาพเข้าด้วยกันคือ ใบหน้าผู้หญิง ตัวเครื่องโทรศัพท์มือถือ และบันไดทางเดิน รวมแล้วได้ภาพผู้หญิงคนเดียวกันกำลังคุยโทรศัพท์ (แต่มีร่างกายครึ่งตัว ไม่ได้มีเฉพาะใบหน้า) อยู่ในฉากบันไดที่เตรียมไว้ให้
อีกตัวอย่างที่กูเกิลนำมาโชว์ คือ การให้ภาพอินพุตเป็นใบหน้าบุคคล และสามารถเปลี่ยนชุด เปลี่ยนซีนของบุคคลนั้นๆ ไปประกอบอาชีพต่างๆ ด้วยท่าทางต่างกันได้
เบนช์มาร์คของกูเกิลบอกว่า Gemini 2.5 Flash Image เอาชนะโมเดลสร้างภาพตัวอื่นๆ ในตลาดได้เกือบทุกการทดสอบ เช่น ChatGPT 4o / GPT Image 1, Flux.1 Kontext, Qwen Image Edit และถ้าเทียบกับโมเดลตัวเก่าของกูเกิลเองคือ Gemini 2.0 Flash Image ก็ทิ้งห่างกันไกลมาก
Gemini 2.5 Flash Image เปิดให้ใช้งานผ่าน Gemini API, Google AI Studio, Vertex AI แล้ว ในราคา 30 ดอลลาร์ต่อ 1 ล้านโทเคนเอาท์พุท โดยภาพ 1 ภาพเท่ากับ 1,290 โทเคน หรือตีราคาออกมาที่ 0.039 ดอลลาร์ต่อภาพ
ที่มา - Google Developers
Continue reading...
Body
ข่าวโมเดลใหม่รายวัน วันนี้ขอเสนอ Gemini 2.5 Flash Image (โค้ดเนมภายใน nano-banana) โมเดลสร้างและแก้ไขภาพตัวใหม่ของกูเกิล สามารถนำภาพหลายๆ ภาพมารวมกันเป็นภาพเดียว และอัพเกรดความสามารถทั้งการสั่งแก้ไข-ดัดแปลงภาพด้วยภาษาธรรมชาติ และการรักษาคาแรกเตอร์ในภาพให้คงเส้นคงวา
จากภาพตัวอย่างของกูเกิล เห็นการรวม 3 ภาพเข้าด้วยกันคือ ใบหน้าผู้หญิง ตัวเครื่องโทรศัพท์มือถือ และบันไดทางเดิน รวมแล้วได้ภาพผู้หญิงคนเดียวกันกำลังคุยโทรศัพท์ (แต่มีร่างกายครึ่งตัว ไม่ได้มีเฉพาะใบหน้า) อยู่ในฉากบันไดที่เตรียมไว้ให้
อีกตัวอย่างที่กูเกิลนำมาโชว์ คือ การให้ภาพอินพุตเป็นใบหน้าบุคคล และสามารถเปลี่ยนชุด เปลี่ยนซีนของบุคคลนั้นๆ ไปประกอบอาชีพต่างๆ ด้วยท่าทางต่างกันได้
เบนช์มาร์คของกูเกิลบอกว่า Gemini 2.5 Flash Image เอาชนะโมเดลสร้างภาพตัวอื่นๆ ในตลาดได้เกือบทุกการทดสอบ เช่น ChatGPT 4o / GPT Image 1, Flux.1 Kontext, Qwen Image Edit และถ้าเทียบกับโมเดลตัวเก่าของกูเกิลเองคือ Gemini 2.0 Flash Image ก็ทิ้งห่างกันไกลมาก
Gemini 2.5 Flash Image เปิดให้ใช้งานผ่าน Gemini API, Google AI Studio, Vertex AI แล้ว ในราคา 30 ดอลลาร์ต่อ 1 ล้านโทเคนเอาท์พุท โดยภาพ 1 ภาพเท่ากับ 1,290 โทเคน หรือตีราคาออกมาที่ 0.039 ดอลลาร์ต่อภาพ
ที่มา - Google Developers
mk Tue, 26/08/2025 - 22:02nano banana is here → gemini-2.5-flash-image-preview- SOTA image generation and editing- incredible character consistency- lightning fastavailable in preview in AI Studio and the Gemini API pic.twitter.com/eKx9lwWc9j
— Google AI Studio (@googleaistudio) August 26, 2025
Continue reading...