ว่างๆ ค่อยกลับมาตอบ Gemini เปิด Batch Mode ตอบภายใน 24 ชั่วโมง คิดราคาครึ่งเดียว
Body
กูเกิลเปิดบริการ Gemini API Batch Mode สำหรับผู้ที่ยินดีรอผลตอบกลับช้าๆ โดยมีข้อดีสำคัญคือสามารถขอประมวลผลทีละมากๆ และยังได้ส่วนลดครึ่งหนึ่งเทียบกับการใช้งานตามปกติ
เนื่องจากเหมาะกับการประมวลผลข้อมูลขนาดใหญ่มาก การใช้งานในโหมดนี้สามารถใส่งานเข้าไปได้ทีละ 2GB และใส่งานในคิวได้รวม 20GB งานที่สามารถใช้งานได้ เช่น การวิเคราะห์วิดีโอจำนวนมากๆ แม้กูเกิลจะระบุว่าอาจจะต้องรอถึง 24 ชั่วโมงแต่หากเป็นงานขนาดเล็กก็มักจะได้รับเร็วกว่านั้น
ปัญญาประดิษฐ์ในกลุ่ม LLM นั้นใช้คลัสเตอร์ขนาดใหญ่ราคาแพงในการประมวลผล การใช้เครื่องให้คุ้มค่าที่สุดจึงเป็นจุดสำคัญที่ผู้ให้บริการแต่ละรายจะสามารถบริการต้นทุนได้ดีขึ้น ฝั่ง OpenAI นั้นมี Batch API คล้ายกัน ขณะที่ DeepSeek ลดราคาช่วงเวลาคนใช้งานน้อยแทน
ที่มา - Google Developers Blog
lew Thu, 10/07/2025 - 00:04
Continue reading...
Body
กูเกิลเปิดบริการ Gemini API Batch Mode สำหรับผู้ที่ยินดีรอผลตอบกลับช้าๆ โดยมีข้อดีสำคัญคือสามารถขอประมวลผลทีละมากๆ และยังได้ส่วนลดครึ่งหนึ่งเทียบกับการใช้งานตามปกติ
เนื่องจากเหมาะกับการประมวลผลข้อมูลขนาดใหญ่มาก การใช้งานในโหมดนี้สามารถใส่งานเข้าไปได้ทีละ 2GB และใส่งานในคิวได้รวม 20GB งานที่สามารถใช้งานได้ เช่น การวิเคราะห์วิดีโอจำนวนมากๆ แม้กูเกิลจะระบุว่าอาจจะต้องรอถึง 24 ชั่วโมงแต่หากเป็นงานขนาดเล็กก็มักจะได้รับเร็วกว่านั้น
ปัญญาประดิษฐ์ในกลุ่ม LLM นั้นใช้คลัสเตอร์ขนาดใหญ่ราคาแพงในการประมวลผล การใช้เครื่องให้คุ้มค่าที่สุดจึงเป็นจุดสำคัญที่ผู้ให้บริการแต่ละรายจะสามารถบริการต้นทุนได้ดีขึ้น ฝั่ง OpenAI นั้นมี Batch API คล้ายกัน ขณะที่ DeepSeek ลดราคาช่วงเวลาคนใช้งานน้อยแทน
ที่มา - Google Developers Blog
lew Thu, 10/07/2025 - 00:04
Continue reading...