DeepMind ออกโมเดล MedGemma 27B Multimodal เพิ่ม อ่านภาพทางการแพทย์ได้เยอะขึ้น
Body
Google DeepMind เปิดตัวโมเดลใน ซีรีส์ MedGemma ที่ใช้วิเคราะห์ข้อมูลด้านการแพทย์ เพิ่มเติม
โมเดลชุดแรกที่เปิดตัวเดือนที่แล้วมีสองตัวคือ
โมเดลตัวใหม่รอบนี้มีอีกสองตัวคือ
การมีโมเดลในชุดเพิ่มเป็น 4 ตัว ช่วยรองรับการนำไปใช้วิเคราะห์ข้อมูลการแพทย์ที่หลากหลายขึ้น เช่น การมาถึงของ MedGemma 27B Multimodal ทำให้เราอ่าน "ข้อมูลภาพ" ทางการแพทย์ได้หลากหลาย ตัวอย่างที่นำมาโชว์คือการนำภาพถ่ายผิวหนังผู้ป่วย หรือภาพเอ็กซ์เรย์ แนบไปกับพร็อมต์เพื่อถามความเห็นจาก MedGemma
โมเดลทุกตัวมีขนาดเล็กพอจนสามารถรันได้บนจีพียู 1 ตัว และโมเดลรุ่นเล็กหน่อยคือ MedGemma 4B กับ MedSigLIP รันบนอุปกรณ์พกพาได้ด้วยซ้ำ
กูเกิลยังโชว์ประสิทธิภาพของโมเดล MedGemma 27B ว่าทำคะแนนเบนช์มาร์คด้านการแพทย์ MedQA ได้ดีระดับเดียวกับ DeepSeek R1 (แพ้แค่นิดเดียว) แต่มีต้นทุนค่ารันถูกกว่าถึง 10 เท่า
กูเกิลยังย้ำเหมือนเดิมว่า MedGemma และ MedSigLIP เป็นโมเดลโอเพนซอร์ส เป็นโมเดลที่ออกแบบมาเพื่อเป็นจุดตั้งต้น ให้นักวิจัยหรือนักพัฒนาแอพพลิเคชันทางการแพทย์นำไปปรับแต่งต่อ นำไปเทรนเพิ่มบนชุดข้อมูลของตัวเอง และจำเป็นต้องตรวจสอบผลลัพธ์จากผู้เชี่ยวชาญก่อนเสมอ
ที่มา - Google Research
mk Sun, 13/07/2025 - 15:25
Continue reading...
Body
Google DeepMind เปิดตัวโมเดลใน ซีรีส์ MedGemma ที่ใช้วิเคราะห์ข้อมูลด้านการแพทย์ เพิ่มเติม
โมเดลชุดแรกที่เปิดตัวเดือนที่แล้วมีสองตัวคือ
- MedGemma 27B Text
- MedGemma 4B Multimodal
โมเดลตัวใหม่รอบนี้มีอีกสองตัวคือ
- MedGemma 27B Multimodal เป็นลูกผสมระหว่างสองโมเดลแรก รองรับข้อมูลหลายชนิด (multimodal) ที่ขนาดพารามิเตอร์เยอะขึ้น รองรับการอ่านประวัติผู้ป่วยอิเล็กทรอนิกส์แบบเทียบตามช่วงเวลา
- MedSigLIP เป็นตัวเข้ารหัส (encoder) ข้อมูลประเภทภาพและข้อความ เพื่อให้แยกหมวด ค้นหา และหาความเชื่อมโยง
การมีโมเดลในชุดเพิ่มเป็น 4 ตัว ช่วยรองรับการนำไปใช้วิเคราะห์ข้อมูลการแพทย์ที่หลากหลายขึ้น เช่น การมาถึงของ MedGemma 27B Multimodal ทำให้เราอ่าน "ข้อมูลภาพ" ทางการแพทย์ได้หลากหลาย ตัวอย่างที่นำมาโชว์คือการนำภาพถ่ายผิวหนังผู้ป่วย หรือภาพเอ็กซ์เรย์ แนบไปกับพร็อมต์เพื่อถามความเห็นจาก MedGemma
โมเดลทุกตัวมีขนาดเล็กพอจนสามารถรันได้บนจีพียู 1 ตัว และโมเดลรุ่นเล็กหน่อยคือ MedGemma 4B กับ MedSigLIP รันบนอุปกรณ์พกพาได้ด้วยซ้ำ
กูเกิลยังโชว์ประสิทธิภาพของโมเดล MedGemma 27B ว่าทำคะแนนเบนช์มาร์คด้านการแพทย์ MedQA ได้ดีระดับเดียวกับ DeepSeek R1 (แพ้แค่นิดเดียว) แต่มีต้นทุนค่ารันถูกกว่าถึง 10 เท่า
กูเกิลยังย้ำเหมือนเดิมว่า MedGemma และ MedSigLIP เป็นโมเดลโอเพนซอร์ส เป็นโมเดลที่ออกแบบมาเพื่อเป็นจุดตั้งต้น ให้นักวิจัยหรือนักพัฒนาแอพพลิเคชันทางการแพทย์นำไปปรับแต่งต่อ นำไปเทรนเพิ่มบนชุดข้อมูลของตัวเอง และจำเป็นต้องตรวจสอบผลลัพธ์จากผู้เชี่ยวชาญก่อนเสมอ
ที่มา - Google Research
mk Sun, 13/07/2025 - 15:25
Continue reading...