Microsoft AI เปิดตัว MAI-DxO ระบบรันโมเดลเพื่อวินิจฉัยการแพทย์ แม่นยำ 85.5%
Body
Microsoft AI เปิดตัว MAI Diagnostic Orchestrator (MAI-DxO) เป็นกลไกการควบคุมโมเดล (orchestrator) สำหรับวินิจฉัยอาการป่วย (diagnosis) ที่ให้ผลการทำนายถูกต้องเกิน 80% ในราคาการรันโมเดลที่สามารถเข้าถึงได้
MAI-DxO ไม่ใช่ตัวโมเดลปัญญาประดิษฐ์ด้วยตัวมันเอง มันสามารถทำงานกับโมเดลไหนก็ได้ (ตัวอย่างของไมโครซอฟท์ใช้ร่วมกับ OpenAI o3 แต่สามารถใช้กับ Claude, Gemini, DeepSeek ได้หมด) กระบวนการทำงานของมันคือการสร้าง agent ของแพทย์ที่ทำหน้าที่ต่างกันไป เช่น ตั้งสมมติฐาน ตรวจสอบตามเช็คลิสต์ ท้าทายสมมติฐาน เลือกชุดทดสอบ แล้วปล่อยให้ agent เหล่านี้ถกเถียงกันวนๆ ไป เพื่อตัดสินใจหาแนวทางที่เหมาะสมที่สุด ทั้งในแง่ความถูกต้องของการวินิจฉัยและต้นทุน
ไมโครซอฟท์บอกว่าผลการทดสอบ MAI-DxO โดยอ่านข้อมูลเก่าของคนไข้โรงพยาบาล Massachusetts General Hospital จำนวน 304 คน เทียบกับผลการวินิจฉัยที่ยืนยันแล้วว่าถูกต้อง ให้ผลออกมาดี หากให้โมเดล OpenAI o3 แบบไม่จำกัดวงเงิน สามารถทายผลถูกต้อง 85.5% ของเบนช์มาร์ค เทียบกับการให้แพทย์ตัวจริงที่มีประสบการณ์ 5-20 ปี จำนวน 21 คนมาลองอ่านเคสแบบเดียวกัน มีความแม่นยำเฉลี่ย 20% เท่านั้น
หากจำกัดวงเงินในการรัน MAI-DxO ลงมา ความแม่นยำก็จะลดลงตามแผนภาพ แต่จะเห็นว่าการใช้เทคนิค orchestrator แทนการใช้โมเดล LLM รันเดี่ยวๆ ให้ผลการทดลองที่ดีขึ้นอย่างชัดเจน
งานวิจัยนี้ของ Microsoft AI ยังเป็นงานวิจัยแห้ง คือ อ่านเคสที่บันทึกไว้เท่านั้น ไมโครซอฟท์บอกว่าขั้นถัดไปคือนำไปทดสอบกับเคสผู้ป่วยจริง เพื่อยืนยันว่าผลการวินิจฉัยด้วย AI ถูกต้องจริงๆ หรือไม่ ซึ่งต้องรอกระบวนการอนุมัติของหน่วยงานกำกับดูแลด้านการแพทย์ต่อไป
ที่มา - Microsoft, งานวิจัยฉบับเต็ม
Continue reading...
Body
Microsoft AI เปิดตัว MAI Diagnostic Orchestrator (MAI-DxO) เป็นกลไกการควบคุมโมเดล (orchestrator) สำหรับวินิจฉัยอาการป่วย (diagnosis) ที่ให้ผลการทำนายถูกต้องเกิน 80% ในราคาการรันโมเดลที่สามารถเข้าถึงได้
MAI-DxO ไม่ใช่ตัวโมเดลปัญญาประดิษฐ์ด้วยตัวมันเอง มันสามารถทำงานกับโมเดลไหนก็ได้ (ตัวอย่างของไมโครซอฟท์ใช้ร่วมกับ OpenAI o3 แต่สามารถใช้กับ Claude, Gemini, DeepSeek ได้หมด) กระบวนการทำงานของมันคือการสร้าง agent ของแพทย์ที่ทำหน้าที่ต่างกันไป เช่น ตั้งสมมติฐาน ตรวจสอบตามเช็คลิสต์ ท้าทายสมมติฐาน เลือกชุดทดสอบ แล้วปล่อยให้ agent เหล่านี้ถกเถียงกันวนๆ ไป เพื่อตัดสินใจหาแนวทางที่เหมาะสมที่สุด ทั้งในแง่ความถูกต้องของการวินิจฉัยและต้นทุน
ไมโครซอฟท์บอกว่าผลการทดสอบ MAI-DxO โดยอ่านข้อมูลเก่าของคนไข้โรงพยาบาล Massachusetts General Hospital จำนวน 304 คน เทียบกับผลการวินิจฉัยที่ยืนยันแล้วว่าถูกต้อง ให้ผลออกมาดี หากให้โมเดล OpenAI o3 แบบไม่จำกัดวงเงิน สามารถทายผลถูกต้อง 85.5% ของเบนช์มาร์ค เทียบกับการให้แพทย์ตัวจริงที่มีประสบการณ์ 5-20 ปี จำนวน 21 คนมาลองอ่านเคสแบบเดียวกัน มีความแม่นยำเฉลี่ย 20% เท่านั้น
หากจำกัดวงเงินในการรัน MAI-DxO ลงมา ความแม่นยำก็จะลดลงตามแผนภาพ แต่จะเห็นว่าการใช้เทคนิค orchestrator แทนการใช้โมเดล LLM รันเดี่ยวๆ ให้ผลการทดลองที่ดีขึ้นอย่างชัดเจน
งานวิจัยนี้ของ Microsoft AI ยังเป็นงานวิจัยแห้ง คือ อ่านเคสที่บันทึกไว้เท่านั้น ไมโครซอฟท์บอกว่าขั้นถัดไปคือนำไปทดสอบกับเคสผู้ป่วยจริง เพื่อยืนยันว่าผลการวินิจฉัยด้วย AI ถูกต้องจริงๆ หรือไม่ ซึ่งต้องรอกระบวนการอนุมัติของหน่วยงานกำกับดูแลด้านการแพทย์ต่อไป
ที่มา - Microsoft, งานวิจัยฉบับเต็ม
mk Tue, 01/07/2025 - 09:16We're taking a big step towards medical superintelligence. AI models have aced multiple choice medical exams – but real patients don’t come with ABC answer options. Now MAI-DxO can solve some of the world’s toughest open-ended cases with higher accuracy and lower costs. pic.twitter.com/PVMdxIwhhx
— Mustafa Suleyman (@mustafasuleyman) June 30, 2025
Continue reading...