Cloudflare ทดลอง Claude Mythos ระบุทำงานได้ระดับเดียวกับนักวิจัยซีเนียร์, ชี้อนาคตโลกไอทีแพตช์กันไม่ทัน
Body
Cloudflare รายงานถึงผลการทดสอบ Claude Mythos โมเดลปัญญาประดิษฐ์รุ่นสูงสุดของ Anthropic ที่เป็นข่าวจากการเปิดตัวด้วยการพบช่องโหว่ซอฟต์แวร์จำนวนมาก โดยพบว่าการทำงานเหนือกว่าโมเดลปัญญาประดิษฐ์อื่นๆ เพราะมีความสามารถวิเคราะห์ช่องโหว่ระดับต่ำๆ จำนวนมากว่าหากนำมาร้อยเข้าด้วยกันแล้วจะกลายเป็นการโจมตีระดับสูงได้ พร้อมความสามารถในการเขียนโปรแกรมทดสอบได้ในตัวว่าช่องโหว่ใช้เจาะได้จริงหรือไม่
เครื่องมือประสิทธิภาพสูงอย่าง Mythos กระทบต่อการกำหนด SLA ของการแพตช์ช่องโหว่ว่าควรเป็นระยะเวลาเท่าใด บางทีมใน Cloudflare เองถึงกับกำหนดระยะเวลาแพตช์ไว้เพียง 2 ชั่วโมงเท่านั้น แต่ในความเป็นจริงไม่ใช่ซอฟต์แวร์ทุกตัวจะทำแบบเดียวกันได้ เพราะกระบวนการทดสอบอาจกินเวลายาวนานนับวัน
แนวทางหนึ่งคือการจำกัดผลของช่องโหว่แต่ละส่วนออกจากกัน ทำให้ช่องโหว่หนึ่งไม่กระทบต่อส่วนอื่นๆ
หลัง Anthropic เปิดตัว Claude Mythos ออกมาและเริ่มมีผู้ได้ทดลองใช้จริงก็มีผลทดสอบจากภายนอกออกมาเรื่อยๆ เช่นผลทดสอบจากบริษัททดสอบความปลอดภัยซอฟต์แวร์ XBOW ที่แสดงให้เห็นว่า Mythos เหนือกว่าโมเดลอื่นจริง แต่ก็เหนือกว่า GPT-5.5 ไม่มากนัก บางกรณีทดสอบแล้ว GPT-5.5 เหนือกว่าเล็กน้อย เมื่อคำนวณถึงงบประมาณที่ต้องใช้แล้ว ในราคาเท่ากัน GPT-5.5 กลับสแกนโค้ดพบช่องโหว่มากกว่า
ที่มา - Cloudflare
lew Tue, 19/05/2026 - 08:02
Continue reading...
Body
Cloudflare รายงานถึงผลการทดสอบ Claude Mythos โมเดลปัญญาประดิษฐ์รุ่นสูงสุดของ Anthropic ที่เป็นข่าวจากการเปิดตัวด้วยการพบช่องโหว่ซอฟต์แวร์จำนวนมาก โดยพบว่าการทำงานเหนือกว่าโมเดลปัญญาประดิษฐ์อื่นๆ เพราะมีความสามารถวิเคราะห์ช่องโหว่ระดับต่ำๆ จำนวนมากว่าหากนำมาร้อยเข้าด้วยกันแล้วจะกลายเป็นการโจมตีระดับสูงได้ พร้อมความสามารถในการเขียนโปรแกรมทดสอบได้ในตัวว่าช่องโหว่ใช้เจาะได้จริงหรือไม่
เครื่องมือประสิทธิภาพสูงอย่าง Mythos กระทบต่อการกำหนด SLA ของการแพตช์ช่องโหว่ว่าควรเป็นระยะเวลาเท่าใด บางทีมใน Cloudflare เองถึงกับกำหนดระยะเวลาแพตช์ไว้เพียง 2 ชั่วโมงเท่านั้น แต่ในความเป็นจริงไม่ใช่ซอฟต์แวร์ทุกตัวจะทำแบบเดียวกันได้ เพราะกระบวนการทดสอบอาจกินเวลายาวนานนับวัน
แนวทางหนึ่งคือการจำกัดผลของช่องโหว่แต่ละส่วนออกจากกัน ทำให้ช่องโหว่หนึ่งไม่กระทบต่อส่วนอื่นๆ
หลัง Anthropic เปิดตัว Claude Mythos ออกมาและเริ่มมีผู้ได้ทดลองใช้จริงก็มีผลทดสอบจากภายนอกออกมาเรื่อยๆ เช่นผลทดสอบจากบริษัททดสอบความปลอดภัยซอฟต์แวร์ XBOW ที่แสดงให้เห็นว่า Mythos เหนือกว่าโมเดลอื่นจริง แต่ก็เหนือกว่า GPT-5.5 ไม่มากนัก บางกรณีทดสอบแล้ว GPT-5.5 เหนือกว่าเล็กน้อย เมื่อคำนวณถึงงบประมาณที่ต้องใช้แล้ว ในราคาเท่ากัน GPT-5.5 กลับสแกนโค้ดพบช่องโหว่มากกว่า
ที่มา - Cloudflare
lew Tue, 19/05/2026 - 08:02
Continue reading...