Claude 4 Opus เพิ่มมาตรการความปลอดภัยขั้นสูง ป้องกันนำไปใช้สร้างอาวุธ
Body
ข่าวเด่นวงการ AI วันนี้คือ การเปิดตัวโมเดล Claude 4 ของ Anthropic แต่ความสามารถที่สูงขึ้น ก็มาพร้อมกับความรับผิดชอบที่เพิ่มขึ้นด้วย
Anthropic ประกาศว่า Claude 4 Opus ซึ่งเป็นโมเดลรุ่นท็อปสุด จะมีมาตรการป้องกันโมเดลระดับสูงขึ้นด้วยคือ AI Safety Level 3 (ASL-3)
ASL-3 เป็นมาตรการความปลอดภัยระดับ 3 ตามการแบ่งสเกล Responsible Scaling Policy ที่ Anthropic กำหนดขึ้นเอง ซึ่งมีทั้งหมด 5 ระดับ
ก่อนหน้านี้โมเดลทุกตัวของ Anthropic มีความปลอดภัยระดับ ASL-2 แปลว่ามีมาตรการความปลอดภัยครบถ้วน ป้องกันการนำโมเดลไปใช้ช่วยสร้างอาวุธเคมี ชีวภาพ รังสี นิวเคลียร์ (chemical, biological, radiological, and nuclear หรือตัวย่อ CBRN)
แต่ Claude 4 Opus เป็นโมเดลตัวแรกที่ยกระดับเป็น ASL-3 ป้องกันการตอบคำถามที่เกี่ยวข้องกับหัวข้อ CBRN เข้มงวดขึ้น Anthropic บอกว่าถ้าเป็นคนทั่วไปที่มีพื้นฐานความรู้ด้าน STEM อยู่บ้าง แล้วลองถาม Claude 4 Opus จะไม่ได้รับคำตอบใดๆ เกี่ยวกับหัวข้อนี้เลย (ทดสอบ jailbreak ด้วยทีมภายในคือ red-teaming แล้วโมเดลยังเอาอยู่) ถือว่าป้องกันได้ในกรณีทั่วๆ ไปที่ไม่ใช่การโจมตีโมเดลโดยหน่วยงานรัฐบาล (state actors)
ที่มา - Anthropic
mk Fri, 23/05/2025 - 13:37
Continue reading...
Body
ข่าวเด่นวงการ AI วันนี้คือ การเปิดตัวโมเดล Claude 4 ของ Anthropic แต่ความสามารถที่สูงขึ้น ก็มาพร้อมกับความรับผิดชอบที่เพิ่มขึ้นด้วย
Anthropic ประกาศว่า Claude 4 Opus ซึ่งเป็นโมเดลรุ่นท็อปสุด จะมีมาตรการป้องกันโมเดลระดับสูงขึ้นด้วยคือ AI Safety Level 3 (ASL-3)
ASL-3 เป็นมาตรการความปลอดภัยระดับ 3 ตามการแบ่งสเกล Responsible Scaling Policy ที่ Anthropic กำหนดขึ้นเอง ซึ่งมีทั้งหมด 5 ระดับ
ก่อนหน้านี้โมเดลทุกตัวของ Anthropic มีความปลอดภัยระดับ ASL-2 แปลว่ามีมาตรการความปลอดภัยครบถ้วน ป้องกันการนำโมเดลไปใช้ช่วยสร้างอาวุธเคมี ชีวภาพ รังสี นิวเคลียร์ (chemical, biological, radiological, and nuclear หรือตัวย่อ CBRN)
แต่ Claude 4 Opus เป็นโมเดลตัวแรกที่ยกระดับเป็น ASL-3 ป้องกันการตอบคำถามที่เกี่ยวข้องกับหัวข้อ CBRN เข้มงวดขึ้น Anthropic บอกว่าถ้าเป็นคนทั่วไปที่มีพื้นฐานความรู้ด้าน STEM อยู่บ้าง แล้วลองถาม Claude 4 Opus จะไม่ได้รับคำตอบใดๆ เกี่ยวกับหัวข้อนี้เลย (ทดสอบ jailbreak ด้วยทีมภายในคือ red-teaming แล้วโมเดลยังเอาอยู่) ถือว่าป้องกันได้ในกรณีทั่วๆ ไปที่ไม่ใช่การโจมตีโมเดลโดยหน่วยงานรัฐบาล (state actors)
ที่มา - Anthropic
mk Fri, 23/05/2025 - 13:37
Continue reading...