กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


News

ข่าว ผลทดสอบ Grok 4 ในชุดทดสอบ ARC-AGI 2 นำ Claude Opus 4 เท่าตัว

News 

Active member

สมาชิกทีมงาน
Moderator
Distributor
ผลทดสอบ Grok 4 ในชุดทดสอบ ARC-AGI 2 นำ Claude Opus 4 เท่าตัว
Body

หลังจาก xAI เปิดตัว Grok 4 ออกมา ตอนนี้ผลทดสอบต่างๆ ตอนนี้ผลทดสอบต่างๆ ก็เริ่มออกตามมา และดูเหมือน Grok 4 จะเป็นโมเดลปัญญาประดิิษฐ์ที่ฉลาดที่สุดตามที่ Elon Musk อ้างไว้จริงๆ

ผลทดสอบสำคัญคือ ARC-AGI 2 ชุดทดสอบความฉลาดแบบมนุษย์ มนุษย์โดยทั่วไปทำคะแนนได้สูง 60% แต่ปัญญาประดิษฐ์กลับทำได้แย่ ตอนนี้ Grok 4 คะแนนได้ถึง 15.9% นับว่ากระโดดเกือบสองเท่าตัวจาก Claude Opus 4 Thinking เทียบกับ Grok 3 ที่แก้ปัญหาในชุดทดสอบนี้ไม่ได้เลย

ในแง่ของราคาสำหรับการแก้ปัญหายากๆ นั้น Grok 4 ใช้ต้นทุนพอๆ กับ Claude Opus 4 ประมาณข้อละ 1.9 ดอลลาร์

ทางด้าน Artificial Analysis เว็บรวบรวมผลทดสอบปัญญาประดิษฐ์ทั้งความฉลาด, ราคา, และความเร็ว ให้คะแนนความฉลาดแบบดัชนีรวมกับ Grok 4 ไว้สูงสุด 73 คะแนน หากนับเฉพาะด้านการเขียนโปรแกรมก็ยังเป็นที่หนึ่ง นำ o4-mini-high ไปเล็กน้อย

ที่มา - Arc Prize

alt


lew Fri, 11/07/2025 - 01:42

Continue reading...
 



กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม ด้านล่าง