news ผลทดสอบ Grok 4 ในชุดทดสอบ ARC-AGI 2 นำ Claude Opus 4 เท่าตัว

News · Jul 11, 2025

ผลทดสอบ Grok 4 ในชุดทดสอบ ARC-AGI 2 นำ Claude Opus 4 เท่าตัว
Body

หลังจาก xAI เปิดตัว Grok 4 ออกมา ตอนนี้ผลทดสอบต่างๆ ตอนนี้ผลทดสอบต่างๆ ก็เริ่มออกตามมา และดูเหมือน Grok 4 จะเป็นโมเดลปัญญาประดิิษฐ์ที่ฉลาดที่สุดตามที่ Elon Musk อ้างไว้จริงๆ

ผลทดสอบสำคัญคือ ARC-AGI 2 ชุดทดสอบความฉลาดแบบมนุษย์ มนุษย์โดยทั่วไปทำคะแนนได้สูง 60% แต่ปัญญาประดิษฐ์กลับทำได้แย่ ตอนนี้ Grok 4 คะแนนได้ถึง 15.9% นับว่ากระโดดเกือบสองเท่าตัวจาก Claude Opus 4 Thinking เทียบกับ Grok 3 ที่แก้ปัญหาในชุดทดสอบนี้ไม่ได้เลย

ในแง่ของราคาสำหรับการแก้ปัญหายากๆ นั้น Grok 4 ใช้ต้นทุนพอๆ กับ Claude Opus 4 ประมาณข้อละ 1.9 ดอลลาร์

ทางด้าน Artificial Analysis เว็บรวบรวมผลทดสอบปัญญาประดิษฐ์ทั้งความฉลาด, ราคา, และความเร็ว ให้คะแนนความฉลาดแบบดัชนีรวมกับ Grok 4 ไว้สูงสุด 73 คะแนน หากนับเฉพาะด้านการเขียนโปรแกรมก็ยังเป็นที่หนึ่ง นำ o4-mini-high ไปเล็กน้อย

ที่มา - Arc Prize

lew Fri, 11/07/2025 - 01:42

Continue reading...

Theme editor

Page Setup Appearance

Page Width

Toggle Page Width

Color Pickers

Toggle color picker

Typography

Node Layout

Enable grid layout

Styles

Languages

Style variation

news ผลทดสอบ Grok 4 ในชุดทดสอบ ARC-AGI 2 นำ Claude Opus 4 เท่าตัว

News

Active member

Legal Notice

Theme editor

Page Setup Appearance

Page Width

Toggle Page Width

Color Pickers

Toggle color picker

Typography

Node Layout

Enable grid layout

Styles

Languages

Style variation

news ผลทดสอบ Grok 4 ในชุดทดสอบ ARC-AGI 2 นำ Claude Opus 4 เท่าตัว

News News is verified member.

Active member

Legal Notice

News