อันนี้ต้องโทษ AI? พบกราฟนำเสนอในงานเปิดตัว GPT-5 หลายอัน สเกลผิดเพี้ยนไปมาก
Body
มีประเด็นเล็ก ๆ จากงานเปิดตัวโมเดล GPT-5 ของ OpenAI เมื่อคืนนี้ เมื่อทีมงานพูดถึงผลการทดสอบความสามารถโมเดล AI ในด้านต่าง ๆ และเปรียบเทียบกับโมเดลรุ่นก่อนหน้า ด้วยกราฟแท่งของคะแนนเปรียบเทียบกัน แต่มีอะไรให้เอ๊ะอยู่บ้าง
กราฟแรกเป็นอัตราการสร้างผลลัพธ์ลวงที่ไม่สามารถทำได้จริง (Deception Rate) ซึ่งระบุว่า GPT-5 ทำได้ที่ 50% แต่กราฟที่แสดงนั้นดูเพี้ยนไปเมื่อเทียบกับ o3 ที่ 47.4% ทั้งนี้ในรายงานฉบับเต็มของ OpenAI ตัวเลขจริงอยู่ที่ 16.5% ด้วย
กราฟอีกอันเป็นผลทดสอบ SWE-bench เรื่อง Software Engineering ซึ่ง GPT-5 ทำคะแนนได้ 74.9% ดีกว่า o3 ที่ 69.1% แต่กราฟที่แสดงดูผิดสัดส่วนไปมาก โดยเฉพาะเมื่อเทียบกับ GPT-4o ที่ 30.8%
Sam Altman ซีอีโอ OpenAI ตอบประเด็นนี้ใน X ว่าเป็นการสร้างกราฟที่ผิดพลาดมาก อย่างไรก็ตามในโพสต์ทางการบนเว็บ OpenAI กราฟทั้งหมดแสดงผลอย่างถูกต้องแล้ว เช่นเดียวกับตัวแทนฝ่ายการตลาดของ OpenAI ออกมาชี้แจงว่าได้แก้ไขตารางนี้แบบทางการไปแล้ว
ที่มา: The Verge
arjin Fri, 08/08/2025 - 13:29
Continue reading...
Body
มีประเด็นเล็ก ๆ จากงานเปิดตัวโมเดล GPT-5 ของ OpenAI เมื่อคืนนี้ เมื่อทีมงานพูดถึงผลการทดสอบความสามารถโมเดล AI ในด้านต่าง ๆ และเปรียบเทียบกับโมเดลรุ่นก่อนหน้า ด้วยกราฟแท่งของคะแนนเปรียบเทียบกัน แต่มีอะไรให้เอ๊ะอยู่บ้าง
กราฟแรกเป็นอัตราการสร้างผลลัพธ์ลวงที่ไม่สามารถทำได้จริง (Deception Rate) ซึ่งระบุว่า GPT-5 ทำได้ที่ 50% แต่กราฟที่แสดงนั้นดูเพี้ยนไปเมื่อเทียบกับ o3 ที่ 47.4% ทั้งนี้ในรายงานฉบับเต็มของ OpenAI ตัวเลขจริงอยู่ที่ 16.5% ด้วย
กราฟอีกอันเป็นผลทดสอบ SWE-bench เรื่อง Software Engineering ซึ่ง GPT-5 ทำคะแนนได้ 74.9% ดีกว่า o3 ที่ 69.1% แต่กราฟที่แสดงดูผิดสัดส่วนไปมาก โดยเฉพาะเมื่อเทียบกับ GPT-4o ที่ 30.8%
Sam Altman ซีอีโอ OpenAI ตอบประเด็นนี้ใน X ว่าเป็นการสร้างกราฟที่ผิดพลาดมาก อย่างไรก็ตามในโพสต์ทางการบนเว็บ OpenAI กราฟทั้งหมดแสดงผลอย่างถูกต้องแล้ว เช่นเดียวกับตัวแทนฝ่ายการตลาดของ OpenAI ออกมาชี้แจงว่าได้แก้ไขตารางนี้แบบทางการไปแล้ว
ที่มา: The Verge
arjin Fri, 08/08/2025 - 13:29
Continue reading...