ตัวแก้ไขธีม

กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


News

ข่าว ผล MLPerf 6.0: NVIDIA โชว์ TensorRT-LLM รีดประสิทธิภาพ Blackwell ได้ 2.7 เท่า, AMD โชว์ MI355X เข้าใกล้ Blackwell, Intel ใช้ B70 ทำเซิร์ฟเวอร์คุ้มราคา

News 

Active member
สมาชิกทีมงาน
Moderator
Distributor
เจ้าของกระทู้
ผล MLPerf 6.0: NVIDIA โชว์ TensorRT-LLM รีดประสิทธิภาพ Blackwell ได้ 2.7 เท่า, AMD โชว์ MI355X เข้าใกล้ Blackwell, Intel ใช้ B70 ทำเซิร์ฟเวอร์คุ้มราคา
Body

วันนี้ทาง MLCommons ประกาศผลการวัดประสิทธิภาพ MLPerf 6.0 ประเด็นสำคัญในรอบนี้คือการโชว์ประสิทธิภาพการรันโมเดล LLM เช่น DeepSeek-R1, GPT-OSS-120B, Llama2-70B, Qwen3-VL-235B-A22B โดยผู้ผลิตเซิร์ฟเวอร์และผู้ผลิตชิปเข้าร่วมจำนวนมาก

NVIDIA ในฐานะผู้นำตลาดชูประเด็นว่ามีผู้ผลิตส่งเซิร์ฟเวอร์เข้าร่วมทดสอบจำนวนมาก และยังทำราคาต่อโทเค็นได้ดีที่สุดในตลาด จุดสำคัญในรอบนี้คือการปรับปรุงซอฟต์แวร์ TensorRT-LLM ที่ทำให้รัน DeepSeek-R1 ได้โทเค็นต่อวินาทีสูงขึ้นถึง 2.7 เท่าตัวบนเซิร์ฟเวอร์ NVIDIA GB300 NVL72 เครื่องเดิม อาศัยเทคนิคการออปติไมซ์หลายอย่างของ NVIDIA Dynamo เช่น การแยกส่วน prefill และ decode ออกจากกัน, รัน MoE แบบขนานมากขึ้น, ทำ multi-token prediction, และเลือกใช้ worker อย่างฉลาด

alt


AMD นำเสนอชิป MI355X ที่ประสิทธิภาพการรัน Llama2-70B เทียบกับชิปรุ่นก่อน MI325X สูงขึ้นถึง 3.1 เท่าตัว และตอนนี้ประสิทธิภาพการรันเทียบเท่า NVIDIA B200 แล้ว แม้ยังตาม NVIDIA B300 อยู่บ้าง ขณะที่ซอฟต์แวร์ ROCm ช่วยเร่งประสิทธิภาพการรันแบบ FP4, การสื่อสารข้ามเครื่อง, และการจัดการโหลดในคลัสเตอร์ โดยปีนี้ AMD จะเปิดตัว MI400 ต่อไป

Intel ปีนี้เลิกโชว์ชิป Gaudi ไปแล้ว แต่หันมาโชว์ชิป Arc Pro B70 ที่เพิ่งเปิดตัวมา อินเทลใส่การ์ด B70 สี่ใบทำให้มีแรมรวม 128GB เพียงพอสำหรับรันโมเดล GPT-OSS-120B ประสิทธิภาพดีกว่า Intel B60 อยู่ 18% จุดขายสำคัญคือ Arc Pro B70/B65 นั้นรองรับฟีเจอร์สำหรับองค์กร เช่น แรม ECC, ระบบการจัดการระดับองค์กร, รองรับ container

ที่มา - NVIDIA, AMD, Intel

lew Thu, 02/04/2026 - 11:20

Continue reading...
 


กลับ
ยอดนิยม ด้านล่าง