NVIDIA เปิดตัว Rubin CPX จีพียูสำหรับรัน AI สร้างวิดีโอ-เขียนโค้ดที่ต้องการ token หลักล้าน
Body
บ้านใหญ่ NVIDIA โชว์ชิปตัวใหม่ Rubin CPX ที่ไม่รู้ว่ายังเรียก "GPU" ได้อีกไหม (แต่ NVIDIA ยังใช้คำว่า GPU อยู่นะครับ) มันคือชิปเร่งความเร็วการรัน AI (inference) ที่ออกแบบมาสำหรับงานยุคสมัยนี้ที่ต้องการ token จำนวนมากๆ เป็นหลักล้าน ตัวอย่างคือ งานเขียนโค้ด และงานสร้างวิดีโอ
Rubin CPX เป็นแขนงย่อยของ ชิป NVIDIA Rubin ที่จะออกปลายปี 2026 ตามระบบการออกชิปใหม่ทุกสองปี (ของปีนี้คือ Blackwell Ultra ที่เป็นการอัพเกรด Blackwell ของปี 2024) ดังนั้น Rubin CPX มีกำหนดขายจริงช่วงปลายปี 2026 เช่นกัน
NVIDIA เรียก Rubin CPX ว่าเป็น GPU สำหรับงานเฉพาะทางที่ต้องการ context ขนาดใหญ่มาก (GPU purpose-built for massive-context processing) เช่น งานสร้างวิดีโอที่ต้องใช้ token เกิน 1 ล้านต่อชั่วโมง หรืองานเขียนโค้ดที่ต้องอ่านโค้ดขนาดใหญ่มากๆ ซึ่งเป็นข้อจำกัดของจีพียูยุคก่อนๆ
NVIDIA อธิบายว่างานรัน AI หรือ inference แบ่งออกเป็น 2 เฟสคือ context phase ที่ใช้อ่านข้อมูล ต้องใช้พลังประมวลผลสูง (compute-bound) เพื่อย่อยข้อมูลขนาดใหญ่ และ generation phase ที่ใช้สร้างผลงาน ต้องใช้แบนด์วิดท์หน่วยความจำเยอะๆ (memory bandwidth-bound) เพื่อให้ token ออกมาเร็วมากพอ
เทคนิคที่ NVIDIA ใช้งานเรียกว่า disaggregated inference แยก 2 เฟสนี้ออกจากกัน ทำงานขนานกันไม่ต้องยุ่งกัน แต่ละส่วนสามารถรีดประสิทธิภาพได้ดีขึ้น ข้อจำกัดของวิธีการนี้คือความซับซ้อนของระบบสูงขึ้น ต้องจัดการ key-value cache ที่ใช้เชื่อมระหว่าง 2 เฟสอย่างแม่นยำ จัดการหน่วยความจำให้ดีขึ้น ทำให้ NVIDIA ออกแบบ Rubin CPX ขึ้นมาเพื่องานลักษณะนี้โดยตรง
ตัวชิป Rubin CPX มีสมรรถนะสูงสุด 30 petaflops (ความแม่นยำแบบ FP4), แรม 128GB GDDR7, มีตัวเข้ารหัส-ถอดรหัสวิดีโอที่ระดับฮาร์ดแวร์, ประสิทธิภาพด้าน AI ดีขึ้น 3 เท่าเมื่อเทียบกับ NVIDIA GB300
ตัวเครื่องที่รัน Rubin CPX เรียกว่าแพลตฟอร์ม NVIDIA Vera Rubin NVL144 CPX สามารถใช้ร่วมกับแพลตฟอร์ม Vera Rubin NVL144 ตัวมาตรฐาน (ไม่ใช่ CPX) ได้ สเปกคือซีพียู Vera 36 ตัว, จีพียู Rubin ปกติ 144 ตัว และจีพียู Rubin CPX อีก 144 ตัว แพลตฟอร์มมีสมรรถนะด้าน AI ที่ 8 exaflops, แรม 100TB แบนด์วิดท์ 1.7 petabytes per second
ตัวอย่างลูกค้าที่ประกาศใช้งานแล้วคือ Cursor บริษัท AI ช่วยเขียนโค้ด และ Runway บริษัท AI สร้างวิดีโอ
ที่มา - NVIDIA, NVIDIA
mk Wed, 10/09/2025 - 08:57
Continue reading...
Body
บ้านใหญ่ NVIDIA โชว์ชิปตัวใหม่ Rubin CPX ที่ไม่รู้ว่ายังเรียก "GPU" ได้อีกไหม (แต่ NVIDIA ยังใช้คำว่า GPU อยู่นะครับ) มันคือชิปเร่งความเร็วการรัน AI (inference) ที่ออกแบบมาสำหรับงานยุคสมัยนี้ที่ต้องการ token จำนวนมากๆ เป็นหลักล้าน ตัวอย่างคือ งานเขียนโค้ด และงานสร้างวิดีโอ
Rubin CPX เป็นแขนงย่อยของ ชิป NVIDIA Rubin ที่จะออกปลายปี 2026 ตามระบบการออกชิปใหม่ทุกสองปี (ของปีนี้คือ Blackwell Ultra ที่เป็นการอัพเกรด Blackwell ของปี 2024) ดังนั้น Rubin CPX มีกำหนดขายจริงช่วงปลายปี 2026 เช่นกัน
NVIDIA เรียก Rubin CPX ว่าเป็น GPU สำหรับงานเฉพาะทางที่ต้องการ context ขนาดใหญ่มาก (GPU purpose-built for massive-context processing) เช่น งานสร้างวิดีโอที่ต้องใช้ token เกิน 1 ล้านต่อชั่วโมง หรืองานเขียนโค้ดที่ต้องอ่านโค้ดขนาดใหญ่มากๆ ซึ่งเป็นข้อจำกัดของจีพียูยุคก่อนๆ
NVIDIA อธิบายว่างานรัน AI หรือ inference แบ่งออกเป็น 2 เฟสคือ context phase ที่ใช้อ่านข้อมูล ต้องใช้พลังประมวลผลสูง (compute-bound) เพื่อย่อยข้อมูลขนาดใหญ่ และ generation phase ที่ใช้สร้างผลงาน ต้องใช้แบนด์วิดท์หน่วยความจำเยอะๆ (memory bandwidth-bound) เพื่อให้ token ออกมาเร็วมากพอ
เทคนิคที่ NVIDIA ใช้งานเรียกว่า disaggregated inference แยก 2 เฟสนี้ออกจากกัน ทำงานขนานกันไม่ต้องยุ่งกัน แต่ละส่วนสามารถรีดประสิทธิภาพได้ดีขึ้น ข้อจำกัดของวิธีการนี้คือความซับซ้อนของระบบสูงขึ้น ต้องจัดการ key-value cache ที่ใช้เชื่อมระหว่าง 2 เฟสอย่างแม่นยำ จัดการหน่วยความจำให้ดีขึ้น ทำให้ NVIDIA ออกแบบ Rubin CPX ขึ้นมาเพื่องานลักษณะนี้โดยตรง
ตัวชิป Rubin CPX มีสมรรถนะสูงสุด 30 petaflops (ความแม่นยำแบบ FP4), แรม 128GB GDDR7, มีตัวเข้ารหัส-ถอดรหัสวิดีโอที่ระดับฮาร์ดแวร์, ประสิทธิภาพด้าน AI ดีขึ้น 3 เท่าเมื่อเทียบกับ NVIDIA GB300
ตัวเครื่องที่รัน Rubin CPX เรียกว่าแพลตฟอร์ม NVIDIA Vera Rubin NVL144 CPX สามารถใช้ร่วมกับแพลตฟอร์ม Vera Rubin NVL144 ตัวมาตรฐาน (ไม่ใช่ CPX) ได้ สเปกคือซีพียู Vera 36 ตัว, จีพียู Rubin ปกติ 144 ตัว และจีพียู Rubin CPX อีก 144 ตัว แพลตฟอร์มมีสมรรถนะด้าน AI ที่ 8 exaflops, แรม 100TB แบนด์วิดท์ 1.7 petabytes per second
ตัวอย่างลูกค้าที่ประกาศใช้งานแล้วคือ Cursor บริษัท AI ช่วยเขียนโค้ด และ Runway บริษัท AI สร้างวิดีโอ
ที่มา - NVIDIA, NVIDIA
mk Wed, 10/09/2025 - 08:57
Continue reading...