กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


NVIDIA เปิดตัว Llama Nemotron Reasoning โมเดล AI คิดก่อนตอบ เปิดชุดข้อมูลฝึกด้วย

ข่าว NVIDIA เปิดตัว Llama Nemotron Reasoning โมเดล AI คิดก่อนตอบ เปิดชุดข้อมูลฝึกด้วย

  • ผู้เริ่มหัวข้อ ผู้เริ่มหัวข้อ News 
  • วันที่เริ่มต้น วันที่เริ่มต้น

News 

Active member

สมาชิกทีมงาน
Moderator
Collaborate
NVIDIA เปิดตัวโมเดล Llama Nemotron Reasoning ชุดโมเดล LLM แบบคิดก่อนตอบที่ช่วยเพิ่มความแม่นยำของคำตอบขึ้น 20% โดยฝึกต่อจาก Llama ด้วยชุดข้อมูลแสดงวิธีคิด

ทาง NVIDIA สร้างชุดข้อมูลคิดก่อนตอบขนาด 60,000 ล้านโทเค็น โดยใช้คนมาช่วยดูข้อมูลอีกครั้ง รวมใช้เวลาตรวจข้อมูล 45,000 ชั่วโมง ใช้เวลารันโมเดลด้วย H100 รวม 360,000 ชั่วโมง

โมเดลมี 3 ขนาด ได้แก่ Nano ขนาดเล็กมาก, Super สำหรับการรันบน GPU สำหรับเซิร์ฟเวอร์ตัวเดียว, และ Ultra สำหรับการรันในเซิร์ฟเวอร์หลาย GPU โดยทาง NVIDIA ไม่ได้ฝึกเพิ่มอย่างเดียว แต่ยังตัดแต่ง (prune) โมเดลเพื่อให้โมเดลรันได้เร็วขึ้น ตัวโมเดลยังถูกฝึกให้หยุดคิดได้ในกรณีที่ผู้ใช้ต้องการคำตอบเร็วๆ จึงสามารถใช้งานได้ทั้งแบบปกติและแบบคิดก่อนตอบคล้าย Claude 3.7

ทาง NVIDIA เปิดให้ดาวน์โหลดโมเดลผ่านทาง NIM Micro Services ตอนนี้ยังมีเฉพาะรุ่น Nano และ Super ส่วนรุ่น Ultra จะปล่อยออกมาภายหลัง และจะเปิดชุดข้อมูลแสดงวิธีคิดออกมาด้วย การใช้งานเพื่อการทดสอบ, วิจัย, และพัฒนานั้นใช้งานได้ฟรี

ที่มา - NVIDIA

NVIDIA เปิดตัว Llama Nemotron Reasoning โมเดล AI คิดก่อนตอบ เปิดชุดข้อมูลฝึกด้วย-1.webp


Topics:
NVIDIA
LLM

Continue reading...
 



กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม ด้านล่าง