DeepSeek ออกโมเดล V3.1 เพิ่มฟีเจอร์ Hybrid Thinking ประสิทธิภาพใกล้เคียง R1
Body
หลังจากเงียบหายไปหลายเดือน DeepSeek กลับมาแล้วกับโมเดลเวอร์ชันใหม่ DeepSeek-V3.1 ที่เพิ่มฟีเจอร์ hybrid thinking mode ใช้โมเดลตัวเดียวเลือกโหมดได้ระหว่าง thinking (สำหรับงาน research) กับ non-thinking (สำหรับงาน chat ทั่วไป)
เดิมทีนั้น โมเดลสายหลักของ DeepSeek คือ V3 ที่พัฒนาต่อจาก V2 แต่เมื่อต้นปีนี้ บริษัทสร้างชื่อในระดับโลก จากโมเดลสาย R1 ที่มี reasoning และทำคะแนนในเบนช์มาร์คต่างๆ ได้สูง
โมเดล DeepSeek V3.1 ปรับปรุงการทำงานให้โหมด thinking มีคุณภาพคำตอบทัดเทียมกับโมเดลรุ่น R1 แต่มีข้อดีเรื่องตอบเร็วกว่า นอกจากนี้ยังเพิ่มความสามารถด้าน agentic ให้ดีขึ้น รองรับการเรียกใช้เครื่องมือภายนอก สั่งให้ทำงานเป็นขั้นเป็นตอนได้
ถึงแม้ DeepSeek V3.1 ไม่ใช่โมเดลเรือธงตัวใหม่ (ยังไม่ใช่ R2) และเป็นการปรับปรุงขึ้นจาก V3 แต่ประเด็นสำคัญอีกอย่างของ DeepSeek V3.1 คือรองรับข้อมูลประเภท UE8M0 FP8 (8-bit unsigned floating-point format with 8 bits for exponent and 0 bits for mantissa) ที่ เริ่มได้รับความนิยมในจีพียูหรือชิปเร่งความเร็ว AI รุ่นหลังๆ และชิป NVIDIA รองรับได้สักระยะแล้ว
ความสำคัญของเรื่องนี้คือ DeepSeek ระบุว่า UE3M0 จะใช้งานกับ "ชิปเร่งความเร็ว AI จีน" ที่จะเปิดตัวในเร็วๆ นี้ แต่ไม่บอกว่าจากผู้ผลิตรายใด ซึ่งเว็บไซต์ The Register คาดเดาว่าน่าจะเป็น Huawei
DeepSeek V3.1 เปิดให้ทดลองใช้งานแล้วจากหน้า DeepSeek Chat ตัวโมเดลสามารถดาวน์โหลดได้จาก Hugging Face
ที่มา - DeepSeek, The Register, Bloomberg
Continue reading...
Body
หลังจากเงียบหายไปหลายเดือน DeepSeek กลับมาแล้วกับโมเดลเวอร์ชันใหม่ DeepSeek-V3.1 ที่เพิ่มฟีเจอร์ hybrid thinking mode ใช้โมเดลตัวเดียวเลือกโหมดได้ระหว่าง thinking (สำหรับงาน research) กับ non-thinking (สำหรับงาน chat ทั่วไป)
เดิมทีนั้น โมเดลสายหลักของ DeepSeek คือ V3 ที่พัฒนาต่อจาก V2 แต่เมื่อต้นปีนี้ บริษัทสร้างชื่อในระดับโลก จากโมเดลสาย R1 ที่มี reasoning และทำคะแนนในเบนช์มาร์คต่างๆ ได้สูง
โมเดล DeepSeek V3.1 ปรับปรุงการทำงานให้โหมด thinking มีคุณภาพคำตอบทัดเทียมกับโมเดลรุ่น R1 แต่มีข้อดีเรื่องตอบเร็วกว่า นอกจากนี้ยังเพิ่มความสามารถด้าน agentic ให้ดีขึ้น รองรับการเรียกใช้เครื่องมือภายนอก สั่งให้ทำงานเป็นขั้นเป็นตอนได้
ถึงแม้ DeepSeek V3.1 ไม่ใช่โมเดลเรือธงตัวใหม่ (ยังไม่ใช่ R2) และเป็นการปรับปรุงขึ้นจาก V3 แต่ประเด็นสำคัญอีกอย่างของ DeepSeek V3.1 คือรองรับข้อมูลประเภท UE8M0 FP8 (8-bit unsigned floating-point format with 8 bits for exponent and 0 bits for mantissa) ที่ เริ่มได้รับความนิยมในจีพียูหรือชิปเร่งความเร็ว AI รุ่นหลังๆ และชิป NVIDIA รองรับได้สักระยะแล้ว
ความสำคัญของเรื่องนี้คือ DeepSeek ระบุว่า UE3M0 จะใช้งานกับ "ชิปเร่งความเร็ว AI จีน" ที่จะเปิดตัวในเร็วๆ นี้ แต่ไม่บอกว่าจากผู้ผลิตรายใด ซึ่งเว็บไซต์ The Register คาดเดาว่าน่าจะเป็น Huawei
DeepSeek V3.1 เปิดให้ทดลองใช้งานแล้วจากหน้า DeepSeek Chat ตัวโมเดลสามารถดาวน์โหลดได้จาก Hugging Face
ที่มา - DeepSeek, The Register, Bloomberg
mk Fri, 22/08/2025 - 09:44Introducing DeepSeek-V3.1: our first step toward the agent era!Hybrid inference: Think & Non-Think — one model, two modes
️ Faster thinking: DeepSeek-V3.1-Think reaches answers in less time vs. DeepSeek-R1-0528
Stronger agent skills: Post-training boosts tool use and…
— DeepSeek (@deepseek_ai) August 21, 2025
Continue reading...