Cerebras เปิดบริการผู้ช่วยเขียนโปรแกรม ใช้ Qwen3-Coder FP8 มาให้บริการ ไม่มีโควต้ารายสัปดาห์
Body
Cerebras ผู้พัฒนาชิปที่ผันตัวมาให้บริการ LLM เปิดบริการ Cerebras Code ด้วยโมเดล Qwen3-Coder ที่เริ่มใกล้เคียงกับ Claude 4 Sonnet อย่างไรก็ดี Cerebras ให้บริการโมเดลย่อแบบ FP8 ทำให้ประสิทธิภาพลดลง
จุดขายของ Cerebras Code คือ ความเร็วที่สูงมาก ระดับ 2,000 token/s ทำให้ระยะเวลารอโค้ดสั้นลง นอกจากนี้ยังมีข้อจำกัดเฉพาะโควต้าข้อความรายวันเท่านั้น
แพ็กเกจมีสองระดับ ได้แก่
ความพิเศษของ Cerebras คือแม้จะเป็นบริการผู้ช่วยเขียนโค้ด แต่ที่จริงแล้วผู้ใช้ยังคงได้รับ API key ไปใช้งานแอปภายนอกได้อยู่ดี
ที่มา - @CerebrasSystems
lew Sat, 02/08/2025 - 10:38
Continue reading...
Body
Cerebras ผู้พัฒนาชิปที่ผันตัวมาให้บริการ LLM เปิดบริการ Cerebras Code ด้วยโมเดล Qwen3-Coder ที่เริ่มใกล้เคียงกับ Claude 4 Sonnet อย่างไรก็ดี Cerebras ให้บริการโมเดลย่อแบบ FP8 ทำให้ประสิทธิภาพลดลง
จุดขายของ Cerebras Code คือ ความเร็วที่สูงมาก ระดับ 2,000 token/s ทำให้ระยะเวลารอโค้ดสั้นลง นอกจากนี้ยังมีข้อจำกัดเฉพาะโควต้าข้อความรายวันเท่านั้น
แพ็กเกจมีสองระดับ ได้แก่
- Cerebras Code Pro: ส่งข้อความ 1,000 ข้อความต่อวัน อย่างไรก็ดี Cerebras นับข้อความด้วยปริมาณโทเค็นด้วย ทำให้อยู่ที่ประมาณ 8 ล้านโทเค็นต่อวัน
- Cerebras Code Max: ส่งข้อความได้ 5,000 ข้อความต่อวัน หรือประมาณ 40 ล้านโทเค็น
ความพิเศษของ Cerebras คือแม้จะเป็นบริการผู้ช่วยเขียนโค้ด แต่ที่จริงแล้วผู้ใช้ยังคงได้รับ API key ไปใช้งานแอปภายนอกได้อยู่ดี
ที่มา - @CerebrasSystems
lew Sat, 02/08/2025 - 10:38
Continue reading...