Alibaba Cloud ระบุ Qwen3-Coder เทียบเท่า Cluade 4 Sonnet แล้ว
Body
หลังจาก Alibaba Cloud เปิดตัว
ชุดข้อมูลที่ใช้ฝึกมีขนาด 7.5T tokens โดย 70% ของชุดข้อมูลเป็นโค้ด และใช้ข้อมูลสังเคราะห์เพิ่มเติม พร้อมกับใช้ Qwen2.5-Coder มาคัดกรองข้อมูลคุณภาพต่ำออกไป จากนั้นฝึกแบบ reinforcement learning (RL) ด้วยปัญหาที่แก้ยากแต่ตรวจง่าย เร่งให้มีความสามารถสูงขึ้นไปอีก
ทีมงาน Qwen ออกโปรแกรม Qwen Code โดยแปลงมาจาก Gemini CLI และยังเปิด API ให้ใช้งานผ่าน Claude Code ได้ด้วย
ทาง Alibaba Cloud เปิด API ของ Qwen3-Coder ให้ใช้งานแล้ว แต่แนวทางคิดราคาแบ่งระดับอย่างละเอียด ราคาเริ่มต้น 1 ดอลลาร์ต่อล้านโทเค็น แต่ต้องใส่อินพุตไม่เกิน 32K token ไล่ขึ้นไปถึง 6 ดอลลาร์ต่อล้านโทเค็นซึ่งแพงกว่า Claude 4 Sonnet เสียอีก
ที่มา - QwenLM
lew Wed, 23/07/2025 - 13:20
Continue reading...
Body
หลังจาก Alibaba Cloud เปิดตัว
Qwen3-235B-A22B-Instruct-2507
ไปเมื่อวานนี้โดยระบุเน้นความสามารถในการเขียนโปรแกรม ตอนนี้ก็ออกโมเดล Qwen3-Coder
ชุดโมเดลที่ฝึกสำหรับการเขียนโปรแกรมโดยเฉพาะ ตัวใหญ่ที่สุดคือ Qwen3-Coder-480B-A35B-Instruct
มีความสามารถระดับเดียวกับ Claude 4 Sonnetชุดข้อมูลที่ใช้ฝึกมีขนาด 7.5T tokens โดย 70% ของชุดข้อมูลเป็นโค้ด และใช้ข้อมูลสังเคราะห์เพิ่มเติม พร้อมกับใช้ Qwen2.5-Coder มาคัดกรองข้อมูลคุณภาพต่ำออกไป จากนั้นฝึกแบบ reinforcement learning (RL) ด้วยปัญหาที่แก้ยากแต่ตรวจง่าย เร่งให้มีความสามารถสูงขึ้นไปอีก
ทีมงาน Qwen ออกโปรแกรม Qwen Code โดยแปลงมาจาก Gemini CLI และยังเปิด API ให้ใช้งานผ่าน Claude Code ได้ด้วย
ทาง Alibaba Cloud เปิด API ของ Qwen3-Coder ให้ใช้งานแล้ว แต่แนวทางคิดราคาแบ่งระดับอย่างละเอียด ราคาเริ่มต้น 1 ดอลลาร์ต่อล้านโทเค็น แต่ต้องใส่อินพุตไม่เกิน 32K token ไล่ขึ้นไปถึง 6 ดอลลาร์ต่อล้านโทเค็นซึ่งแพงกว่า Claude 4 Sonnet เสียอีก
ที่มา - QwenLM
lew Wed, 23/07/2025 - 13:20
Continue reading...