กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


Tencent เปิดตัว Hunyuan T1 โมเดลคิดเป็นเหตุผล ระบุดีกว่า R1 ของ DeepSeek ทั้งผลทดสอบและต้นทุน

ข่าว Tencent เปิดตัว Hunyuan T1 โมเดลคิดเป็นเหตุผล ระบุดีกว่า R1 ของ DeepSeek ทั้งผลทดสอบและต้นทุน

  • ผู้เริ่มหัวข้อ ผู้เริ่มหัวข้อ News 
  • วันที่เริ่มต้น วันที่เริ่มต้น

News 

Active member

สมาชิกทีมงาน
Moderator
Collaborate
เข้าร่วม
1 มิถุนายน 2011
ข้อความ
12,607
คะแนนปฏิกิริยา
0
คะแนน
36
Tencent เปิดตัวโมเดลปัญญาประดิษฐ์แบบคิดเป็นเหตุผล Hunyuan T1 โดยใช้การพัฒนาโมเดลแบบ Leverages Large-scale Reinforcement Learning เหมือนกับที่ DeepSeek ใช้ในการพัฒนาโมเดล R1 และวางสถาปัตยกรรมโมเดลแบบไฮบริด ใช้ Transformer ของกูเกิลร่วมกับ Mamba ของ Carnegie Mellon University ทำให้ลดต้นทุนการฝึกฝนและรันโมเดลได้มาก

ผลทดสอบโมเดล T1 พบว่าทำคะแนน MMLU ได้ 87.2 สูงกว่า R1 ของ DeepSeek ซึ่งอยู่ที่ 84 แต่ยังน้อยกว่า o1 ของ OpenAI ขณะที่ผลทดสอบอื่นออกมาสูสีกับ R1 อย่างไรก็ตาม Tencent บอกว่าต้นทุนการใช้งาน T1 นั้นถูกกว่า R1 โดยคิดราคา 1 หยวนต่อ 1 ล้านโทเค็นอินพุท และเอาท์พุท 4 หยวนต่อ 1 ล้านโทเค็น ส่วน R1 คิดราคาตามช่วงเวลา โดยกลางวันคิดอินพุท 1 หยวน ส่วนเอาท์พุท 16 หยวน แต่กลางคืนจะถูกลงเป็น 0.25 หยวนกับ 4 หยวน

Hunyuan T1 เผยแพร่แล้วผ่าน Huggingface และ Github สามารถทดลองใช้งานผ่านแชทบอต Hunyuan ได้เช่นกัน

ที่มา: Tencent ผ่าน South China Morning Post

Tencent เปิดตัว Hunyuan T1 โมเดลคิดเป็นเหตุผล ระบุดีกว่า R1 ของ DeepSeek ทั้งผลทดสอบและต้นทุน-1.webp


Tencent เปิดตัว Hunyuan T1 โมเดลคิดเป็นเหตุผล ระบุดีกว่า R1 ของ DeepSeek ทั้งผลทดสอบและต้นทุน-2.webp


Topics:
Tencent
Artificial Intelligence

Continue reading...
 



กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม