Theme editor



JetBrains โอเพนซอร์ส Mellum โมเดลขนาดเล็กเน้นงานเฉพาะทาง เชี่ยวชาญด้านเติมโค้ด

news JetBrains โอเพนซอร์ส Mellum โมเดลขนาดเล็กเน้นงานเฉพาะทาง เชี่ยวชาญด้านเติมโค้ด

News News is verified member.

Active member
Staff member
Moderator
Distributor
Thread owner
JetBrains ประกาศโอเพนซอร์ส Mellum โมเดลช่วยเติมโค้ดที่เปิดตัวในปี 2024 และใช้กับ IDE ในตระกูล JetBrains โดยมีจุดเด่นเรื่องความเร็วกว่าการใช้โมเดลภาษา LLM ตัวใหญ่

JetBrains เรียก Mellum ว่าเป็น "focal model" สร้างมาเพื่อเขียนโค้ดโดยเฉพาะ ไม่ใช่โมเดลภาษา LLM ที่ปรับมาใช้เขียนโค้ด และแผนการของบริษัทคือการสร้างโมเดล Mellum หลายๆ ตัวที่ทำงานเฉพาะทางต่างกันไป เช่น ช่วยเติมโค้ด (code completion) หรือช่วยพยากรณ์ diff ของโค้ดแต่ละเวอร์ชัน

ตัวโมเดลหลักมีขนาดพารามิเตอร์ 4B และทำผลงานการเติมโค้ดได้ดีใกล้เคียงกับโมเดลที่ขนาดพารามิเตอร์ใหญ่กว่า ตอนนี้ Mellum รองรับการเติมโค้ดภาษา Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust, Ruby

ส่วนเหตุผลที่ตัดสินใจโอเพนซอร์ส JetBrains บอกว่าเชื่อในความโปร่งใส และมองว่าการโอเพนซอร์สจะเปิดให้เกิดความร่วมมือกันพัฒนาซอฟต์แวร์ต่อไป ตอนนี้โค้ดอยู่บน Hugging Face แล้ว สามารถนำมาใช้งานได้ทั้งบนคลาวด์ (ผ่าน vLLM) และรันแบบโลคัล (ผ่าน llama.cpp หรือ Ollama) แต่ JetBrains ก็ใส่หมายเหตุไว้ว่า Mellum อาจไม่เหมาะกับนักพัฒนาซอฟต์แวร์ทั่วๆ ไปนำไปใช้งานโดยตรง แต่เหมาะกับนักวิจัยสาย AI/ML นำไปศึกษาหรือต่อยอดมากกว่า

ที่มา - JetBrains

JetBrains โอเพนซอร์ส Mellum โมเดลขนาดเล็กเน้นงานเฉพาะทาง เชี่ยวชาญด้านเติมโค้ด-1.webp

JetBrains โอเพนซอร์ส Mellum โมเดลขนาดเล็กเน้นงานเฉพาะทาง เชี่ยวชาญด้านเติมโค้ด-2.webp

Topics:
JetBrains
Programming
Open Source
LLM

Continue reading...
 




Back
Top Bottom