กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


News

ข่าว JetBrains โอเพนซอร์ส Mellum โมเดลขนาดเล็กเน้นงานเฉพาะทาง เชี่ยวชาญด้านเติมโค้ด

News 

Active member

สมาชิกทีมงาน
Moderator
Collaborate
JetBrains ประกาศโอเพนซอร์ส Mellum โมเดลช่วยเติมโค้ดที่เปิดตัวในปี 2024 และใช้กับ IDE ในตระกูล JetBrains โดยมีจุดเด่นเรื่องความเร็วกว่าการใช้โมเดลภาษา LLM ตัวใหญ่

JetBrains เรียก Mellum ว่าเป็น "focal model" สร้างมาเพื่อเขียนโค้ดโดยเฉพาะ ไม่ใช่โมเดลภาษา LLM ที่ปรับมาใช้เขียนโค้ด และแผนการของบริษัทคือการสร้างโมเดล Mellum หลายๆ ตัวที่ทำงานเฉพาะทางต่างกันไป เช่น ช่วยเติมโค้ด (code completion) หรือช่วยพยากรณ์ diff ของโค้ดแต่ละเวอร์ชัน

ตัวโมเดลหลักมีขนาดพารามิเตอร์ 4B และทำผลงานการเติมโค้ดได้ดีใกล้เคียงกับโมเดลที่ขนาดพารามิเตอร์ใหญ่กว่า ตอนนี้ Mellum รองรับการเติมโค้ดภาษา Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust, Ruby

ส่วนเหตุผลที่ตัดสินใจโอเพนซอร์ส JetBrains บอกว่าเชื่อในความโปร่งใส และมองว่าการโอเพนซอร์สจะเปิดให้เกิดความร่วมมือกันพัฒนาซอฟต์แวร์ต่อไป ตอนนี้โค้ดอยู่บน Hugging Face แล้ว สามารถนำมาใช้งานได้ทั้งบนคลาวด์ (ผ่าน vLLM) และรันแบบโลคัล (ผ่าน llama.cpp หรือ Ollama) แต่ JetBrains ก็ใส่หมายเหตุไว้ว่า Mellum อาจไม่เหมาะกับนักพัฒนาซอฟต์แวร์ทั่วๆ ไปนำไปใช้งานโดยตรง แต่เหมาะกับนักวิจัยสาย AI/ML นำไปศึกษาหรือต่อยอดมากกว่า

ที่มา - JetBrains

JetBrains โอเพนซอร์ส Mellum โมเดลขนาดเล็กเน้นงานเฉพาะทาง เชี่ยวชาญด้านเติมโค้ด-1.webp


JetBrains โอเพนซอร์ส Mellum โมเดลขนาดเล็กเน้นงานเฉพาะทาง เชี่ยวชาญด้านเติมโค้ด-2.webp


Topics:
JetBrains
Programming
Open Source
LLM

Continue reading...
 

กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม ด้านล่าง