JetBrains ประกาศโอเพนซอร์ส Mellum โมเดลช่วยเติมโค้ดที่เปิดตัวในปี 2024 และใช้กับ IDE ในตระกูล JetBrains โดยมีจุดเด่นเรื่องความเร็วกว่าการใช้โมเดลภาษา LLM ตัวใหญ่
JetBrains เรียก Mellum ว่าเป็น "focal model" สร้างมาเพื่อเขียนโค้ดโดยเฉพาะ ไม่ใช่โมเดลภาษา LLM ที่ปรับมาใช้เขียนโค้ด และแผนการของบริษัทคือการสร้างโมเดล Mellum หลายๆ ตัวที่ทำงานเฉพาะทางต่างกันไป เช่น ช่วยเติมโค้ด (code completion) หรือช่วยพยากรณ์ diff ของโค้ดแต่ละเวอร์ชัน
ตัวโมเดลหลักมีขนาดพารามิเตอร์ 4B และทำผลงานการเติมโค้ดได้ดีใกล้เคียงกับโมเดลที่ขนาดพารามิเตอร์ใหญ่กว่า ตอนนี้ Mellum รองรับการเติมโค้ดภาษา Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust, Ruby
ส่วนเหตุผลที่ตัดสินใจโอเพนซอร์ส JetBrains บอกว่าเชื่อในความโปร่งใส และมองว่าการโอเพนซอร์สจะเปิดให้เกิดความร่วมมือกันพัฒนาซอฟต์แวร์ต่อไป ตอนนี้โค้ดอยู่บน Hugging Face แล้ว สามารถนำมาใช้งานได้ทั้งบนคลาวด์ (ผ่าน vLLM) และรันแบบโลคัล (ผ่าน llama.cpp หรือ Ollama) แต่ JetBrains ก็ใส่หมายเหตุไว้ว่า Mellum อาจไม่เหมาะกับนักพัฒนาซอฟต์แวร์ทั่วๆ ไปนำไปใช้งานโดยตรง แต่เหมาะกับนักวิจัยสาย AI/ML นำไปศึกษาหรือต่อยอดมากกว่า
ที่มา - JetBrains
Topics:
JetBrains
Programming
Open Source
LLM
Continue reading...
JetBrains เรียก Mellum ว่าเป็น "focal model" สร้างมาเพื่อเขียนโค้ดโดยเฉพาะ ไม่ใช่โมเดลภาษา LLM ที่ปรับมาใช้เขียนโค้ด และแผนการของบริษัทคือการสร้างโมเดล Mellum หลายๆ ตัวที่ทำงานเฉพาะทางต่างกันไป เช่น ช่วยเติมโค้ด (code completion) หรือช่วยพยากรณ์ diff ของโค้ดแต่ละเวอร์ชัน
ตัวโมเดลหลักมีขนาดพารามิเตอร์ 4B และทำผลงานการเติมโค้ดได้ดีใกล้เคียงกับโมเดลที่ขนาดพารามิเตอร์ใหญ่กว่า ตอนนี้ Mellum รองรับการเติมโค้ดภาษา Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust, Ruby
ส่วนเหตุผลที่ตัดสินใจโอเพนซอร์ส JetBrains บอกว่าเชื่อในความโปร่งใส และมองว่าการโอเพนซอร์สจะเปิดให้เกิดความร่วมมือกันพัฒนาซอฟต์แวร์ต่อไป ตอนนี้โค้ดอยู่บน Hugging Face แล้ว สามารถนำมาใช้งานได้ทั้งบนคลาวด์ (ผ่าน vLLM) และรันแบบโลคัล (ผ่าน llama.cpp หรือ Ollama) แต่ JetBrains ก็ใส่หมายเหตุไว้ว่า Mellum อาจไม่เหมาะกับนักพัฒนาซอฟต์แวร์ทั่วๆ ไปนำไปใช้งานโดยตรง แต่เหมาะกับนักวิจัยสาย AI/ML นำไปศึกษาหรือต่อยอดมากกว่า
ที่มา - JetBrains
Topics:
JetBrains
Programming
Open Source
LLM
Continue reading...