กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


ข่าว Apple โอเพนซอร์ส Ferret โมเดล AI MLLM ที่สามารถถอดรายละเอียดในรูปภาพได้

News

Staff Member
VIP Member
Registered
แอปเปิลเผยแพร่ Ferret โมเดล AI ภาษาขนาดใหญ่บนข้อมูลสื่อผสม (Multimodal Large Language Model - MLLM) ใน GitHub ซึ่งพบว่าปล่อยออกมาตั้งแต่ 30 ตุลาคม แต่เพิ่งถูกพบและรายงานข่าวออกมา

Ferret มีจุดเด่นคือความสามารถการแยกข้อมูลภาพในรูปทรง-พื้นที่ใดก็ได้ แล้วให้รายละเอียดเจาะเฉพาะส่วนที่เห็น ตัวอย่างที่นำเสนอ เช่น สามารถระบุพื้นที่หางแมวได้ หรือรูปที่มีสัตว์ 2 ตัวซ้อนกัน ก็แยกตัวที่ 1 กับตัวที่ 2 ได้

ที่น่าสนใจคือ Ferret เผยแพร่ในรูปแบบโอเพนซอร์ส non-commercial สามารถนำไปวิจัยพัฒนาต่อได้แบบไม่แสวงหาผลประโยชน์ ซึ่งนักวิจัยด้าน AI มองว่าเป็นก้าวที่ดีของแอปเปิล ที่ปกติไม่ค่อยโอเพนซอร์สงานวิจัยที่มีโอกาสพัฒนาเป็นผลิตภัณฑ์ได้แบบนี้

ที่มา: VentureBeat

No Description


🚀🚀Introducing Ferret, a new MLLM that can refer and ground anything anywhere at any granularity. 📰https://t.co/gED9Vu0I4y1⃣ Ferret enables referring of an image region at any shape2⃣ It often shows better precise understanding of small image regions than GPT-4V (sec 5.6) pic.twitter.com/yVzgVYJmHc

— Zhe Gan (@zhegan4) October 12, 2023
Topics:
Apple
Artificial Intelligence
LLM
Open Source

อ่านต่อ...
 



กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
ด้านบน ด้านล่าง