กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


Apple โอเพนซอร์ส Ferret โมเดล AI MLLM ที่สามารถถอดรายละเอียดในรูปภาพได้

ข่าว Apple โอเพนซอร์ส Ferret โมเดล AI MLLM ที่สามารถถอดรายละเอียดในรูปภาพได้

  • ผู้เริ่มหัวข้อ ผู้เริ่มหัวข้อ News 
  • วันที่เริ่มต้น วันที่เริ่มต้น

News 

Active member

สมาชิกทีมงาน
Moderator
Distributor
แอปเปิลเผยแพร่ Ferret โมเดล AI ภาษาขนาดใหญ่บนข้อมูลสื่อผสม (Multimodal Large Language Model - MLLM) ใน GitHub ซึ่งพบว่าปล่อยออกมาตั้งแต่ 30 ตุลาคม แต่เพิ่งถูกพบและรายงานข่าวออกมา

Ferret มีจุดเด่นคือความสามารถการแยกข้อมูลภาพในรูปทรง-พื้นที่ใดก็ได้ แล้วให้รายละเอียดเจาะเฉพาะส่วนที่เห็น ตัวอย่างที่นำเสนอ เช่น สามารถระบุพื้นที่หางแมวได้ หรือรูปที่มีสัตว์ 2 ตัวซ้อนกัน ก็แยกตัวที่ 1 กับตัวที่ 2 ได้

ที่น่าสนใจคือ Ferret เผยแพร่ในรูปแบบโอเพนซอร์ส non-commercial สามารถนำไปวิจัยพัฒนาต่อได้แบบไม่แสวงหาผลประโยชน์ ซึ่งนักวิจัยด้าน AI มองว่าเป็นก้าวที่ดีของแอปเปิล ที่ปกติไม่ค่อยโอเพนซอร์สงานวิจัยที่มีโอกาสพัฒนาเป็นผลิตภัณฑ์ได้แบบนี้

ที่มา: VentureBeat

No Description


🚀🚀Introducing Ferret, a new MLLM that can refer and ground anything anywhere at any granularity. 📰https://t.co/gED9Vu0I4y1⃣ Ferret enables referring of an image region at any shape2⃣ It often shows better precise understanding of small image regions than GPT-4V (sec 5.6) pic.twitter.com/yVzgVYJmHc

— Zhe Gan (@zhegan4) October 12, 2023
Topics:
Apple
Artificial Intelligence
LLM
Open Source

อ่านต่อ...
 

ไฟล์แนบ

  • a553f2ecc03947661c35ed5e9df034cf.webp
    a553f2ecc03947661c35ed5e9df034cf.webp
    239.9 กิโลไบต์ · จำนวนการดู: 64



กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม ด้านล่าง