กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


ไมโครซอฟท์ออก MarkItDown ไลบรารีสำหรับแปลงไฟล์ Office เป็น Markdown

ข่าว ไมโครซอฟท์ออก MarkItDown ไลบรารีสำหรับแปลงไฟล์ Office เป็น Markdown

  • ผู้เริ่มหัวข้อ ผู้เริ่มหัวข้อ News 
  • วันที่เริ่มต้น วันที่เริ่มต้น

News 

Active member

สมาชิกทีมงาน
Moderator
Distributor
Thread owner
ไมโครซอฟท์ออก MarkItDown ไลบรารีภาษาไพธอนสำหรับแปลงเอกสารในชุด Microsoft Office (.docx, .xlsx, .pttx) รวมถึงไฟล์ PDF, HTML ให้อยู่ในฟอร์แมต Markdown

เนื่องจาก MarkItDown ออกแบบมาเป็นไลบรารี วิธีการใช้งานจึงต้องเรียกผ่านการเขียนโค้ด Python สั้นๆ ตามตัวอย่าง

from markitdown import MarkItDown

markitdown = MarkItDown()
result = markitdown.convert("test.xlsx")
print(result.text_content)

เป้าหมายของ MarkItDown คือแปลงไฟล์เอกสารประเภทต่างๆ มาเป็น Markdown ฟอร์แมตเดียว เพื่อให้สะดวกกับการนำไปประมวลผลต่อในงานอื่นๆ เช่น วิเคราะห์ข้อมูลประเภทข้อความ ตัวไลบรารีเป็นโอเพนซอร์ส ใช้สัญญาอนุญาตแบบ MIT

ที่มา - Microsoft GitHub

ไมโครซอฟท์ออก MarkItDown ไลบรารีสำหรับแปลงไฟล์ Office เป็น Markdown-1.webp


Topics:
Microsoft Office
Microsoft
Open Source

Continue reading...
 


กลับ
ยอดนิยม ด้านล่าง