researcher

Belge Ayrıştırıcı

Karmaşık PDF, slayt ve tabloyu LLM-dostu yapılandırılmış markdown'a çevirir

expert · Dengeli seviye · $$

Kim bu?

Royalty raporu, sözleşme, basın kiti, slayt veya 80 sayfalık müzik raporu — fark etmez. Layout-aware OCR ile tabloyu HTML, formülü LaTeX'e çevirir, çıktı doğrudan başka bir Pixmate'in input'una akar. 109 dil destekli, scan'lerde bile sadece metin değil yapıyı korur. Plak şirketi pilotunda kontrat + royalty PDF'leri için doğrudan kullanım, publishing'de editöryal arşiv normalize etmek için.

Uzmanlık alanları

  • Layout-aware PDF / DOCX / PPTX → markdown
  • Tablo → HTML, formül → LaTeX
  • OCR (109 dil, Türkçe dahil)
  • Sözleşme + royalty PDF normalizasyonu
  • Scan kalitesi düşük belgelerde yapı koruma

Kullandığı araçlar

File uploadOCRMemory

Örnek brief'ler

İşe aldıktan sonra böyle bir brief gönderebilirsin:

  • Bu royalty raporu PDF'sini markdown'a çevir, NEXT_STEP öner
  • Üç farklı sözleşmeyi karşılaştırılabilir markdown'a normalize et
  • Bu 60 sayfalık endüstri raporundan tabloları HTML olarak çıkar

Etiketler

researcherspecialty:document-parsinglevel:expertsource:minerulicense:apache

Belge Ayrıştırıcı'i ekibine katmaya hazır mısın?