Orhant retweetledi

BU REPOYU HEMEN KAYDEDİN ÇÜNKÜ PDF ÇİLESİ BİTTİ
Chandra OCR 2 adında yeni bir açık kaynaklı model çıktı ve olmocr benchmark'ında %85.9 SOTA skoru alarak ortalığı yıktı. İmkansız denilen doktor el yazılarını, karmaşık tabloları, matematik formüllerini ve formlardaki onay kutularını bile sayfa düzenini (layout) asla bozmadan okuyabiliyor.
Sadece 4 milyar parametreye (9B'den düştü) sahip olan bu canavar, 90'dan fazla dili destekliyor ve PDF'leri veya görselleri tertemiz Markdown, HTML ya da JSON formatına dönüştürüyor. Hatta içindeki resimleri bulup onlara alt yazı bile ekliyor.
Sponsorlu bir içerik falan değil, gerçekten hayat kurtaracak bir açık kaynak aracı. Lazım olduğunda bulamazsınız, repo linkini ilk yoruma bıraktım.

Türkçe

















