PaddleOCR 3.5 Integra Backend Transformers per OCR e Parsing di Documenti
PaddleOCR 3.5 ora supporta Transformers come backend di inferenza per i suoi modelli OCR e di parsing di documenti, inclusi PP-OCRv5 e PaddleOCR-VL 1.5. Questa versione introduce un'interfaccia flessibile per il motore di inferenza, consentendo agli sviluppatori di selezionare il backend tramite il parametro engine e configurare opzioni come dtype, posizionamento del dispositivo e implementazione dell'attenzione tramite engine_config. L'integrazione mira a ridurre l'attrito per gli sviluppatori che creano applicazioni RAG, Document AI, ricerca, analisi o agenti all'interno di stack incentrati su Hugging Face. Mentre il backend Transformers offre un'esperienza di sviluppo familiare e la scoperta di modelli compatibili con Hub, il backend predefinito paddle_static rimane raccomandato per la massima produttività. Una demo live è disponibile su Hugging Face Spaces. Il rilascio è stato supportato dagli ingegneri di Hugging Face, tra cui Anton Vlasjuk, Raushan Turganbay e Yoni Gozlan.
Fatti principali
- PaddleOCR 3.5 supporta Transformers come backend di inferenza.
- I modelli includono PP-OCRv5 e PaddleOCR-VL 1.5.
- Gli sviluppatori possono configurare le opzioni del backend tramite engine_config.
- Il backend Transformers è adatto per stack incentrati su Hugging Face.
- Il backend predefinito paddle_static è raccomandato per la massima produttività.
- Demo live disponibile su Hugging Face Spaces.
- Integrazione supportata dagli ingegneri di Hugging Face Anton Vlasjuk, Raushan Turganbay e Yoni Gozlan.
- PaddleOCR gestisce pipeline OCR e di parsing di documenti in background.
Entità
Istituzioni
- PaddleOCR
- Hugging Face
- PaddlePaddle
- GitHub