PaddleOCR 3.5 Integra Backend Transformers per OCR e Parsing di Documenti

digital · 2026-05-18

PaddleOCR 3.5 ora supporta Transformers come backend di inferenza per i suoi modelli OCR e di parsing di documenti, inclusi PP-OCRv5 e PaddleOCR-VL 1.5. Questa versione introduce un'interfaccia flessibile per il motore di inferenza, consentendo agli sviluppatori di selezionare il backend tramite il parametro engine e configurare opzioni come dtype, posizionamento del dispositivo e implementazione dell'attenzione tramite engine_config. L'integrazione mira a ridurre l'attrito per gli sviluppatori che creano applicazioni RAG, Document AI, ricerca, analisi o agenti all'interno di stack incentrati su Hugging Face. Mentre il backend Transformers offre un'esperienza di sviluppo familiare e la scoperta di modelli compatibili con Hub, il backend predefinito paddle_static rimane raccomandato per la massima produttività. Una demo live è disponibile su Hugging Face Spaces. Il rilascio è stato supportato dagli ingegneri di Hugging Face, tra cui Anton Vlasjuk, Raushan Turganbay e Yoni Gozlan.

Fatti principali

PaddleOCR 3.5 supporta Transformers come backend di inferenza.
I modelli includono PP-OCRv5 e PaddleOCR-VL 1.5.
Gli sviluppatori possono configurare le opzioni del backend tramite engine_config.
Il backend Transformers è adatto per stack incentrati su Hugging Face.
Il backend predefinito paddle_static è raccomandato per la massima produttività.
Demo live disponibile su Hugging Face Spaces.
Integrazione supportata dagli ingegneri di Hugging Face Anton Vlasjuk, Raushan Turganbay e Yoni Gozlan.
PaddleOCR gestisce pipeline OCR e di parsing di documenti in background.

PaddleOCR 3.5 Integra Backend Transformers per OCR e Parsing di Documenti

Fatti principali

Entità

Istituzioni

Fonti