ARTFEED — Contemporary Art Intelligence

PaddleOCR 3.5 Integra Backend Transformers per OCR e Parsing di Documenti

digital · 2026-05-18

PaddleOCR 3.5 ora supporta Transformers come backend di inferenza per i suoi modelli OCR e di parsing di documenti, inclusi PP-OCRv5 e PaddleOCR-VL 1.5. Questa versione introduce un'interfaccia flessibile per il motore di inferenza, consentendo agli sviluppatori di selezionare il backend tramite il parametro engine e configurare opzioni come dtype, posizionamento del dispositivo e implementazione dell'attenzione tramite engine_config. L'integrazione mira a ridurre l'attrito per gli sviluppatori che creano applicazioni RAG, Document AI, ricerca, analisi o agenti all'interno di stack incentrati su Hugging Face. Mentre il backend Transformers offre un'esperienza di sviluppo familiare e la scoperta di modelli compatibili con Hub, il backend predefinito paddle_static rimane raccomandato per la massima produttività. Una demo live è disponibile su Hugging Face Spaces. Il rilascio è stato supportato dagli ingegneri di Hugging Face, tra cui Anton Vlasjuk, Raushan Turganbay e Yoni Gozlan.

Fatti principali

  • PaddleOCR 3.5 supporta Transformers come backend di inferenza.
  • I modelli includono PP-OCRv5 e PaddleOCR-VL 1.5.
  • Gli sviluppatori possono configurare le opzioni del backend tramite engine_config.
  • Il backend Transformers è adatto per stack incentrati su Hugging Face.
  • Il backend predefinito paddle_static è raccomandato per la massima produttività.
  • Demo live disponibile su Hugging Face Spaces.
  • Integrazione supportata dagli ingegneri di Hugging Face Anton Vlasjuk, Raushan Turganbay e Yoni Gozlan.
  • PaddleOCR gestisce pipeline OCR e di parsing di documenti in background.

Entità

Istituzioni

  • PaddleOCR
  • Hugging Face
  • PaddlePaddle
  • GitHub

Fonti