Welcome to the ASP.NET Core feedback portal. We’re happy you’re here! If you have feedback on how to improve the ASP.NET Core, we’d love to hear it!>
Thanks for joining our community and helping improve Syncfusion products!
I've launched an OCR for PDF document created from image and everything works fine except one detail. Selectable text layer is missing all words were there is at least one polish character. OCR output shows that it was able to recognize them but they aren't added to document.
I've attached the PDF from before and after OCR processing.
The OCR output from
OCRLayoutResult OCRLayout = new OCRLayoutResult();
PdfLoadedDocument processedDocument = new PdfLoadedDocument(doc);
processor.PerformOCR(processedDocument, Path.Combine(AppContext.BaseDirectory, "tessdata"), out OCRLayout);
using (MemoryStream stream = new MemoryStream())
{
processedDocument.Save(stream);
processedPdfBytes = stream.ToArray();
}
is:
"„MŚ DO HYMNU! HYMN POLSKI Jeszcze Polska nie zginęła, Kiedy my żyjemy. Co nam nbca przemoc wzięła, Szabli; ndbienemy. Marsz, marsz Dąbmwski, z ziemi włnskiej dn Pnlski. Za tuwim przzwndem Złączym się : namdem. Przejdziem Wisłę, pnęjdziem Wartę, Będziem Polakami. Dał num pnykłnd Bnnnpme, Jak zwyciężać mamy. Marsz, marsz Dąbmwski, z ziemi włnskiej dn Pnlski. Za tuwim przzwndem Złączym się : namdem. Jak Czarniecki dn Pnznnnia Po szwedzkim zubme, Dln ojczyzny mruwunia Wrócim się przez murze. Marsz, marsz Dąbmwski, z zięmi włnskiej dn Pnlski. Za tuwim przzwndem Złączym się : namdem. Już mm njcizc dn swęj Basi Mówi zapłaknny _ Słuchajjznn, ponn nasi Biją w tambuny. Marsz, marsz qumwski, z zięmi włnskiej dn Pnlski. Za tuwim przzwndem Złączym się : namdem. "