Welcome to the ASP.NET Core feedback portal. We’re happy you’re here! If you have feedback on how to improve the ASP.NET Core, we’d love to hear it!

  • Check out the features or bugs others have reported and vote on your favorites. Feedback will be prioritized based on popularity.
  • If you have feedback that’s not listed yet, submit your own.

Thanks for joining our community and helping improve Syncfusion products!

1
Vote

I've launched an OCR for PDF document created from image and everything works fine except one detail. Selectable text layer is missing all words were there is at least one polish character. OCR output shows that it was able to recognize them but they aren't added to document.

I've attached the PDF from before and after OCR processing.

The OCR output from 

OCRLayoutResult OCRLayout = new OCRLayoutResult();

           PdfLoadedDocument processedDocument = new PdfLoadedDocument(doc);

                processor.PerformOCR(processedDocument, Path.Combine(AppContext.BaseDirectory, "tessdata"), out OCRLayout);

            using (MemoryStream stream = new MemoryStream())

            {

                processedDocument.Save(stream);

                processedPdfBytes = stream.ToArray();

            }


is:



"„MŚ DO HYMNU! HYMN POLSKI Jeszcze Polska nie zginęła, Kiedy my żyjemy. Co nam nbca przemoc wzięła, Szabli; ndbienemy. Marsz, marsz Dąbmwski, z ziemi włnskiej dn Pnlski. Za tuwim przzwndem Złączym się : namdem. Przejdziem Wisłę, pnęjdziem Wartę, Będziem Polakami. Dał num pnykłnd Bnnnpme, Jak zwyciężać mamy. Marsz, marsz Dąbmwski, z ziemi włnskiej dn Pnlski. Za tuwim przzwndem Złączym się : namdem. Jak Czarniecki dn Pnznnnia Po szwedzkim zubme, Dln ojczyzny mruwunia Wrócim się przez murze. Marsz, marsz Dąbmwski, z zięmi włnskiej dn Pnlski. Za tuwim przzwndem Złączym się : namdem. Już mm njcizc dn swęj Basi Mówi zapłaknny _ Słuchajjznn, ponn nasi Biją w tambuny. Marsz, marsz qumwski, z zięmi włnskiej dn Pnlski. Za tuwim przzwndem Złączym się : namdem. "