Fachgebiet Neuro-Informationstechnik

Synthese von arabischer Handschrift

Umfassende Handschriftdatenbanken sind entscheidend, um Skripterkennungssysteme zu trainieren und zu testen. Ihre Erstellung beansprucht jedoch viel Arbeitskraft und Zeit. Infolgedessen besteht ein Mangel an solchen Datenbanken, was Forschung und Entwicklung behindert. Dies gilt insbesondere für die ganzheitliche Worterkennung, da für jeden Eintrag des zugrunde liegenden Vokabulars verschiedene Muster zur Verfügung stehen müssen. Zudem sind viele zur reliablen Validierung von Algorithmen zur Vorverabeitung oder Zeilensegmentierung erforderlichen Grundwahrheiten, grade auf Satz- und Paragraphenebene, manuell kaum für nennenswerte  Mengen an Proben annotierbar. 

Um dieses Problem für die arabische Sprache zu umgehen, stellen wir ein effizientes System vor, das aus Unicode automatisch Bilder von synthetischen handgeschriebenen Wörtern oder Textzeilen generiert. Insgesamt werden 28.046 Online-Muster von mehreren Schreibern erstellt, um Active Shape Models (ASM) für über hundert Buchstabenklassen zu berechnen. ASMs werden verwendet, um einzigartige Buchstabendarstellungen für jede Synthese zu generieren. Anschließend werden diese Darstellungen durch affine Transformationen modifiziert, durch B-Spline-Interpolation geglättet und zu Text zusammengesetzt. Abschließend wird der Text gerendert und gespeichert. Auf diese Weise erzeugt unser System offline pseudohandschriftliche Muster mit Variationen in Form und Textur. Wir vergleichen Proben aus der IFN/ENIT-Datenbank mit entsprechenden Synthesen, um zu zeigen, dass diese als Surrogat für reale Proben verwendet werden können.

 

 

                                                                                              

  

Visualisierung des B-Spline-Algorithmus, der verwendet wurde um bei der Synthese glatte Schriftzüge zu erzielen (bei hochaufgelösten Proben).

Ändern eines synthetisierten arabischen Wortes durch Verändern des Einflusses der Eigenvektoren.

 

 Publikationen

  • Dinges, L.; Al-Hamadi, A.; Elzobi, M. & and A. Nürnberger, Automatic Recognition of Common Arabic Handwritten Words based on OCR and N-grams, in International Conference on Image Processing, ICIP 2017, Beijing, China, September 17-20, pp. 3625–3629, 2017
  • Dinges, L,  Al-Hamadi, A.; Elzobi, M. &  El-etriby, S. Synthesis of Common Arabic Handwritings to Aid Optical Character Recognition Research, Sensors , vol. 16, no. 3, p. 346, 2016.
  • Dinges, L.; Al-Hamadi, A.; Elzobi, M.; El etriby, S. & Ghoneim, A. ASM based Synthesis of Handwritten Arabic Text Pages, Scientific World Journal, 2015
  • Dinges, L.; Al-Hamadi, A. & Elzobi, M. An Approach for Arabic Handwriting Synthesis based on Active Shape Models International Conference on Document Analysis and Recognition (ICDAR), 2013, 1292-1296

 

Kontakt:

Laslo Dinges,  Ayoub Al-Hamadi

Letzte Änderung: 04.03.2021 - Ansprechpartner: Webmaster