21.11.2024
Bitte bookmarken Sie diese Seite.
Optische Zeichenerkennung (OCR)
ist die elektronische oder mechanische Umwandlung von Bildern von getipptem, handgeschriebenem oder gedrucktem Text in maschinencodierten Text, sei es von einem gescannten Dokument, einem Foto eines Dokuments oder einem Szenenfoto (z. B. der Text auf Schildern und Werbetafeln in einer Landschaft). Foto) oder aus Untertiteltext, der einem Bild überlagert wird (z. B. aus einer Fernsehsendung).
Weit verbreitet zur Eingabe von Daten aus gedruckten Papierakten – ob Pässe, Rechnungen, Kontoauszüge, computerisierte Quittungen, Visitenkarten, Post, Ausdrucke statischer Daten oder andere geeignete Dokumentationen – ist es eine gängige Methode, gedruckte Texte so zu digitalisieren, dass sie es können elektronisch bearbeitet, durchsucht, kompakter gespeichert, online angezeigt und in maschinellen Prozessen wie Cognitive Computing, maschineller Übersetzung und (extrahiertem) Text-to-sp verwendet werden. OCR ist ein Untergebiet der Mustererkennungsstudie, das künstliche Intelligenz umfasst und Computersehen.
Frühere Versionen erforderten ein Training mit Fotos einzelner Zeichen und arbeiteten jeweils an einer einzigen Schriftart. Fortgeschrittene Systeme, die in der Lage sind, einen hohen Grad an Erkennungsgenauigkeit für die meisten Schriftarten zu liefern, sind jetzt weit verbreitet, ebenso wie Systeme, die eine Reihe digitaler Bilddateiformate als Eingaben akzeptieren. Bestimmte Systeme sind in der Lage, eine formatierte Ausgabe zu replizieren, die der Originalseite so ähnlich wie möglich ist, einschließlich Grafiken, Spalten und anderer Nicht-Text-Komponenten.