• Home
  • OCR Texterkennung für E-Mail Anhänge

OCR Texterkennung für E-Mail Anhänge

0 comments

Der einfachste Weg zur eigenen KI basierten Texterkennung für Ihren digitalen Posteingang... sofort startklar - ohne Kontaktaufnahme oder Implementierungsprojekt!

Gerade in 2020 hat der deutsche Digitalisierungswille und -bedarf enorm an Fahrt und Dringlichkeit gewonnen. Besonders im E-Mail Bereich ist ein massiv erhöhtes Aufkommen im Vergleich zu früher zu verzeichnen. E-Mail  Anhänge mit Bildern und PDFs spielen dabei eine sehr große Rolle. 

Besonders die Anhänge erschweren es vielen Unternehmen den gewünschten Automatisierungsgrad zu erreichen, weil die angehängten Bilder besondere Informationen enthalten, um den Grund oder das Thema der E-Mail, zu identifizieren.

Bild-Informationen enthalten Pixeldaten und können deshalb nicht textuell abgefragt werden. Genau das ist aber für eine ordentliche Identifizierung, Klassifizierung und Kategorisierung nötig.

Das Resultat:

  • Die Sachbearbeiter übernehmen diese Schritte händisch
  • Das kostet mehr Zeit, die dann für Wichtigeres fehlt
  • Der Kunde wartet länger auf seine Antwort

Das war es dann mit der automatischen Steuerung von Workflows, oder?

Dabei ist es technologisch ja eigentlich überhaupt kein Problem mehr Texte aus Bildinformationen zu extrahieren.

Gerade in großen Unternehmen herrscht aber nach unserer Beobachtung viel Unsicherheit über die richtige Entscheidung zur Toolauswahl, weil sich gerade das Leitungsspektrum der vielen verfügbaren Produkte so deutlich unterscheidet.

Aus unserer Erfahrung ist eine absolute Trennung der Texterkennung von anderen Prozess-Steuerungen ein Vorteil, weil so die Abhängigkeiten klar getrennt sind. Damit bekommt die Entscheidung der Ziel-Strategie auch gleich eine viel geringere Reichweite, da im Zweifelsfall einfach ein Modul getauscht werden kann, ...ohne den ganzen Unterbau.

Aber natürlich ist das nicht das Ziel von den Software-Anbietern, da genau dieser "Vendor Lock" ein gutes Mittel zur Wahrung einer aktiven Kundenbeziehung ist.

Was ist jetzt also das richtige Vorgehen, wenn Ihre Prozesse viel zu individuell sind, als dass es passgenaue Lösungen dafür gibt?

Um dem akut steigenden Druck des Digitalisierungsbedarfs etwas Luft zum Atmen zu verschaffen, haben wir entschieden, dass wir jedem Unternehmen ermöglichen, kurzfristig und agil eine OCR Texterkennung anzubinden, um damit die vorhandenen Prozessabläufe weiter zu digitalisieren.

Völlig frei zugänglich und ohne Haken.


Wer sind wir, dass wir einfach so eine Technologie zur freien Nutzung anbieten?

Eigentlich machen wir damit nicht mal etwas besonderes. Wir haben weder eine eigene OCR Software geschrieben, noch melden wir dafür Credits an. Wer möchte denn das Rad zum 10. Mal erfinden?

Wir machen uns freie Software zu Nutze.

Das machen gerade im OCR Fall die meisten proprietären Anbieter auch. Zumindest für die rohe Erkennung. Also genau den Teil, den wir frei anbieten.

Wir haben eine REST-API erstellt, und so eine der populärsten Bibliotheken ge-wrapped, damit diese für vollautomatisierte Prozesse als Datenlieferant angebunden werden kann.

Dieser Dienst ist auf einem unserer Sandbox Systeme deployed und kann zu Evaluationszwecken frei genutzt werden.

Damit ergeben sich viele Möglichkeiten für Ihr Unternehmen

  • Das Ziel bzw. der Zweck der E-Mail kann voll-automatisch ermittelt werden, um direkt den richtigen Sachbearbeiter zu finden
  • Identifikationsmerkmale innerhalb der E-Mail, aber auch der angehängten Dokumente, werden zur automatisierten Kundenzuordnung verwendet, um dem Sachbearbeiter die Arbeit zu erleichtern und Fehler zu vermeiden
  • Für Revisions und Recherchezwecke können die Dokumente kategorisiert, klassifiziert und durchsuchbar abgelegt werden
  • Für volle Transparenz und damit den besten Kundennutzen
  • Aufbewahrung des Original-Scans, aus dem aber direkt der Text markiert werden kann
  •  Ermöglichung von Copy&Paste der Inhalte aus den Scans 
  • Durchsuchbarkeit der gescannten Dokumente

Ohne diese Möglichkeiten führt das zu

  • Demotivation der Sachbearbeiter, die unpassende Anfragen bearbeiten müssen oder weiterleiten
  • Unzufriedene Kunden, wenn die falsch zugeteilten Sachbearbeiter nicht ausreichend Kompetenz für das angefragte Thema aufweisen
  • Unzufriedene Kunden, wenn die Antwortzeiten durch internes E-Mail Ping-Pong zu hoch sind
  • (Über-)Qualifiziertes Personal wird für “HIWI Zwecke” wie “Abtippen” eingesetzt
  • Fehleranfälligkeit bei Routinetätigkeiten
  • Abhängigkeiten bei AU
  • u.v.m.

Ihre Vorteile durch unser Vorgehen

Selbst wenn wir eine eigene OCR Lösung entwickelt hätten, ist der Aufwand und die Tragweite einer robusten Variante nie zu unterschätzen.
Die von uns eingesetzte Bibliothek hat in Sachen Stabilität und Zuverlässigkeit bereits einiges vorzuweisen:

  • Bereits erprobt an vielen Millionen von Dokumenten
  • Zuverlässigkeit und Stabilität: auch für Dokumente mit tausenden von Seiten
  • Verifizierte Parallelisier- und Skalierbarkeit über eine frei definierbare Anzahl an gleichzeitig zu verwendenden CPUs
  • Basiert auf Tesseract OCR von Google, für das es über 100 unterstützte und trainierte Sprachen gibt
  • Option zur Erstellung von PDF/A Dokumenten

Weitere Infos zur PDF/A Erstellung

Damit ist gemeint, dass die Ursprungsdatei zu einem PDF/A Dokument verwandelt wird, das in einer unsichtbaren Textebene die erkannten Texte einbindet. So wird das PDF durchsuchbar und der Text kann via Copy&Paste extrahiert werden.

  • Der Text wird akkurat in der benötigten Skalierung exakt auf dem Bild angeordnet
  • Eingebettete Bilder werden in der originalen Auflösung und Qualität beibehalten
  • Soweit möglich wird der erkannte Text nur zusätzlich ergänzt, sodass es sich um eine verlustfreie Operation handelt
  • Die PDFs werden optimiert. Oftmals sind die erzeugten PDF/A Ergebnisse, trotz gleichbleibender Qualität, kleiner als das Original

Wer sich bereits mit OCR Tools auseinandergesetzt hat, kennt die folgenden Herausforderungen

  • Fehlende Behandlung von Akzenten oder Umlauten
  • Erstellung von Dokumenten mit riesigem Speicherverbrauch und entsprechend langsamen Ladezeiten
  • Programmabbruch der OCR Erkennung nach gefühltem Zufallsprinzip
  • Der ermittelte Text passt nicht auf das Bild oder schwebt irgendwo anders herum, sodass Copy&Paste quasi unmöglich ist
  • Im Text enthaltene Bilder werden umskaliert oder fälschlicher Weise als Text interpretiert und vernichten somit das originale Gesamtbild des Dokuments
  • Generierte PDFs repräsentieren keine gültigen PDFs, die Betriebssystem- und Viewer-Übergreifend funktionieren

Sie wollen sich überzeugen?

Unser Dienst steht hier und jetzt, sofort und kostenlos, zur Verfügung.

Einfach PDF Hochladen und den erkannten Text als JSON zurückbekommen.
Anwendungen mit geringem Dokumentaufkommen können diesen Dienst auch mit bis zu 50 Aufrufen pro Tag (pro IP) nutzen.

Berücksichtigen Sie bitte, dass wir keinerlei Gewährleistung oder Stabilitätszusagen für diesen kostenfreien Dienst machen. Auch die Geschwindigkeit der Texterkennung ist in der schmal Dimensionierten Sandbox nicht besonders hoch. Diese Gratisfunktionalität ist für Testzwecke oder Anwendungen mit wenigen Dokumenten ausgelegt, deren Textermittlung nicht akut zeitkritisch ist.

Ihre Möglichkeiten mit dem RESTful Interface

Die aktuelle Schnittstellenbeschreibung finden Sie immer aktuell in den Postman API Docs.

Mehr Infos zur Schnittstellendefinition

Die folgenden Funktionalitäten sind in der Sandbox möglich:

  • Ermittelt Text (via OCR) auf Seitenbasis in einem JSON zurück
  • PDF mit Text PDF/A Erstellung und Rückgabe als Base64 kodierter String innerhalb des zurückgegebenen JSON Ergebnis

Die besten Ergebnisse erhalten Sie mit einer guten Vorbereitung

Denn die Texterkennung arbeitet am Besten, wenn das Dokument gut lesbar, also vorbereitet, ist.

Natürlich wird die Vorbereitung voll-automatisch von unserem Dienst durchgeführt. Mit den folgenden Routinen:

  • Automatische Begradigung des Dokuments, falls die Datei aus einem schrägen Winkel aufgenommen wurde
  • Bilder/Dokumente ohne Text werden weitestgehend automatisch ignoriert
  • Entfernung von Stör-Artefakten die beispielsweise durchs Scannen verursacht wurden
  • Automatische Rotation des Dokuments, wenn durch die KI erkannt wird, dass das Dokument falsch herum liegt (experimentell)

Info: Sowohl die hochgeladenen Dokumente, als auch die verarbeiteten Ergebnisse, werden unmittelbar nach Beendigung der Anfrage restlos gelöscht.

Wenn dieser Leistungsumfang für Sie genauso passend ist wie für uns, und Sie ihn für sich einsetzen möchten, haben Sie die folgenden Möglichkeiten:

  • Bleiben Sie dabei: Nutzen Sie unseren Gratis Dienst mit einigen Einschränkungen (limitierte Seitenzahlen und tägliche Aufrufe)
  • Nutzen Sie unser frei zugängliches Docker-Image und betreiben Sie den Dienst selbst in Ihrer eigenen Infrastruktur, in AWS, Azure bzw. dem Cloud-Betreiber Ihres Vertrauens
  • Wenn Sie sich keine weiteren Gedanken zum Betrieb, Skalierung und Stabilität machen wollen, können Sie uns auch gern dafür beauftragen. Wir bieten Ihnen in unseren Volumenpaketen die beliebtesten Varianten an. Gerne können wir uns auch individuell zu Ihren Anforderungen und dem besten Sizing abstimmen.

Wünschen Sie eine Erweiterung Leistungsumfangs?

Obwohl wir unseren Dienst so einfach und modular gestalten wie möglich, kommt es immer wieder vor, dass weitere Details berücksichtigt werden müssen, um perfekt in der individuellen Systemlandschaft zu agieren.

In diesem Fall bieten wir Ihnen gerne folgende Möglichkeiten:


1. Nutzen Sie unseren Dienst kostenlos als Basis

Link zum Github Repository. Sie oder Ihr Entwicklungsteam Entwicklungsteam kann das Projekt forken und nach Ihren Bedürfnissen erweitern.


2. Haben Sie einen Ressourcen-Engpass oder einfach den Wunsch vom Profi beraten zu werden?

Kontaktieren Sie uns, um Ihre Anforderungen persönlich abzustimmen. Profitieren Sie von unserem Digitalisierungs-KnowHow und Weitblick - speziell im SAP Umfeld.

Wir stellen Ihnen gern einen Sparring-Partner zur Seite, um Ihre technologieübergreifenden Szenarien zukunftsfähig zu skizzieren.

Verfügbare Volumen-Pakete


Wenn Sie den Dienst einfach anbinden möchten ohne sich Gedanken zu Stabilität, Skalierung, Verschlüsselung, DSGVO etc. zu machen, bieten wir Ihnen auch an, den Dienst für Sie zu betreiben.

Im Folgenden finden Sie gestaffelt die meist angefragten Volumenpakete. Gerne machen wir Ihnen aber auch einen individuellen Vorschlag.

Kostenfrei

0€ / Monat

  • Bis zu 50 Dokumente / Tag
  • Max 3 Seiten / Dokument
  • Senden und Empfangen über REST API

Kleinbetrieb

79 € / Monat

  • 15.000 Dokumente / Monat
  • Max 10 Seiten / Dokument
  • Senden und Empfangen über REST API
  • Support über Chat & E-Mail

Kleiner Mittelstand

499 € / Monat

  • 100.000 Dokumente / Monat
  • Unbegrenzte Seitenanzahl
  • Senden und Empfangen über REST API
  • Support über Chat & E-Mail

Individuell

Angebot anfragen

Sie haben spezielle Wünsche oder Anforderungen?

Lassen Sie uns gemeinsam die beste Lösung für Ihre Prozesse finden.

Sprechen Sie uns an:


{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}