norpa GmbH
norpa GmbH

Hier finden Sie Antworten auf häufig gestellte Fragen rund um image2data und die norpaOCR.

Allgemeine Fragen

Was ist image2data?

image2data ist eine hochflexibler Lösungsbaustein zur halb- oder vollautomatischen Erkennung oder Extraktion von beliebigen Nutzdaten aus verschiedensten Quellen. image2data erkennt z.B.

  • Text und Barcodes aus gescannten Dokumenten oder PDFs
  • Text aus beliebigen (Open- oder MS-)Office-Dokumenten
  • Relevante Rechnungsdaten aus gescannten Dokumenten oder PDFs (optional)
  • Logos und Symbole mittels Mustererkennung (optional)

aus gescannten Belegen, PDF-Dateien, Office-Dokumenten, E-Mails, Webseiten und vielen weiteren Quellen. Die ermittelten Daten können anschließend validiert und über beliebige Schnittstellen in Folgesysteme, z.B. CMS oder DMS oder ERP-Lösungen übergeben werden.

Warum heisst image2data so?

Als wir mit der Entwicklung von image2data begonnen haben, hatten wir vor allem an die Anwendungsfälle gedacht, bei denen Papier über einen Scanner zu einer Grafik (image) wird. OCR macht aus dieser Grafik Text und image2data filtert aus diesem Text das heraus, was wirklich wichtig ist: die Daten.
So kam es zu dem Namen image2data (spricht image to data) - also "Grafik zu Daten machen".

Die weitere Entwicklung und neue Anwendungsfälle unserer Kunden haben dann dazu geführt, dass mit image2data nun nicht mehr nur Grafiken, sondern praktisch beliebige Dateien oder auch Webseiten und Datenbanken als Datenquelle dienen können.

image2data hat sich mittlerweile von einem Scan-Verarbeitunsprogramm zu einem flexiblen und allgemein nutzbaren Beschaffungs-, Analyse- und Transfer-Tool für Daten weiter entwickelt.

Was sind typische Einsatzszenarien von image2data?

Da image2data extrem flexibel ist, gibt es eigentlich kein „typisches“ Einsatzszenario. Unsere Kunden nutzen image2data u.a. als

  • Vorsystem
    zur automatischen Ermittlung von Schlagworten, um damit im Anschluß ein CMS oder DMS zu füttern
  • Posteingangsassistent,
    der eingehende Korrespondenz (als gescannte Dokumente, Faxe oder E-Mails) automatisch an die zuständigen Ansprechpartner oder Abteilungen verteilt
  • Rechnungseingangsassistent,
    der eingehende Rechnungen oder Gutschriften automatisch ohne nennenswerten Einlernaufwand kontiert
  • Umfrage-Auswertungstool,
    um damit angekreuzte Felder auf eingehenden Antwortkarten zu erfassen
  • PDF-Konverter,
    um damit gescannte Dokumente in das durchsuchbare PDF/A-1b-Format für die Langzeitarchivierung zu wandeln System zur E-Mailarchivierung

Dies sind nur einige der zahllosen Möglichkeiten, die image2data bietet. Sprechen Sie uns gerne an, falls Sie eine spezielle Anforderung an image2data haben. Wir helfen Ihnen weiter.

Wer setzt image2data ein?

Es gibt keine speziellen Branchen, die image2data einsetzen. Jedes Unternehmen und jede Institution, welche eine nennenswerte Menge an Dokumente in irgendeiner Form bewegen oder speichern, könnte image2data einsetzen. Zu unseren Kunden gehören aktuell z.B.

  • Behörden und Gerichte
  • Produktionsunternehmen
  • Vertriebsunternehmen
  • Telekommunikationsunternehmen
  • Steuerberater

Was macht image2data so besonders?

image2data ist hoch flexibel: da alle Anforderungen in einer speziell für image2data entwickelten, für Data Capture und Document Processing optimierten Skriptsprache formuliert werden, sind individuelle Anforderungen überhaupt kein Problem.

image2data kann jeder nutzen Lösungen und deren eventuelle Anpassungen können über das mächtige und doch leicht erlernbare image2data-Skript nicht nur durch uns, sondern in der Skript-Entwicklungsumgebung auch direkt von Ihnen abgebildet werden. Das spart Kosten und mindert Abhängigkeiten.

image2data ist sehr schnell: mit image2data können auch größte Verarbeitungsaufkommen bewältigt werden. Sollte eine Instanz dabei einmal nicht ausreichen, kann bequem auf mehrere skaliert werden. Das ist jedoch zumeist nicht notwendig: der zeitaufwändigste Part einer normalen Verarbeitung, die Texterkennung, wird von der norpaOCR übernommen. Eine normale Textseite mit 5% Deckung wird von ihr, je nach Komplexität, in 1-3 Sekunden erkannt.

image2data ist genügsam: das image2data-System benötigt, zusammen mit der norpaOCR als OCR-System, lediglich 1,5 Gb Haupspeicher und einen Prozessorkern. Ein eventuell notwendiges Skalieren ist also gar nicht teuer.

image2data ist erweiterbar: für image2data stehen viele Plugins zur Verfügung, die den großen Standard-Funktionsumfang noch erweitern. Es finden sich Plugins z.B. für Scanneransteuerung, Datenbankanbindung, PDF-Erzeugung (auch Langzeitarchivformat), Mustererkennung, Webanfragen und vieles mehr.

image2data kennt keine Grenzen: in image2data lassen sich proprietäre Bibliotheken beliebiger Anbieter einbinden. So können z.B. Prozesse in Folgesystemen angestoßen oder früher verwendete Fremdroutinen weiter genutzt werden.

image2data ist günstig: im Vergleich zu unseren Mitbewerbern ist image2data sehr kostengünstig zu betreiben. Fragen Sie uns nach Konditionen.

Muß ich Skript-Programmierung lernen, wenn ich image2data verwenden will?

Nein, Sie müssen nicht, aber Sie oder Ihre Mitarbeiter können! Natürlich können Sie Ihre Anforderungen auch komplett durch uns abbilden lassen. Betrachtet man die image2data-Projekthistorie, dann ist es so, daß der typische Kunde die ersten Anforderungen durch uns lösen lässt, im Projektverlauf aber zunehmend mehr teilnimmt und eigene Schritte wagt. Dies ist aber, wie gesagt, nicht notwendig, um image2data zu nutzen.

Ich oder meine Mitarbeiter möchten Anforderungen komplett oder teilweise selber in image2data abbilden. Ist image2data-Skript problemlos erlernbar?

Ja, durchaus. Etwas technisches Verständnis und einige Erfahrungen im IT-Bereich sollten aber mitgebracht werden. In der Installation des Developer-Pakets sind hunderte von Seiten an Dokumentation sowie Dutzende von Beispielskripten enthalten, an denen man sich orientieren kann. Um den Einstieg zu erleichtern, bieten wir aber auch ein- oder mehrtägige Workshops an. Diese orientieren sich in der Regel an den speziellen Anforderungen, die im Umfeld des Kunden bestehen.

Kann image2data meine Anforderungen abbilden?

Höchstwahrscheinlich. Seit der Markteinführung von image2data, sind wir auf keine Anforderung aus den Bereichen Data Capture oder Document Processing getroffen, die wir nicht mit image2data lösen konnten. Fragen Sie uns einfach!

image2data scheint mir ein gutes Produkt mit viel Potenzial zu sein. Ich könnte mir vorstellen, es auch bei meinen Kunden einzusetzen. Habe ich etwas davon?

Diese Annahme ist absolut korrekt :-) Der Einsatz von image2data bei Ihren Kunden lohnt sich auch für Sie. Fragen Sie nach unserem Partnerprogramm.

Wo kann ich mehr über image2data erfahren?

Sie können sich die image2data-Screencasts anschauen, die einen ersten Eindruck über die Struktur und die Verwendung von image2data geben. Sie können im image2data Tech Blog mehr über technische Hintergründe und die Skriptprogrammierung erfahren. Natürlich können Sie uns auch gerne anrufen oder per E-Mail kontaktieren.

Installation & Lizenzierung

Wie ist das image2data- und norpaOCR-Lizenzmodell?

Für alle image2data- und norpaOCR-Komponenten werden Jahreslizenzen laut Preisliste fällig. Sollen die Komponenten später einmal nicht mehr oder nur noch teilweise genutzt werden, wird dafür einfach keine folgende Jahreslizenz mehr erworben.

Wie hoch sind die Kosten für Wartung, Updates etc.?

In den Jahreslizenzen sind alle Kosten bereits enthalten.

Gibt es Limitierungen in Bezug auf die Menge erkannter Belege, Skriptläufe oder irgendeiner anderer Art?

Alle uns bekannten professionellen OCR- und Data Capture-Systeme berechnen nach Volumen (pro erkannter Seite oder eine maximale Anzahl Dokumente). image2data und die norpaOCR machen das nicht.
Unter der Voraussetzung, daß die Datengewinnung und -verarbeitung für Ihr eigenes Unternehmen erfolgt, sind Sie keiner Mengenlimitierung irgendeiner Art unterworfen. Für Firmen, die Datenverarbeitung für Dritte anbieten, können wir günstige, individuelle Konditionen anbieten.

Muß auf jedem Arbeitsplatz, der image2data nutzen will, eine eigene norpaOCR-Instanz installiert werden?

Nein, das ist nicht nötig. Die norpaOCR kann sowohl lokal, als auch remote installiert werden. Im zweiten Falle lässt sie sich über eine HTTP/HTTPS-Schnittstelle ansprechen, so daß sie nicht nur im Intranet, sondern auch irgendwo im Internet installiert werden kann.

Wie kann man sich ein typisches image2data-Setup vorstellen?

Auf jedem Arbeitsplatz oder Server, der image2data nutzt, muß sich eine image2data-Runtime befinden. Werden image2data-Plugins verwendet, so müssen auch diese auf dem Arbeitsplatz bzw. Server verfügbar sein. Die norpaOCR kann, wie oben beschrieben, entweder lokal oder an einem beliebigen Platz im Netz installiert werden. Die image2data Toolbar kann an beliebig vielen Arbeitsplätzen installiert werden, um bspw. einem Server Dateien zuzuführen. Um image2data-Skript mittels der image2data Toolbat auszuführen, muss zusätzlich auch ein Runtime-Modul installiert sein.

Ich würde image2data gerne testen, bevor ich eine Jahreslizenz erwerbe. Ist das möglich?

Ja, dafür gibt es unser image2data Try&Buy-Angebot. Für eine Pauschle von EUR 990,-- zzgl. aktuell gültiger USt. bieten wir Ihnen eine komplette 30-Tage-Testinstallation sowie drei Manntage Skripting, die Sie für die Umsetzung Ihrer Anforderungen nutzen können. Haben Sie image2data und die norpaOCR in diesem Zeitraum überzeugt, kaufen Sie eine Jahreslizenz und können die im Rahmen des Try&Buy-Angebots erstellten Skripte weiter verwenden.

Ich bin IT-Unternehmer und möchte Lösungen, die auf image2data basieren, selber entwickeln und anschließend vertreiben. Geht das?

Aber ja, sehr gut sogar. Grundsätzlich liegt image2data-Skript im Quelltext vor und kann somit von jedem bearbeitet werden. Es gibt jedoch auch die Möglichkeit, image2data-Skript verschlüsselt abzuspeichern. Damit kann es zwar noch ausgeführt, jedoch nicht mehr bearbeitet oder auch nur eingesehen werden. Ihr geistiges Eigentum ist damit bestens geschützt.

Technik

Ich habe ein image2data-Skript geschrieben. Wie kann ich es ausführen?

image2data-Skript kann auf verschiedene Weisen zur Ausführung gelangen:

Über die image2data-Runtime, ein Konsolenprogram, welches als Parameter den Namen des Skripts sowie eventuelle Parameter erhält. Wird verwendet für zeit- oder ereignisgesteuerte Ausführungen.

Über die image2data-Toolbar, ein Endbenutzer-Frontend, welches kostenfrei im image2data-Lieferumfang enthalten ist. Hierüber können Scanner angesteuert, Scanstapel gesplittet und Skripte auf selektierte Dateien angewendet werden.

Über die image2data-Integrations-DLL, eine Windows-Bibliothek, die in jedes eigene Programm eingebunden werden kann. Kann genutzt werden, wenn image2data für den Anwender unsichtbar ausgeführt werden soll.

Beherrscht die norpaOCR die Erkennung von Handschrift?

Nein. Das tut aber keine uns bekannte OCR, zumindest dann, wenn man bei Handschrifterkennung an Omas Brief, "Arztschrift" oder an einen Schulaufsatz denkt. Ein ganz anderer Fall ist das Erkennen einzelner Druckschriftbuchstaben, wie man es z.B. von Überweisungsvordrucken kennt. Hier kann das image2data-Plugin für Musterekennung zum Einsatz kommen, welches beliebige Muster (und damit auch einzelne handgeschriebene Druckbuchstaben) erkennen kann.

Wie hoch ist die Erkennungsgenauigkeit der norpaOCR?

Sehr gut, sonst würden wir sie nicht anbieten :-) Leider gibt es für Texterkennungen aber keinen Benchmark, der einen Vergleich zwischen den System erlauben würde. Natürlich hängt aber die Qualität des Outputs bei einer Text- oder Barcodeerkennung immer sehr stark von der Qualität der Vorlage ab.

Warum ist die norpaOCR so schnell?

Wir haben bei der norpaOCR bewusst darauf verzichtet, „exotische“ Zeichen und Sprachen erkennen zu wollen. So fehlt Omas Sütterlin ebenso wie Chinesisch und Arabisch und die Klicklaute der afrikanischen Buschmänner. Das wirkt sich natürlich sehr positiv auf die Erkennungsgeschwindigkeit aus.

*Pflichtfelder

No Abbrechen