Hi,
ich stehe vor vollgendem Problem... Ich habe ca. 1000 Visitenkarten die ich alle in Outlook Kontaktdaten eintragen soll.
Wenn ich eine Visitenkarte einscanne und eine Text erkennungs Software drüber laufen lasse habe ich schon mal die Texte digital. Aber wie kann ich aus der erzeugten PDF Datei die Texte herausfiltern?
Das Abspeichern in die Outlook Datei wird das kleinste Problem.
Kennt da jemand was oder muss ich alles per Hand machen?
Programmiersprache ist egal ob C, C++ oder C#. Kann von mir aus auch PHP sein obwohl ich das unwahrscheinlich finde.
Also ich weiß nur, dass es auch mit PHP geht und man dazu auch was findet, wenn man nach "PDF2Text" oder eben "PDF mit PHP auslesen" bei Google sucht.
Ob es die richtige Wahl dafür ist, weiß ich nicht. Aber wird ja nichts sein, was du irgendwo dauerhaft anwenden willst, sondern eher, um die Visitenkarten einmal zu digitalisieren und zu speichern, oder?
Dann wäre die Lösung vielleicht schon genug und du müsstes keine Zeit "verschwenden" eine "schönere" Lösung zu finden, wenn die es ja auch tut.
Wenn Du schon einscannst mit einem Wiedererkennungsprogramm, warum dann nicht in Word oder OpenOffice? So könntest Du weiterbearbeiten. Von da zu PDF wär ja kein Problem.
Lieben Gruß
Lynn
Post wurde schon 2x editiert, das letzte mal am 21.10.2012 um 01:18 von Lynn
Wenn Du schon einscannst mit einem Wiedererkennungsprogramm, warum dann nicht in Word oder OpenOffice? So könntest Du weiterbearbeiten. Von da zu PDF wär ja kein Problem.
Genauer lesen
Er wollte den TEXT aus der PDF Datei extrahieren.
Nicht die Daten als PDF haben
21.10.2012, 13:00
Lynn
Mitglied
Anfänger
Dabei seit: 20.10.2012
Herkunft: keine Angabe
Posts: 56
Orginal von smithi
Wenn ich eine Visitenkarte einscanne und eine Text erkennungs Software drüber laufen lasse habe ich schon mal die Texte digital. Aber wie kann ich aus der erzeugten PDF Datei die Texte herausfiltern?
Nö, die PDF-Datei wird beim Scan-Vorgang erzeugt, aber man könnte auch zuerst in Word-Format scannen und erst nach der Bearbeitung und "Lesung" in PDF umwandeln.
Doch, das gibt es, ich hab auf diese Weise eine komplette Akte eingescannt in Word und bearbeitet, danach umgewandelt in andere Dateiformen (PDF und auch Open Office). Der Scanner war sogar der Billigste von allen.
Also bei 1000 Visitenkarten würde sich der Kauf eines solchen Scanners schon lohnen, den hast Du dann auch für Weiteres. Wie weit bist Du denn schon, 100 schon erledigt?
Ah, okay, das geht doch recht flott. Eingescannt in Word müsstest Du sowieso den Text durchsehen und Leerzeichen rauslöschen. Von daher lohnt es sich in einem solchen Fall evtl. wirklich nicht, einen speziellen Scanner anzuschaffen. Witzig ist, dass mein Word-Scanner ein Zufallstreffer ist, mein erster Scanner überhaupt, jetzt schon uralt. Hatte ihn kaum gebraucht, aber auf einmal war er nützlich für diese Akte. Seither weiß ich ihn zu schätzen. Da ich noch Multifunktionsdrucker habe, dachte ich zuerst, ich bräuchte ihn nicht mehr. Ein Glück, dass ich ihn nicht verschenkt habe. War nahe dabei.