Profil | Mitglieder | Registrieren | Start | Suche


PHP-Support.de » Programmierung » Sonstige Sprachen » pdf texte auslesen    » Hallo Gast [Login | Registrieren]

Neues Thema | Antworten   

Autor Beitrag
smithi
Mitglied
Aktiver User


Dabei seit: 14.09.2009
Herkunft: Menden(Sauerland)
Posts: 206
     pdf texte auslesen Zitat | Bearbeiten

Hi,
ich stehe vor vollgendem Problem... Ich habe ca. 1000 Visitenkarten die ich alle in Outlook Kontaktdaten eintragen soll.

Wenn ich eine Visitenkarte einscanne und eine Text erkennungs Software drüber laufen lasse habe ich schon mal die Texte digital. Aber wie kann ich aus der erzeugten PDF Datei die Texte herausfiltern?
Das Abspeichern in die Outlook Datei wird das kleinste Problem.

Kennt da jemand was oder muss ich alles per Hand machen?

Programmiersprache ist egal ob C, C++ oder C#. Kann von mir aus auch PHP sein obwohl ich das unwahrscheinlich finde.


Danke im vorraus




Bei zuviel langeweile einfach mal Basteln...
11.10.2012, 07:53 Profil | PM | E-Mail  
Gast


      Zitat | Bearbeiten

Also ich weiß nur, dass es auch mit PHP geht und man dazu auch was findet, wenn man nach "PDF2Text" oder eben "PDF mit PHP auslesen" bei Google sucht.

Ob es die richtige Wahl dafür ist, weiß ich nicht. Aber wird ja nichts sein, was du irgendwo dauerhaft anwenden willst, sondern eher, um die Visitenkarten einmal zu digitalisieren und zu speichern, oder?

Dann wäre die Lösung vielleicht schon genug und du müsstes keine Zeit "verschwenden" eine "schönere" Lösung zu finden, wenn die es ja auch tut.





11.10.2012, 10:14  
Gast


      Zitat | Bearbeiten

Edit: http://www.php.de/php-einsteiger/79963-pdf-mit-php-auslesen.html

Da findest du 1-2 nützliche Links und Klassen für PHP.


11.10.2012, 10:15  
smithi
Mitglied
Aktiver User


Dabei seit: 14.09.2009
Herkunft: Menden(Sauerland)
Posts: 206
      Zitat | Bearbeiten

alles klar danke


Bei zuviel langeweile einfach mal Basteln...
11.10.2012, 10:39 Profil | PM | E-Mail  
Lynn
Mitglied
Anfänger


Dabei seit: 20.10.2012
Herkunft: keine Angabe
Posts: 56
      Zitat | Bearbeiten

Hi

Wenn Du schon einscannst mit einem Wiedererkennungsprogramm, warum dann nicht in Word oder OpenOffice? So könntest Du weiterbearbeiten. Von da zu PDF wär ja kein Problem.


Lieben Gruß
Lynn

Post wurde schon 2x editiert, das letzte mal am 21.10.2012 um 01:18 von Lynn
21.10.2012, 01:17 Profil | PM | E-Mail  
Gast


      Zitat | Bearbeiten

Zitat:
Orginal von Lynn
Hi

Wenn Du schon einscannst mit einem Wiedererkennungsprogramm, warum dann nicht in Word oder OpenOffice? So könntest Du weiterbearbeiten. Von da zu PDF wär ja kein Problem.


Genauer lesen

Er wollte den TEXT aus der PDF Datei extrahieren.
Nicht die Daten als PDF haben


21.10.2012, 13:00  
Lynn
Mitglied
Anfänger


Dabei seit: 20.10.2012
Herkunft: keine Angabe
Posts: 56
      Zitat | Bearbeiten

Zitat:
Orginal von smithi
Wenn ich eine Visitenkarte einscanne und eine Text erkennungs Software drüber laufen lasse habe ich schon mal die Texte digital. Aber wie kann ich aus der erzeugten PDF Datei die Texte herausfiltern?


Nö, die PDF-Datei wird beim Scan-Vorgang erzeugt, aber man könnte auch zuerst in Word-Format scannen und erst nach der Bearbeitung und "Lesung" in PDF umwandeln.



Lieben Gruß
Lynn
21.10.2012, 13:45 Profil | PM | E-Mail  
FalkenaugeMihawk
Mitglied
Perfekter User


Dabei seit: 05.06.2010
Herkunft: Schweiz
Posts: 2613
      Zitat | Bearbeiten

Ich hab noch nie nen Scanner gesehen, der Word-Dateien erstellen kann.

Also mein Multifunktions-Drucker kann auch nur PDF oder JPEG.


21.10.2012, 14:11 Profil | PM | E-Mail  
Lynn
Mitglied
Anfänger


Dabei seit: 20.10.2012
Herkunft: keine Angabe
Posts: 56
      Zitat | Bearbeiten

Hi

Doch, das gibt es, ich hab auf diese Weise eine komplette Akte eingescannt in Word und bearbeitet, danach umgewandelt in andere Dateiformen (PDF und auch Open Office). Der Scanner war sogar der Billigste von allen.

Gut zu wissen. War mir sehr nützlich.


Lieben Gruß
Lynn
21.10.2012, 14:16 Profil | PM | E-Mail  
smithi
Mitglied
Aktiver User


Dabei seit: 14.09.2009
Herkunft: Menden(Sauerland)
Posts: 206
      Zitat | Bearbeiten

mhmm

unsere Scanner können nur PDF oder JPG....

bringt also nicht

Naja ich bin jetzt schon seit ein paar tagen dadran die visiten karten per Hand abzutippen, bisschen das 10 Finger schreiben üben.

aber trotzdem danke leute!


Bei zuviel langeweile einfach mal Basteln...
22.10.2012, 07:17 Profil | PM | E-Mail  
Lynn
Mitglied
Anfänger


Dabei seit: 20.10.2012
Herkunft: keine Angabe
Posts: 56
      Zitat | Bearbeiten

Also bei 1000 Visitenkarten würde sich der Kauf eines solchen Scanners schon lohnen, den hast Du dann auch für Weiteres. Wie weit bist Du denn schon, 100 schon erledigt?


Lieben Gruß
Lynn
22.10.2012, 08:59 Profil | PM | E-Mail  
smithi
Mitglied
Aktiver User


Dabei seit: 14.09.2009
Herkunft: Menden(Sauerland)
Posts: 206
      Zitat | Bearbeiten

ne bin so bei 400 - 500 schätze ich.
der stapel erledigt ist fast so hoch wie noch zu machen


Bei zuviel langeweile einfach mal Basteln...
22.10.2012, 09:13 Profil | PM | E-Mail  
Lynn
Mitglied
Anfänger


Dabei seit: 20.10.2012
Herkunft: keine Angabe
Posts: 56
      Zitat | Bearbeiten

Ah, okay, das geht doch recht flott. Eingescannt in Word müsstest Du sowieso den Text durchsehen und Leerzeichen rauslöschen. Von daher lohnt es sich in einem solchen Fall evtl. wirklich nicht, einen speziellen Scanner anzuschaffen. Witzig ist, dass mein Word-Scanner ein Zufallstreffer ist, mein erster Scanner überhaupt, jetzt schon uralt. Hatte ihn kaum gebraucht, aber auf einmal war er nützlich für diese Akte. Seither weiß ich ihn zu schätzen. Da ich noch Multifunktionsdrucker habe, dachte ich zuerst, ich bräuchte ihn nicht mehr. Ein Glück, dass ich ihn nicht verschenkt habe. War nahe dabei.


Lieben Gruß
Lynn
22.10.2012, 12:26 Profil | PM | E-Mail  
Zimti
Mitglied
Neuling


Dabei seit: 17.12.2014
Herkunft: keine Angabe
Posts: 8
      Zitat | Bearbeiten

Danke für die Anregungen, stand schonmal vor einem ganz ähnlichen Problem, konte dann aber einen Scanner von Bekannten nutzen.


17.12.2014, 10:33 Profil | PM | E-Mail  
Seiten (1):  1 
PHP-Support.de » Programmierung » Sonstige Sprachen » pdf texte auslesen   

Neues Thema | Antworten   


Powered by Command Board 1.0 - Beta 2.0 © 2004-08 PHP-Einfach | Impressum | Datenschutz