PDF auslesen mit PHP
lima-city → Forum → Programmiersprachen → PHP, MySQL & .htaccess
angabe
anhaltspunkt
aufgabe
aufwand
auslese
bild
brauchen
datei
dokument
funktion
grenze
http
image
index
klartext
muster
page
programm
schau
texteditor
-
Hallo Leute,
Mich würde mal interessieren ob es mit PHP möglich ist PDF dokumente zu offnen,
und dann zB. So sachen wie alle Überschriften auslesen geht, oder ähnliches ?
Hat da jemand vl schon sowas oder kann mir irgendwie anhaltspunkte dafür geben? -
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!
lima-city: Gratis werbefreier Webspace für deine eigene Homepage
-
Schau mal in nem Texteditor die PDF-Datei an, ist auch nur Plaintext (bis auf Bilder etc. natürlich), mit etwas Aufwand (der sich jedoch in Grenzen hält) lässt sich dann ein eigener Parser schreiben, der die Überschriften herausfiltern kann.
-
Ich hab mich damit selbst schonmal befasst und mit Hilfe von php.net und diversen google-Trffern eine Funktion geschrieben, die zumindest teilweise diese Aufgabe erfüllen kann: http://cacophonie.de/index.php?site=page&lid=9
Wirklich weit bin ich nicht gekommen, aber vielleicht hilft es dir ja weiter. -
Schau mal in nem Texteditor die PDF-Datei an, ist auch nur Plaintext (bis auf Bilder etc. natürlich), mit etwas Aufwand (der sich jedoch in Grenzen hält) lässt sich dann ein eigener Parser schreiben, der die Überschriften herausfiltern kann.
Hmm, nein also bei mir steht da in klartext höchstens sowas wie Meta angaben die das Programm zu brauchen scheint.
siehe zB http://www.adobe.com/devnet/acrobat/pdfs/pdf_reference_addendum_redaction.pdf
ansonsten find ich immer nur \"Ansätze\" die zu nichts geführt haben.
-
Schau mal in nem Texteditor die PDF-Datei an, ist auch nur Plaintext (bis auf Bilder etc. natürlich), mit etwas Aufwand (der sich jedoch in Grenzen hält) lässt sich dann ein eigener Parser schreiben, der die Überschriften herausfiltern kann.
Hmm, nein also bei mir steht da in klartext höchstens sowas wie Meta angaben die das Programm zu brauchen scheint.
siehe zB http://www.adobe.com/devnet/acrobat/pdfs/pdf_reference_addendum_redaction.pdf
ansonsten find ich immer nur \"Ansätze\" die zu nichts geführt haben.
Du musst einfach mal im Plaintext nach den Überschriften suchen. Dann wird dir auffallen, dass diese so deffiniert sind:
- Title(Introduction)
- Title(Additions to the PDF Reference)
- usw.
Mit der Funktion eregi() kannst du dann nach dem Muster des Titels suchen und auslesen lassen. -
Ach wieso hat das bei der geklappt ... naja egal. Das mim Plaintext klappt nicht ...
Siehe hier :
http://www.file-upload.net/download-712488/pdftest.pdf.html
Sorry das ich jetzt erst eine \"richtige\" pdf Datei parat habe ;) -
Hmm niemand ne vernünftige Idee wies bei denen geht ?
-
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!
lima-city: Gratis werbefreier Webspace für deine eigene Homepage