kostenloser Webspace werbefrei: lima-city


PDF auslesen mit PHP

lima-cityForumProgrammiersprachenPHP, MySQL & .htaccess

  1. Autor dieses Themas

    k********l

    Hallo Leute,

    Mich würde mal interessieren ob es mit PHP möglich ist PDF dokumente zu offnen,
    und dann zB. So sachen wie alle Überschriften auslesen geht, oder ähnliches ?
    Hat da jemand vl schon sowas oder kann mir irgendwie anhaltspunkte dafür geben?
  2. Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!

    lima-city: Gratis werbefreier Webspace für deine eigene Homepage

  3. http://www.google.de/search?hl=de&q=pdf+mit+php+auslesen&btnG=Google-Suche&meta=
    Dort sind einige Artikel mit lösungsgrundsätzen

    dabei jedesmal zu beachetn:
    Datei MUSS am PC erstellt sein und darf nicht kopiert sein oder aus einer image-datei raus erstellt worden sein!
  4. t*****b

    Schau mal in nem Texteditor die PDF-Datei an, ist auch nur Plaintext (bis auf Bilder etc. natürlich), mit etwas Aufwand (der sich jedoch in Grenzen hält) lässt sich dann ein eigener Parser schreiben, der die Überschriften herausfiltern kann.
  5. Ich hab mich damit selbst schonmal befasst und mit Hilfe von php.net und diversen google-Trffern eine Funktion geschrieben, die zumindest teilweise diese Aufgabe erfüllen kann: http://cacophonie.de/index.php?site=page&lid=9
    Wirklich weit bin ich nicht gekommen, aber vielleicht hilft es dir ja weiter.
  6. Autor dieses Themas

    k********l


    Schau mal in nem Texteditor die PDF-Datei an, ist auch nur Plaintext (bis auf Bilder etc. natürlich), mit etwas Aufwand (der sich jedoch in Grenzen hält) lässt sich dann ein eigener Parser schreiben, der die Überschriften herausfiltern kann.

    Hmm, nein also bei mir steht da in klartext höchstens sowas wie Meta angaben die das Programm zu brauchen scheint.
    siehe zB http://www.adobe.com/devnet/acrobat/pdfs/pdf_reference_addendum_redaction.pdf

    ansonsten find ich immer nur \"Ansätze\" die zu nichts geführt haben.
  7. t*****b



    Schau mal in nem Texteditor die PDF-Datei an, ist auch nur Plaintext (bis auf Bilder etc. natürlich), mit etwas Aufwand (der sich jedoch in Grenzen hält) lässt sich dann ein eigener Parser schreiben, der die Überschriften herausfiltern kann.

    Hmm, nein also bei mir steht da in klartext höchstens sowas wie Meta angaben die das Programm zu brauchen scheint.
    siehe zB http://www.adobe.com/devnet/acrobat/pdfs/pdf_reference_addendum_redaction.pdf

    ansonsten find ich immer nur \"Ansätze\" die zu nichts geführt haben.



    Du musst einfach mal im Plaintext nach den Überschriften suchen. Dann wird dir auffallen, dass diese so deffiniert sind:
    - Title(Introduction)
    - Title(Additions to the PDF Reference)
    - usw.

    Mit der Funktion eregi() kannst du dann nach dem Muster des Titels suchen und auslesen lassen.
  8. Autor dieses Themas

    k********l

    Ach wieso hat das bei der geklappt ... naja egal. Das mim Plaintext klappt nicht ...
    Siehe hier :
    http://www.file-upload.net/download-712488/pdftest.pdf.html

    Sorry das ich jetzt erst eine \"richtige\" pdf Datei parat habe ;)
  9. Autor dieses Themas

    k********l

    Hmm niemand ne vernünftige Idee wies bei denen geht ?
  10. Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!

    lima-city: Gratis werbefreier Webspace für deine eigene Homepage

Dir gefällt dieses Thema?

Über lima-city

Login zum Webhosting ohne Werbung!