PDF auslesen mit PHP

lima-city → Forum → Programmiersprachen → PHP, MySQL & .htaccess

Autor dieses Themas
~~k********l~~

0:23, 7.3.2008
Hallo Leute,

Mich würde mal interessieren ob es mit PHP möglich ist PDF dokumente zu offnen,
und dann zB. So sachen wie alle Überschriften auslesen geht, oder ähnliches ?
Hat da jemand vl schon sowas oder kann mir irgendwie anhaltspunkte dafür geben?
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!

lima-city: Gratis werbefreier Webspace für deine eigene Homepage
mergener

mergener hat kostenlosen Webspace.

1:20, 7.3.2008
http://www.google.de/search?hl=de&q=pdf+mit+php+auslesen&btnG=Google-Suche&meta=
Dort sind einige Artikel mit lösungsgrundsätzen

dabei jedesmal zu beachetn:
Datei MUSS am PC erstellt sein und darf nicht kopiert sein oder aus einer image-datei raus erstellt worden sein!
~~t*****b~~

1:59, 7.3.2008
Schau mal in nem Texteditor die PDF-Datei an, ist auch nur Plaintext (bis auf Bilder etc. natürlich), mit etwas Aufwand (der sich jedoch in Grenzen hält) lässt sich dann ein eigener Parser schreiben, der die Überschriften herausfiltern kann.
tct

tct hat kostenlosen Webspace.

12:19, 7.3.2008
Ich hab mich damit selbst schonmal befasst und mit Hilfe von php.net und diversen google-Trffern eine Funktion geschrieben, die zumindest teilweise diese Aufgabe erfüllen kann: http://cacophonie.de/index.php?site=page&lid=9
Wirklich weit bin ich nicht gekommen, aber vielleicht hilft es dir ja weiter.
Autor dieses Themas
~~k********l~~

15:43, 7.3.2008

Schau mal in nem Texteditor die PDF-Datei an, ist auch nur Plaintext (bis auf Bilder etc. natürlich), mit etwas Aufwand (der sich jedoch in Grenzen hält) lässt sich dann ein eigener Parser schreiben, der die Überschriften herausfiltern kann.

Hmm, nein also bei mir steht da in klartext höchstens sowas wie Meta angaben die das Programm zu brauchen scheint.
siehe zB http://www.adobe.com/devnet/acrobat/pdfs/pdf_reference_addendum_redaction.pdf

ansonsten find ich immer nur \"Ansätze\" die zu nichts geführt haben.
~~t*****b~~

16:05, 7.3.2008

Schau mal in nem Texteditor die PDF-Datei an, ist auch nur Plaintext (bis auf Bilder etc. natürlich), mit etwas Aufwand (der sich jedoch in Grenzen hält) lässt sich dann ein eigener Parser schreiben, der die Überschriften herausfiltern kann.

Hmm, nein also bei mir steht da in klartext höchstens sowas wie Meta angaben die das Programm zu brauchen scheint.
siehe zB http://www.adobe.com/devnet/acrobat/pdfs/pdf_reference_addendum_redaction.pdf

ansonsten find ich immer nur \"Ansätze\" die zu nichts geführt haben.

Du musst einfach mal im Plaintext nach den Überschriften suchen. Dann wird dir auffallen, dass diese so deffiniert sind:
- Title(Introduction)
- Title(Additions to the PDF Reference)
- usw.

Mit der Funktion eregi() kannst du dann nach dem Muster des Titels suchen und auslesen lassen.
Autor dieses Themas
~~k********l~~

22:30, 7.3.2008
Ach wieso hat das bei der geklappt ... naja egal. Das mim Plaintext klappt nicht ...
Siehe hier :
http://www.file-upload.net/download-712488/pdftest.pdf.html

Sorry das ich jetzt erst eine \"richtige\" pdf Datei parat habe ;)
Autor dieses Themas
~~k********l~~

14:54, 12.3.2008
Hmm niemand ne vernünftige Idee wies bei denen geht ?
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!

lima-city: Gratis werbefreier Webspace für deine eigene Homepage

Dir gefällt dieses Thema?

Über lima-city

lima-city bietet dir kostenlosen und werbefreien Speicherplatz für Deine Homepage. Sofort anmelden und direkt loslegen mit Webspace, PHP, Datenbanken, günstigen Domains und einer tollen Community!

kostenloser Webspace werbefrei: lima-city

PDF auslesen mit PHP

lima-city → Forum → Programmiersprachen → PHP, MySQL & .htaccess

Dir gefällt dieses Thema?

Über lima-city

Login zum Webhosting ohne Werbung!