text aus bild auslesen, editieren und speichern
lima-city → Forum → Programmiersprachen → PHP, MySQL & .htaccess
aufnahme
auslese
bild
dank
ergebnis
eventuell jemand
fertigstellung
forum
gockel
http
image
jemand
offensichtlich fertige klassen
originalbild
pilot
programm
schritt
text
umfangreiche texte
url
-
hi
ich weiß es, wie das sich anhört ;o) trotzdem. nochmals: die haptaufgabe lautet, aus bild (jpeg) umfangreiche texte mit php auslesen, so das sie im textformat vorliegt(, rest wie im titel)
kennt eventuell jemand eine fertige lösung?
danke in voraus!
==== edit: das ist hier sicher falsch, ich wollte nach php. biite dorthin verschieben! danke
Beitrag zuletzt geändert: 7.9.2011 14:58:58 von hemiolos -
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!
lima-city: Gratis werbefreier Webspace für deine eigene Homepage
-
Es scheint dafür offensichtlich fertige Klassen zu geben:
http://www.phpclasses.org/package/2874-PHP-Recognize-text-objects-in-graphical-images.html
Du kannst selber weitersuchen, indem du bei Gockel nach OCR (Optical character recognition suchst. -
burgi schrieb:
ok. ich dachte, jemand weißt mehr als ich.
Es scheint dafür offensichtlich fertige Klassen zu geben
... indem du bei Gockel nach OCR (Optical character recognition) suchst.
auch ok. das war mir auch klar. trotzdem, danke burgi!
die von dir vorgeschlagene klasse ist sogar einiger maßen interessant, weil ja 'lernfehig' ist, was bei ocr nich zu unterschätzen wäre. aber leider, ich kann dem kunden nicht mitteilen: "hören sie! was glauben sie, wo sind sie? sie müssen das programm auf das bild zuerst einmal stunden lang 'scharfmachen', bevor sie ihren jämmerlichen text editieren können." oder so ...
daher habe ich mich entschieden, mit reinen, überall vorhandenen/installierbaren (außerhalb von lima und co. ;o) linux boardmitteln auzukommen. das heißt, ich werde einfach einen wrapper für diese aufgabe programmieren.
der erste schritt war ein 'pilot'-test (das sich - trotz funktionsfähigkeit - weder als programm, noch fertig oder so bezeichnen will), dessen ergebnis ganz zufriedenstellend ist.
paar images für die funktionsweise (nochmals! auf lima geht das ganze nicht und source gibt es erst nach der fertigstellung!):
bild mit ergebnis
originalbild (ziemlich miserable aufnahme)
(
kurz erklärt:
das originalbild wurde mit gimp zu sw-bild gemacht [vorgang wird zukünftig natürlich programmatisch ausgeführt])
das im wrapper integriertes prog djpeg wandelt das sw-bild in PNM und via pipe übergibt es gocr für weitere bearbeitung, sprich - text aus dem bild extrahieren (siehe ergebnis: links der text in einem <textarea>[natürlich editierbar :o) und demnächst auch abspeicherbar - natürlich].
rechts das bild, woher der text entnommen wird
).
das ganze mus natürlich noch erheblich verfeinert und durchprogrammiert werden! danach wird das ganze hier veröffentlicht.
hat jemand noch irgendwelche nachvollziehbare ideeen dazu, nichts wie hier rein damit ...
nochmals dank an burgi! -
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!
lima-city: Gratis werbefreier Webspace für deine eigene Homepage