header utf-8 und Daten mit iso-8859-1
lima-city → Forum → Programmiersprachen → PHP, MySQL & .htaccess
ankommen
bestimmte zeichen
code
datum
euro
folgendes tun
fremde quellen
grund
header
klartext
kodierung
liste
mus
safe
sicherheit
umlaut
umwandlung
url
verzwickte situation
zeichen
-
wenn ich per php header den Charset auf UTF-8 gestellt habe
und dann aus einer CSV Daten einlese, die in iso-8859-1 angelegt ist
kommt dann der Content aus der CSV als UTF-8 im Script / Browser an ?
also quasi wie mit utf8_encode() ... oder mus ich selber noch utf8_encode() machen?
und was machen bei Zeichen, die nicht "richtig" in UTF-8 de-/codierbar sind
z:B. das Euro-Zeichen € oder ein langer Gedankenstrich – (‐)
-
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!
lima-city: Gratis werbefreier Webspace für deine eigene Homepage
-
suchsmart schrieb:
das dürfte ein generelles misverständniss sein!
... und was machen bei Zeichen, die nicht "richtig" in UTF-8 de-/codierbar sind
z:B. das Euro-Zeichen € oder ein langer Gedankenstrich – (‐)
du solltest - dass alles richtig dargestellt wird - folgendes tun:
1. alle deine scripte mit utf-8 (ohnem BOM) speichern;
2. du solltest alle deine datenbanken und tabellen in utf-8 anlegen. natürlich da gehören dann auch utf-8 daten rein!
3. in deinem html sollte
im header enthalten sein.<meta charset="utf-8" />
das wars. -
danke, ich bemühe mich ja möglichst auf UTF-8 zu arbeiten
mein Problem mal andersrum beschrieben
meine Seite ist grundsätzlich in UTF-8
ich hole Daten aus externer CSV Datei, auf die ich keinen Einfluss habe
die CSV ist leider in iso-8859-1 angelegt, das kann ich auch nicht ändern
Umlaute stehen darin im Klartext, also ä ö ü aber auch € Zeichen, etc.
vor Ausgabe mache ich also utf8_encode()
aber die Umwandlung der ISO-Daten in UTF-8 funktioniert nicht vollständig
bestimmte Zeichen werden nicht richtig codiert mit utf8_encode
wie gesagt z:B. das Euro-Zeichen € oder ein langer Gedankenstrich – (‐)
aber auch Fehler bei anderen Sonderzeichen, die im "Klartext" ankommen
gibt es eine Liste der Zeichen, die "falsch" codiert werden?
bzw. wie kann ich auch diese Zeichen "richtig" zu UTF-8 bringen ?
Beitrag zuletzt geändert: 15.2.2012 15:47:38 von suchsmart -
das ist natürlich eine verzwickte situation ;) fremde quellen könne alles enthalten, was eigentlich schon gar nicht mehr zu kodierung, sondern zu sicherheit gehört. also da kann man generell so gut wie nichts sagen, schon aus dem grund, dass viele webprogrammierer aus eigenen(?) ganz anders kodieren (ich möchte jetzt hier bösartigkeit mal ausschließen ;).
daher kann ich nur mehr zu so etwas raten: falsch kodiert "utf 8". -
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!
lima-city: Gratis werbefreier Webspace für deine eigene Homepage