Encoding beim Auslesen von Webseiten
lima-city → Forum → Programmiersprachen → Java
-
Hallo zusammen,
ich lese per
den HTML-Code einer Webseite ein und will diesen dann in meinem Programm weiterverwenden. Bei deutschen Webseiten funktioniert dies auch Problemlos... Jedoch wenn ich Webseiten die das "UTF8" Encoding beinhalten öffnen will, werden Umlaute als "ü" usw. ausgegeben... Gibt es irgend eine Möglichkeit, dass Java diese automatisch richtig umwandelt oder muss ich diese immer manel umwandeln?BufferedReader rd = new BufferedReader( new InputStreamReader(con.getInputStream()));
Gruss -
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!
lima-city: Gratis werbefreier Webspace für deine eigene Homepage
-
Ich habe nun folgende Methode entdeckt die automatisch das richtige Encoding wählt:
URL url = new URL(elem.toString()); URLConnection con = url.openConnection(); BufferedReader rd = new BufferedReader(new InputStreamReader(con.getInputStream(), con.getContentEncoding()));
Mit con.getContentEncoding() wird automatisch das Encoding der Webseite gewählt und dann an den InputStreamReader weitergegeben. -
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!
lima-city: Gratis werbefreier Webspace für deine eigene Homepage