kostenloser Webspace werbefrei: lima-city


[VB2010]Stücke einer Homepage auslesen.

lima-cityForumProgrammiersprachenProgrammieren mit .NET & Mono

  1. Autor dieses Themas

    myminecrafthp

    myminecrafthp hat kostenlosen Webspace.

    Hallo Leute,

    da ich Vb lerne würde es mich Interessieren wie man teile einer Homepage tag/auslese">auslesen kann.
    Habe gehört es gibt mit Split oder Regex, weiß aber nicht wie.
    Nehmen wir an ich möchte z.b aus diesen Thread alle Beiträge einzelnt (automatisch) auslesen wollen, wie geht es?

    lg
  2. Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!

    lima-city: Gratis werbefreier Webspace für deine eigene Homepage

  3. Hier wäre eine Lösung:
    Ganz oben hin:
    Imports System.Net

    Das dann in den Form_Load rein:
    Dim wc As New WebClient()
    Dim hp As String = "http://www.example.org/"
    Dim back As String = wc.DownloadString(hp)
    ' in der Variable back  steht der gesamte Quelltext der homepage.
    ' Hier wird das verarbeitet

    MFG das Team von ventos Software

    Edit:
    Dim teile As String()
    teile = back.Split("</head><body*>")
    Dim head as string = teile(0)
    Dim body as string = teile(1)

    das noch dranhängen, dann hast du in head den head und in body den body.

    Beitrag zuletzt geändert: 4.6.2012 16:00:08 von ventos
  4. Autor dieses Themas

    myminecrafthp

    myminecrafthp hat kostenlosen Webspace.

    ventos schrieb:
    Hier wäre eine Lösung:
    Ganz oben hin:
    Imports System.Net

    Das dann in den Form_Load rein:
    Dim wc As New WebClient()
    Dim hp As String = "http://www.example.org/"
    Dim back As String = wc.DownloadString(hp)
    ' in der Variable back  steht der gesamte Quelltext der homepage.
    ' Hier wird das verarbeitet

    MFG das Team von ventos Software

    Edit:
    Dim teile As String()
    teile = back.Split("</head><body*>")
    Dim head as string = teile(0)
    Dim body as string = teile(1)

    das noch dranhängen, dann hast du in head den head und in body den body.


    Danke aber dann hätte ich doch noch die ganzen <img> <a> und <p> ect Tags drin.
  5. h*******3

    Das ist richtig aber es hilft die den Inhalt der einzelnen Beiträge zu lokalisieren.

    z.B. werden die einzelnen Beiträge dieses Thread jeweils mit <il> gekennzeichnet und der Thread selbst mit <ul class="posts">.
    Das ganz must du dir halt zu nutze machen um die gewünschten Infos heraus zu filtern.

    LG Hanibal
  6. Autor dieses Themas

    myminecrafthp

    myminecrafthp hat kostenlosen Webspace.

    Aber was ist wenn noch andere Sachen <il> hätten dann würden die ja mit kommen :/
  7. h*******3

    myminecrafthp schrieb:
    Aber was ist wenn noch andere Sachen <il> hätten dann würden die ja mit kommen :/


    Das kann durchaus vorkommen.

    Die Tags einer Webseite sind geschachtelt und haben auch teilweise eindeutige Bezeichner.
    Du musst nun den Tag finden der deinen Infos am nächsten ist und der einen eindeutigen Bezeichner hat.
    Diesen kannst du nun als Einstiegspunkt nutzen und alle untergeordneten Tags lassen sich dann über ihren Index ansprechen.

    Stell dir das aber nicht zu einfach vor denn das ist es mit Sicherheit nicht.
  8. Autor dieses Themas

    myminecrafthp

    myminecrafthp hat kostenlosen Webspace.

    Das es nicht leicht ist weiß ich selber :P
    Aber danke für die Tipps werde mal schauen :)
  9. h******d

    Du kannst auch ein WebBrowser Control erstellen,diese Klasse hat ein Member Elements(oder so ähnlich),da kannst du alle einzelnen Sachen auslesen!
  10. h*******3

    hix3133d schrieb:
    Du kannst auch ein WebBrowser Control erstellen,diese Klasse hat ein Member Elements(oder so ähnlich),da kannst du alle einzelnen Sachen auslesen!


    Diese Möglichkeit besteht auch, aber ...

    1. ist es wesentlich umständlicher zu programmieren weil er dann zu jedem Tag erst eine Objektvariable erstellen muss um dann auf diese zuzugreifen um an die nächste Ebene von Tags zu kommen usw.
    Es ist doch wesentlich einfacher das gesuchte Tag direkt aus dem Quellcode zu filtern.

    2. Das genannte Control funktioniert meines Wissens nur wenn es in der Oberfläche sichtbar ist und ich denke das ist nicht erwünscht weil er nur die Daten aus bestimmten Teilen einer Seite auslesen möchte.
  11. hanibal63 schrieb:
    2. Das genannte Control funktioniert meines Wissens nur wenn es in der Oberfläche sichtbar ist und ich denke das ist nicht erwünscht weil er nur die Daten aus bestimmten Teilen einer Seite auslesen möchte.

    Nein, das WebBrowser-Control muss nicht sichtbar sein, sondern nur auf der Worm liegen. Es kann deaktiviert (= nicht sichtbar) sein und funktioniert dennoch!
  12. h******d

    Es muss lediglich erstellt sein. Das Control wurde dann nicht gezeichnet,kann aber trotzdem die funktionen ausführen.
  13. Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!

    lima-city: Gratis werbefreier Webspace für deine eigene Homepage

Dir gefällt dieses Thema?

Über lima-city

Login zum Webhosting ohne Werbung!