kostenloser Webspace werbefrei: lima-city


Webcrawler programmieren

lima-cityForumProgrammiersprachenPHP, MySQL & .htaccess

  1. Autor dieses Themas

    mmc

    mmc hat kostenlosen Webspace.

    Hallo,
    mich würde mal tag/interessieren">interessieren, wie man einen Webcrawler programmieren kann.
    Ich hab mich da informiert, und herausgefunden, dass man auf einer Webseite einfach alle Links auslesen muss und dann auf den verlinkten seiten wieder und wieder...
    Aber was müsste man sonst noch machen, und wie kann ich in PHP alle Links auf einer Seite ausgeben?

    mfg
    mmc
  2. Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!

    lima-city: Gratis werbefreier Webspace für deine eigene Homepage

  3. 1. mit PHP und Lima ist das glaub ich unmöglich da dadurch auch der Server sehr belastet würde.
    2. Ich hab schon mal versucht mit Python einen Crawler zu machen und das ist nicht besonders leicht da heutzutage viele Links Javabefehele sind oder sie nur zu einer Datei statt zu einer Domain/Ip führen. Auch enstehen bei jeder Seite immer mehr Links die nacheinanader gecrawlt werden müssen.
  4. @mmc
    ... und wie kann ich in PHP alle Links auf einer Seite ausgeben?
    eine ganz rudimentäre lösung mit source-kode natürlich. (mein server ist in der regel fast am ganzen tag erreichbar [oder mein provider hat mir mal wieder sein ip verpasst, dann bin ich ein weilchen weg]. ich habe es da aufgenommen, weil lima sowas sonst nicht beantworten mag [siehe @krisi12345] :o)

    'rekursiv' machst du die suche dadurch, dass du die funktion mit den gewonnenen daten wieder und wieder aufrufst.
  5. Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!

    lima-city: Gratis werbefreier Webspace für deine eigene Homepage

Dir gefällt dieses Thema?

Über lima-city

Login zum Webhosting ohne Werbung!