Suchmaschinenprojekt
lima-city → Forum → Die eigene Homepage → Internet Allgemein
all
anfang
anfrage
diskutieren
erfolg
ergebnis
erzielen
feld
gegner
idee
kategorie
milliarde
million
problem
sagen
segeln
sekunde
suchmaschine
tagesschau
url
-
Hi @all!
Ich bin ja eigentlich ein Google-Gegner. Ich nutze Google zwar auch, weil die Ergebnisse einfach am Besten sind. Nun hab ich mir mal vor ner Weile überlegt, dann halt selber es besser zu machen. Soll heißen:
-Eine Suchmaschine für Jedermann
-Keine verdeckten Sachen hinter dem Rücken von den Nutzern (d.h. am besten eine Baumauflistung von Serverinhalten und Zugang für Leute die das was angeht
-UND hohe einfachheit.
Ich hab auch schon mal angefangen. Nur weiß ich noch nicht so ganz, wie ich einen Crawler proggen soll. Bin aber dabei. Die Seiten:
telelo.lima-city.de/experimente Und dann einfach auf Suche durchklicken. News.php stellt die RSS-Nachrichten von Tagesschau da.
Wer die Idee toll findet oder eine Meinung dazu hat oder mitmachen will, einfach hier antworten!
PS: Das ganze hat dann ja auch schon ein Konzept!
MfG
telelo
Edit:Einfach mal PHP, telelo oder sonok eingeben, dann sollten ein paar Ergebnisse angezeigt werden! Gebt mal mehrere hintereinander ein! Dann zeigt er alle ergebnisse zu den einzelnen Wörtern!
Beitrag zuletzt geändert: 8.6.2009 21:48:00 von telelo -
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!
lima-city: Gratis werbefreier Webspace für deine eigene Homepage
-
Hab ich das richtig verstanden? Du willst Google stürzen??
-
probiern kannst des schon ;)
aber wie willst du das ganze Internet durchcrawlen ? Ich glaub da scheiterst du mit deiner PC-Leistung :P.... -
Ich will dir ja nicht den Wind aus den Segeln nehmen, aber...
Die Programmierung wird noch dein einfachstes Problem sein.
Das größere Problem wird die enorme Datenmenge sein.
Google hat für seine Suchmaschine mehrere Tausend Server, allein für die Gigantischen Datenbanken - also um die enormen Datenmengen zu speichern und abrufbereit zu halten.
Außerdem müsstest du eine Technik entwickeln um mehrere Petabyte an Daten innerhalb weniger Sekunden zu durchforsten.
Kein einfaches Unterfangen.
Aber ich wünsche dir viel Erfolg. -
Zudem kommt noch eine Schwierigkeit. Wenn du gute Ergebnisse erzielen möchtest, brauchst du einen ausgefeilten Logarithmus der die vorhandenen Daten auch richtig auswertet. Da reicht keine einfache Datenbankanfrage mit "LIKE". Bisher scheint es so, als würde die Seite kategorisiert aufgelistet werden.
Das ist für den Anfang ganz gut, aber so etwas geschieht meist manuell. Ein Suchroboter hat es da schwerer eine sinnvolle Kategorisierung vorzunehmen. Zudem sollten auch die kategorisierten Begriffe nicht nur einfach ausgegeben, sondern nach Priorität geordnet werden.
Die Darstellung finde ich zwar nicht optimal, aber durchaus für den Anfang gut. -
@web-dienstleistungen: Das wird zwar fast unmöglich sein, ist aber eine der Ideen dahinter.
Und sonst: Ich weiß nicht, warum immer alle nur mit den Suchergebnissen von Google prahlen. Wofür 1.000.000 Ergebnisse, wenn noch nicht mal das Erste brauchbar ist?? Wenn man max. 2000 Ergebnisse pro Anfrage hat, wird sich immernoch nicht auch nur irgendjemand bis zum 2000ten Ergebniss durchklicken. Wofür dann 1. Million??
Das die Chance das was draus wird gering ist, ist mir schon klar. Achso: Ich arbeite nicht mit Kategorien, sondern hab halt den Seiten immer nur das Keyword PHP gegeben, da ich noch nicht so recht weiß, wie ich in ein MySQL Feld mehrere Keywords schreiben soll, um sie dann einzelnt auszuwerten.
telelo -
telelo schrieb: Ich weiß nicht, warum immer alle nur mit den Suchergebnissen von Google prahlen. Wofür 1.000.000 Ergebnisse, wenn noch nicht mal das Erste brauchbar ist?? Wenn man max. 2000 Ergebnisse pro Anfrage hat, wird sich immernoch nicht auch nur irgendjemand bis zum 2000ten Ergebniss durchklicken. Wofür dann 1. Million??
Dann suchst du falsch. Meine Suchanfragen bei Google sind fast immer erfolgreich. Ob es 2000 oder 1 000 000 Ergebnisse gibt, interessiert keinen. Wichtig ist, dass unter den ersten Ergebnissen, das beste Ergebnis dabei ist. Und das ist bei Google fast immer gegeben.
telelo schrieb: Ich arbeite nicht mit Kategorien, sondern hab halt den Seiten immer nur das Keyword PHP gegeben, da ich noch nicht so recht weiß, wie ich in ein MySQL Feld mehrere Keywords schreiben soll, um sie dann einzelnt auszuwerten.
Ja, das ändert aber nichts daran, dass es keine Ordnung der Seiten nach Priorität gibt. Aber das ist wichtig. Wenn deine Suchmaschine so arbeitet, wird sie irgendwann hunderte von Webseiten mit dem Schlüsselwort PHP haben, aber nicht differenzieren können, was für den Suchenden hilfreich ist. -
Also Ich denke, dass man wohl nie eine ebenso bakannte und auch effiziente Suchmaschine wie Google noch publizieren kann, vorallem da die wahrscheinlich die nötigen Mittel dazu fehlen.
-
Also, mit einem netten Sponsor, der dir die Milliarde für einen flotten Anfang spendiert, einem Team aus 100 Programmierern und Profis im Bereich Suchalgorithmen, ja, dann ist nen Versuch wert. Ansonsten: Woher hast die diese Idee?!? Bei der Computer-Bild gelesen? "Suchmaschine in 5 Minuten!" ?
Du hörst dich zumindest danach an.
Du hast schonmal angefangen... scheiterst am Crawler... Also, eine Seite wo oben Suchmaschine steht ist ja nicht das Problem. Das Problem ist gerade der Crawler. Du musst Seiten finden, sie effektiv einordnen, indizieren, usw. Damit sie nachher in Sekundenbruchteilen abrufbar sind.
Auf jeden Fall: Vergiss es! Mach dir keine falschen Hoffnungen, das will ich an dieser Stelle man ganz deutlich sagen! -
Ist das mit dem Schutzanzug nicht überflüssig?
Oder besser gefragt: Wozu ist das? -
@n0x3l: Einfach nur ein Gimmik!
@all: O.k. Aber ich darfs ja versuchen. Vielleicht schaffe ich das mit dem Crawler ja doch. Und dass das nicht so ein großer Erfolg wie Google wird, ist klar. Vielleicht sollte man an diesem Punkt aufhören zu diskutieren. Ich kann ja berichten, sollte ich weiter sein. Kann man solche Algorythmen(ich weiß was das ist) auch mit PHP proggen??
telelo -
trotzdem will ich noch kurz was sagen:
wenn man google richtig verwendet, dann bekommst du auch das was du suchst als erstes ergebnis und alle anderen sind dann egal.
lg -
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!
lima-city: Gratis werbefreier Webspace für deine eigene Homepage