kostenloser Webspace werbefrei: lima-city


Kleines Validierungsprojekt

lima-cityForumSonstigesSpam und sonstiges Unvergütetes

  1. Autor dieses Themas

    toolz

    Kostenloser Webspace von toolz

    toolz hat kostenlosen Webspace.

    Ich habe eine fixe Idee von einem Programm, mit dessen Hilfe man alle möglichen Daten validieren kann. Es würde sich nur unwesentlich von einem Checksummenprogramm unterscheiden, mit dem kleinen Unterschied, dass dahinter eine Datenbank stehen soll, auf der von bekannten Programmen Validierungshashs angelegt wurden (gerade groß genug, um höchstwahrscheinlich alle Fehler zu finden). Je nach Umsetzung könnte man sich auch noch die fehlerhafte Datei ermitteln lassen (ansonsten würde man nur erfahren, dass überhaupt ein Fehler vorliegt)...

    Aber ich verschwende nur ungern meine Energie in ein solches Projekt (auch wenn es abgesehen von der Datenbank halb so wild ist), wenn es niemand benutzen würde. Daher frage ich hier, ob Interesse an einem solchen Programm bestünde?

    Gibt es rechtliche Probleme beim Anlegen der Hashs?

    Würdet ihr mitprogrammieren wollen?
  2. Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!

    lima-city: Gratis werbefreier Webspace für deine eigene Homepage

  3. Hallo,

    ich glaube ich verstehe dich richtig: Du willst ein Tool entwickeln, was die vom Nutzer eingegeben Daten validiert und auf schädlichen Code überprüft?

    Ich weiß nicht, ob so ein Programm so sinnvoll ist, da es bereits Funktionen zur Validierung gibt:

    mysql_real_escape_string()
    htmlentities()
    intval()
    ...


    Zudem kommt noch, dass je nachdem eine Vielzahl unterschiedlicher Werte erwartet und weiterverarbeitet werden...

    - E-Mails
    - Text
    - Zahlen
    - Links
    - Sonstige Stringformate (Datum, PLZ, Telefonnummern)
    ...

    Dazu ist es notwendig, dass der Coder die Werte je nach Sachverhalt selber versucht zu validieren.

    Ein Tool, was sowas leisten sollte, müsste auf eine Vielzahl verschiedener Möglichkeiten einstellbar sein. Die ganzen Einstellungen für jeden Wert vorzunehmen könnte einen großeren Aufwand darstellen, als die Werte selbst schnell zu validieren.

    Alleine bei einem Datum kann z.B. ein abgelaufenes oder in der Zukunft liegendes Datum (oder beides
    ) vom Coder erwartet werden.

    Ich glaube, dass ein allgemeingültiges Tool, dass Einstellungsmöglichkeiten bietet, viel anfälliger sein könnte als die Daten selbst zu validieren, da es halt soviele verschiedene Arten von erwarteten Werten gibt.
  4. Autor dieses Themas

    toolz

    Kostenloser Webspace von toolz

    toolz hat kostenlosen Webspace.

    Nein, es geht um die Überprüfung von Programmen, die man nicht selbst geschrieben hat.

    Ein Beispiel:
    Du lädst die 7zip herunter, installierst es und erhältst beim Start eine Fehlermeldung. Womöglich hatte die heruntergeladene Datei eine Prüfsumme beigelegt, oft jedoch nicht. Jetzt könntest du das fiktive Programm einsetzen und auf 7zip loslassen - Von einer Datenbank wird dann die Prüfsumme angefragt und eine eigene mit den Daten von 7zip angelegt, anschließend beide abgeglichen.
    Gibt das Programm dann aus, dass alles in Ordnung ist liegt das Poblem nicht an fehlerhaften Daten.

    Beitrag zuletzt geändert: 2.11.2012 15:51:09 von toolz
  5. hackyourlife

    Moderator Kostenloser Webspace von hackyourlife

    hackyourlife hat kostenlosen Webspace.

    Ich vermute mal, dass die meisten zu faul für sowas sein werden.

    Du müsstest eine riesige Datenbank pflegen, und ständig aktuell halten. Außerdem gibt es bei anständigen Programmen (z.B. bei allem auf Google Code, bei allen Files des GNU-Projekts, ...) immer eine Prüfsumme.

    Aber: da dieses Program keinen Aufwand darstellt (File einlesen, MD5 oder SHA-1 berechnen, DB abfragen, Ergebnis ausgeben) wäre es zumindest eine Programmierübung für dich, die dir bestimmt nicht schaden wird und die auch nicht lange dauern wird ;-)

    Beitrag zuletzt geändert: 2.11.2012 16:42:20 von hackyourlife
  6. Autor dieses Themas

    toolz

    Kostenloser Webspace von toolz

    toolz hat kostenlosen Webspace.

    Ja - ich befürchte, dass die Benutzung des Programmes maßgeblich von der Aktualität der Datenbank abhängt...
    Ich habe zwei Erweiterungsideen:

    1. Man könnte die Möglichkeit implementieren, Hashes von fehlerfreien Daten hochzuladen
    2. Durch einen geschickten Hashalgorithmus könnte man kleinere Fehler nach Wunsch korrigieren lassen, indem der schadhafte Sektor (der Algorithmus muss natürlich so konstruiert sein, dass sich ein Fehler lokalisieren lässt) so lange verändert wird, bis die Prüfsumme wieder stimmt.

    Was haltet ihr davon?

    Beitrag zuletzt geändert: 2.11.2012 16:57:59 von toolz
  7. hackyourlife

    Moderator Kostenloser Webspace von hackyourlife

    hackyourlife hat kostenlosen Webspace.

    toolz schrieb:
    2. Durch einen geschickten Hashalgorithmus könnte man kleinere Fehler nach Wunsch korrigieren lassen, indem der schadhafte Sektor (der Algorithmus muss natürlich so konstruiert sein, dass sich ein Fehler lokalisieren lässt) so lange verändert wird, bis die Prüfsumme wieder stimmt.

    Was haltet ihr davon?
    Wenn du diesen Algorithmus entwickelt hast kannst du ihn dir patentieren lassen und wirst bestimmt Millionär ;-)
  8. Autor dieses Themas

    toolz

    Kostenloser Webspace von toolz

    toolz hat kostenlosen Webspace.

    hackyourlife schrieb:
    Wenn du diesen Algorithmus entwickelt hast kannst du ihn dir patentieren lassen und wirst bestimmt Millionär ;-)
    Dier Herangehensweise, die ich anstrebe ist einfach: Für jeweils X Byte wird ein eigener Abschnitt im Hash angelegt. Stimmt nun ein Bereich des Hashes nicht mehr mit dem Original überein, ist klar, in welchem Sektor ein Fehler ist.
    Schwieriger wird es natürlich den Fehler zu beheben - Die Sektoren dürfen nicht zu klein sein, denn der Hash sollte bestenfalls selbst bei großen Programmen nicht länger als (schätzungsweise) 100 Zeichen sein, das ließe sich aber machen, indem man für jeden Sektor Untersektoren anlegt, die dann auf selbige Weise behandelt werden, wie das ganze Programm.

    Das ist aber nicht mehr trivial, klar. Ich frage ja auch nur, ob es das braucht, damit sich jemand mit dem Validierer abfindet :thumb:

    Beitrag zuletzt geändert: 2.11.2012 17:58:53 von toolz
  9. Also ich würde für ein Programm, dass mir jede Datei nur aus der Prüfsumme herstellt sogar zahlen. Dann müsste man nur die Prüfsumme runterladen, und nicht mehr Gigabyte große Isos. Oder so. ;)

    Hackyourlife hat also schon recht, dass du damit richtig Geld verdienen könnstest.
  10. Autor dieses Themas

    toolz

    Kostenloser Webspace von toolz

    toolz hat kostenlosen Webspace.

    Das geht jetzt an meiner eigentlichen Idee vorbei, aber ich befürchte, dass es sich bereits ab Halbierung der Datenmenge nicht mehr lohnen würde - Die Zeit, die man braucht, um die restlichen Daten herunterzuladen verschlingt der Probieralgorithmus sicherlich bereits. Von der Laufzeit her würde ich schätzen, der Download ist in Formel: O(n), während die von tchab vorgeschlagene Variante in Formel: O(n * e^n) liegen dürfte...

    Es geht in meinen Fällen aber nur um kleine (1-Bit) Fehler, wo sich soetwas lohnen könnte...

    Beitrag zuletzt geändert: 2.11.2012 18:10:35 von toolz
  11. Ich finde tchabs Idee auch super.

    Ich hätte auch eine Idee, wie du das lösen könntest. Versuch zu zeigen, dass P = NP gilt, dann hast du eine Lösung für tchabs Idee, die effizient läuft.
  12. Autor dieses Themas

    toolz

    Kostenloser Webspace von toolz

    toolz hat kostenlosen Webspace.

    mlrecords schrieb:
    Ich finde tchabs Idee auch super.

    Ich hätte auch eine Idee, wie du das lösen könntest. Versuch zu zeigen, dass P = NP gilt, dann hast du eine Lösung für tchabs Idee, die effizient läuft.
    Auch wenn wir hier im Spamforum sind, bitte ich das Niveau hoch zu halten...

    Anscheinend ist die Nachfrage nicht besonders hoch. Ich bitte dennoch um weitere Einschätzungen.

    Beitrag zuletzt geändert: 2.11.2012 20:00:27 von toolz
  13. Ich sehe da nur einen begrenzten Nutzen. Download-Protokolle wie Bittorrent setzen bereits komplett auf Hashes, um die Integrität der Daten stückweise und als ganzes sicherzustellen. Außerdem hast du auf TCP- und UDP-Ebene ebenfalls Prüfsummen für deine Packete.

    Falls also unbeabsichtigt einzelne Bits falsch übertragen werden, wird dies von der TCP- oder UDP-Implementierung bemerkt oder im Falle von Bittorrent auch vom Bittorrent-Client berücksichtigt.

    Liegt eine beabsichtigte Veränderung der Daten vor, wäre dein Dienst durchaus hilfreich. Allerdings muss man sich dann fragen: Wie kommen die Prüfsummen in deine Datenbank? Wie wird sichergestellt, dass diese nicht manipuliert sind?
  14. Im Falle von MD5 bspw. wäre die "Reperaturfunktion" sinnlos weil es mehr als genau eine Möglichkeit gibt den entsprechenden MD5 hash zu erzeugen. Vergl. dazu den Wikipedia Artikel zum MD5 Algorithmus.
  15. toolz schrieb:
    bitte ich das Niveau hoch zu halten...

    hmm, sind wir hier nicht schon von Anfang an knapp auf Bodenhöhe?


    Anscheinend ist die Nachfrage nicht besonders hoch. Ich bitte dennoch um weitere Einschätzungen.

    Ok, Du willst es nicht anders: Laß es!
  16. Autor dieses Themas

    toolz

    Kostenloser Webspace von toolz

    toolz hat kostenlosen Webspace.

    Ich glaube jetzt, dass nur wenige Nutzen aus einem solchen Programm ziehen könnten. Ich werde es demnach wohl nicht programmieren, danke für eure Einschätzungen!
  17. Sicher könnte man nutzen davon ziehen. So bräuchte man speziell bei Dateien und Software, von der man eine Illegale Kopie machen möchte, nur noch einen Bruchteil zu laden (Was speziell beim Torrentverfahren richtig gut für den Ladenden wäre, der er z.b. nur 0,5 Sekunden eines Films/Musikstücks laden müsste), dein Programm anwerfen würde, den Hash erzeugen und den Rest über deine Server saugen könnte. Damit hättest du nicht nur den Benutzern geholfen, sondern auch den Illegalen Kopieenmarkt revulutioniert.

    Ich würde dir total von der Funktion fehlerhafte Parts zu laden abraten.
  18. Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!

    lima-city: Gratis werbefreier Webspace für deine eigene Homepage

Dir gefällt dieses Thema?

Über lima-city

Login zum Webhosting ohne Werbung!