Wikipedia API: opensearch ... limit ?
lima-city → Forum → Programmiersprachen → PHP, MySQL & .htaccess
agent
auslese
bier
bot
code
ergebnis
format
gecko
hilfe
http
limit
maximum
parameter
passende worte
sagen
suchwort
url
verschiedene ergebnisse
wort
zusammenhang
-
Hallo
wie kann ich für Wikipedia API opensearch das limit (Anzahl Ergebnisse) erhöhen ?
ich bekomme immer nur max. 15 Ergebnisse ??
BSP: http://de.wikipedia.org/w/api.php?action=opensearch&search=bier&limit=100&format=jsonfm
in der HELP (mini-Doku) zu action=opensearch steht was von maximal 100 (für bots)
Parameters:
...
limit - Maximum amount of results to return
No more than 100 (100 for bots) allowed
Default: 10
...
aber wie sage ich der Wikipedia API, das mein PHP-Script als "bot" daher kommt ?
Die Daten lese ich so ein:
<?php // ------------------------------------------------------------------------ $url = 'http://de.wikipedia.org/w/api.php?action=opensearch&search=bier&limit=100&format=xml'; $ch = curl_init ($url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_BINARYTRANSFER,1); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 2); curl_setopt($ch, CURLOPT_TIMEOUT, 15); ## curl_setopt ($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:16.0) Gecko/20100101 Firefox/16.0"); // --- User-Agent als Bot aus Beispiel von: https://www.mediawiki.org/wiki/API curl_setopt($ch, CURLOPT_USERAGENT, 'User-Agent: MyCoolTool/1.1 (http://example.com/MyCoolTool/; MyCoolTool@example.com)'); $rawdata = curl_exec($ch); curl_close ($ch); // ------------------------------------------------------------------------ $xmlobject = simplexml_load_string($rawdata); // ------------------------------------------------------------------------ #### DEBUG AUSGABE #### print "<pre>\n"; print_r($xmlobject); print "</pre>\n"; // ------------------------------------------------------------------------ ?>
das funktioniert auch .... aber immer nur mit max. 15 Ergebnisse
... wie muss HEADER und USERAGENT (und ...?... ) aussehen,
damit ich auch an die 100 möglichen Ergebnisse dran komme ?
-
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!
lima-city: Gratis werbefreier Webspace für deine eigene Homepage
-
och nee, da muss man sich ja anmelden und auch noch um Freigabe betteln ...
Wikipedia opensearch hat sowieso komische Ergebnise ....
es kommt z.B. mit dem Suchwort: 'bier' das Ergebnis: "Couleur" ??? :(
BSP: opensearch "bier" XML
<Item> <Image source="http://upload.wikimedia.org/wikipedia/commons/thumb/d/d1/M%C3%BChlberg_-_Zum_ersten_Mal_in_Wichs.jpg/32px-M%C3%BChlberg_-_Zum_ersten_Mal_in_Wichs.jpg" width="32" height="50"/> <Text xml:space="preserve">Couleur</Text> <Description xml:space="preserve">Couleur (franz. „Farbe“) ist die Bezeichnung für die Gesamtheit aller Kleidungs- und Schmuckstücke sowie aller Accessoires und Gebrauchsgegenstände, auf denen oder mit denen die Mitglieder farbentragender bzw. </Description> <Url xml:space="preserve">http://de.wikipedia.org/wiki/Couleur#Zipfel_und_Zipfelbund</Url> </Item>
im Gesamten Wikipedia-Artikel "Couleur" existiert nicht einmal das Wort "bier" ... :(
.. ein Zusammenhang Suchanfrage <---> Ergebnis ist nicht zu erkennen
bei JSON ist das Ergbnis nicht dabei ??? opensearch "bier" JSON (fm)
.. verschiedene Ergebnisse durch anderes Format (xml / json) ?? ...
möep !!! ... unbrauchbar ?
PS:
ich will eigenlich zum Such-Begriff möglichst viele passende Worte (Synonyme, etc) finden,
aber ... "Couleur" zur Suche: "Bier" ist ja vollkommener blödsinn ...
schön wäre (for "bier") Ergebnisse wie: Bierfaß, Bierflasche, Weizenbier, ...
und ebenso Worte, die zum Thema "passen" aber nicht das Teil-Wort "bier" enthalten.
wie z.B.: Brauerei, Pils, Hopfen, etc ...
kann mir jemand noch andere Bezugsquellen für sowas sagen (die man per PHP auslesen kann) ?
... außer: openthesaurus, das kenne ich schon.
Danke!
Beitrag zuletzt geändert: 30.10.2012 13:34:51 von juwely -
Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!
lima-city: Gratis werbefreier Webspace für deine eigene Homepage