| |||||||
| Stammtisch Hier wird über alles gesprochen ausser Online-Marketing. |
![]() |
| | Themen-Optionen | Thema durchsuchen | Ansicht |
|
#1
| |||
| |||
| Halli hallo, Hab heute mal kurz ein bisschen mit Google "herumexperimentiert". Hab mir dazu ein Script zusammengefrickelt das zu einem beliebigen Suchresultat die Ergebnisse holt, cacht und anschließend auf TLDs bereinigt. Ich poste es mal hier rein, vielleicht kann irgendwer von Euch damit ja auch irgendwas anfangen . Ein passendes Formular anhand dem man einen Query übergeben kann dürfte für niemanden eine Schwierigkeit darstellen. Natürlich könnte man auch per Google Key die Ergbnisse holen, aber ich wollte es mal so probieren.Hier ist nun mal was ich schnell zusammengeschreibselt hab: <?php //Die URL von Google holen $data = file_get_contents('http://www.google.at/search?hl=de&q=online+marketing&meta='); //Daten Cachen $verbindung = fopen('datei.txt', 'w+'); rewind($verbindung); fwrite($verbindung, $data); fclose($verbindung); $verbindung = fopen('datei.txt', 'r+'); $data1 = fread($verbindung,filesize('datei.txt')); fclose($verbindung); //URLs finden preg_match_all("|<br><span class=a>www.(.*)</a></[^>]+>|U", $data1, $ausgabe, PREG_PATTERN_ORDER); //gefundene URLs bereinigen $zahl=10; for($count = 0; $count < $zahl; $count++) { $text = ereg_replace("<b>","",$ausgabe[0][$count]); $text = ereg_replace("</b>","",$text); $text = ereg_replace("<br><span class=a>","",$text); $pos = strpos ($text, "/"); $rest = substr($text, 0, $pos); //und ausgeben echo $rest."<br>"; }; ?> lg onkelseo |
|
#2
| |||
| |||
| Hab grade gesehen das das Script doppelte Ergebnisse von der gleichen Seite noch drinnen lässt - hier die "verbesserte" Fassung. <?php //Die URL von Google holen $data = file_get_contents('http://www.google.at/search?hl=de&q=online+marketing&meta='); //Daten Cachen $verbindung = fopen('datei.txt', 'w+'); rewind($verbindung); fwrite($verbindung, $data); fclose($verbindung); $verbindung = fopen('datei.txt', 'r+'); $data1 = fread($verbindung,filesize('datei.txt')); fclose($verbindung); //URLs finden preg_match_all("|<br><span class=a>www.(.*)</a></[^>]+>|U", $data1, $ausgabe, PREG_PATTERN_ORDER); //gefundene URLs bereinigen $zahl=10; for($count = 0; $count < $zahl; $count++) { $rest1=$rest; $text = ereg_replace("<b>","",$ausgabe[0][$count]); $text = ereg_replace("</b>","",$text); $text = ereg_replace("<br><span class=a>","",$text); $pos = strpos ($text, "/"); $rest = substr($text, 0, $pos); //und ausgeben if($rest==$rest1) { echo "<b>Seite ist in den TOP ".$zahl." doppelt vorhanden</b><br>"; } else { echo $rest."<br>"; } }; ?> |
![]() |
| Themen-Optionen | Thema durchsuchen |
| Ansicht | |
|
|
Ähnliche Themen | ||||
| Thema | Erstellt von | Forum | Antworten | Letzter Beitrag |
| Worin unterscheidet sich Yahoo von Google? | Torsten1979 | Yahoo | 18 | 06-05-2008 23:55 |
| Weitere Suchmaschine von Google in Arbeit | Eisy | Google News | 3 | 16-01-2007 18:21 |
| Eine neue Masche von Google | exicose | 10 | 28-09-2006 23:49 | |
| Google wechselt von Intel zu AMD | SISTRIX | Google News | 3 | 02-03-2006 23:00 |