ANTICHAT.XYZ    VIDEO.ANTICHAT.XYZ    НОВЫЕ СООБЩЕНИЯ    ФОРУМ  
Баннер 1   Баннер 2

ANTICHAT — форум по информационной безопасности, OSINT и технологиям

ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию. Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club, и теперь снова доступен на новом адресе — forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.
Вернуться   Форум АНТИЧАТ > Программирование_OLD > PHP, PERL, MySQL, JavaScript
   
 
 
Опции темы Поиск в этой теме Опции просмотра

  #11  
Старый 06.04.2009, 19:35
Exgibichi
Новичок
Регистрация: 07.07.2008
Сообщений: 6
Провел на форуме:
315057

Репутация: 10
По умолчанию

Парсит ссылки с гугла по кейворду

PHP код:
<?php
/*
|
|  www.google.ru parser
|  C0d3d by Exgibichi
|  27/07/08
|
*/

set_time_limit(0); 

$n 20// number of pages
$keyword 'keyword'//keyword for parse

function googlelinkparse($keyword,$n) {

  
$keyword str_replace(' ','+',$keyword);
  
$url 'http://www.google.ru/search?q='.$keyword.'&num=100&filter=0&start='.$n.'0';
  
$file file_get_contents($url) or die('Could not access file');
  
$exp "<a\s[^>]*href=(\"??)([^\" >]*?)\\1[^>]*>(.*)<\/a>";
    
  if (
preg_match_all("/$exp/siU"$file$matchesPREG_SET_ORDER)) {
    
    
$c count($matches);
    for (
$i=0$i<$c$i++) {
    
      if (
strstr($matches[$i][2],'http://') && !strstr($matches[$i][2],'google') && !strstr($matches[$i][2],'search?q=cache') && !strstr($matches[$i][2],'youtube') && !strstr($matches[$i][2],'/aclk?sa')) {
      
$links[] = $matches[$i][2];
      }
    }
  } return 
$links;
}

for (
$i=0$i<$n$i++) {

  
$link googlelinkparse($keyword,$i);
  
$c count($link);
  
  for (
$j=0$j<$c$j++) {
    
$f fopen('links.txt','a+'); fputs($f,$link[$j]."\r\n"); fclose($f);
  }
  
sleep(10);
}
?>
 
 





Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT.XYZ