ANTICHAT — форум по информационной безопасности, OSINT и технологиям
ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию.
Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club,
и теперь снова доступен на новом адресе —
forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.
 |
|

03.03.2009, 14:29
|
|
Постоянный
Регистрация: 05.05.2008
Сообщений: 403
Провел на форуме: 2375039
Репутация:
1160
|
|
Ребята, приведите пожалуйста пример простого парсера,который выдирает все из <title>(.*)</title>.
ЗЫ: С пыхой дружу, но решил переходить на многопоточность
Заранее благодарен
|
|
|

03.03.2009, 17:02
|
|
Участник форума
Регистрация: 05.11.2008
Сообщений: 105
Провел на форуме: 292722
Репутация:
71
|
|
Сообщение от DDoSька
Ребята, приведите пожалуйста пример простого парсера,который выдирает все из <title>(.*)</title>.
ЗЫ: С пыхой дружу, но решил переходить на многопоточность
Заранее благодарен
Код:
#!/usr/bin/perl -w
use locale;
$text = "<html>asda dddddasd<title>9asdfasd asdf asd asdf asdff asdfff 111</title>sadf</html>";
$text=~m/<title>(.*)<\/title>/ig;
print $1;
В переменной $1 будет все что тебя интересует.
Чтобы не было проблем с русским языком имеет смысл включить locale
Последний раз редактировалось demond; 03.03.2009 в 17:04..
|
|
|

03.03.2009, 17:17
|
|
Постоянный
Регистрация: 05.05.2008
Сообщений: 403
Провел на форуме: 2375039
Репутация:
1160
|
|
Я знаю как это на php сделать:
PHP код:
$text=file_get_contents('http://google.com');
preg_match('#<title>(.*)</title>#',$text,$out);
echo $out[1];
Вот мне нужно тоже самое,только на PERL
То есть обязательно грабить с сайта
Я в перле не бум-бум ,извините.
Спасибо заранее
|
|
|

03.03.2009, 17:25
|
|
Участник форума
Регистрация: 26.07.2008
Сообщений: 267
Провел на форуме: 1343031
Репутация:
184
|
|
demond
Не знаешь, как реализовать парсер для вот этого случая: http://forum.antichat.ru/showpost.php?p=1145622&postcount=963
Единственный момент - там очень большая страница, для памяти лучше со строками работать..
|
|
|

03.03.2009, 18:55
|
|
Участник форума
Регистрация: 05.11.2008
Сообщений: 105
Провел на форуме: 292722
Репутация:
71
|
|
budden, прикрепи к своему сообщению готовый файл для парсинга, чтобы мне его самому не писать. Или лучше в личку. Тебе рабочий код нужен или идея? :-)
|
|
|

03.03.2009, 20:32
|
|
Участник форума
Регистрация: 05.11.2008
Сообщений: 105
Провел на форуме: 292722
Репутация:
71
|
|
Сообщение от DDoSька
Я знаю как это на php сделать:
PHP код:
$text=file_get_contents('http://google.com');
preg_match('#<title>(.*)</title>#',$text,$out);
echo $out[1];
Вот мне нужно тоже самое,только на PERL
То есть обязательно грабить с сайта
Я в перле не бум-бум ,извините.
Спасибо заранее
Код:
#!/usr/bin/perl
use LWP::Simple;
$content = get("http://www.mail.ru/");
die "Couldn't get it!" unless defined $content;
$content =~ m/<title>(.*?)<\/title>/img;
print $1;
Пользуйся на здоровье! :-)
Последний раз редактировалось demond; 03.03.2009 в 20:37..
|
|
|

03.03.2009, 21:28
|
|
Участник форума
Регистрация: 26.07.2008
Сообщений: 267
Провел на форуме: 1343031
Репутация:
184
|
|
Сообщение от demond
budden, прикрепи к своему сообщению готовый файл для парсинга, чтобы мне его самому не писать. Или лучше в личку. Тебе рабочий код нужен или идея? :-)
в РМ отправил, заранее спасибо.
|
|
|

06.03.2009, 17:50
|
|
Познающий
Регистрация: 08.04.2008
Сообщений: 60
Провел на форуме: 111221
Репутация:
2
|
|
Сообщение от GAVVVR
Написал вроде скрипт как скрипт, а выдает при запуске:
При этом пропускает какие либо действия связанные с LWP.
Разобрался.  . У меня было примерно так:
#! /usr/bin/perl -w
use LWP::UserAgent;
use HTTP::Cookies;
$ua = LWP::UserAgent->new(
agent => 'Opera/9.27 (Windows NT 5.1; U; ru)',
);
$ua->cookie_jar
( HTTP::Cookies->new(
'file' => 'C:/test/cookies.lwp',
'autosave' => 1,
)
);
$res = $ua->get ("localhost")->as_string;
#И так дале...
Почему то жестко ступил и во всем скрипте вместо http://localhost/ написал localhost 
|
|
|

10.03.2009, 01:33
|
|
Участник форума
Регистрация: 18.11.2007
Сообщений: 184
Провел на форуме: 1686744
Репутация:
246
|
|
Вобщем нужна помощь с учебником по perl скачал учебник называется "perel за 24 часа"
Ну почему я выбрал именно этот и так понятно, но как оказалось не все так просто прочитал пол учебника а толку реально 0 сам мало чего могу написать максимум это представление что такое perl. Посоветуйте учебник для новичка чтобы понятно было а не как там.
|
|
|

10.03.2009, 11:42
|
|
Участник форума
Регистрация: 05.11.2008
Сообщений: 105
Провел на форуме: 292722
Репутация:
71
|
|
начинал с документации на citforum. А вообще много книжек у O'reilly, в том числе и для начинающих!
|
|
|
|
 |
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|