HOME    FORUMS    MEMBERS    RECENT POSTS    LOG IN  
Баннер 1   Баннер 2

ANTICHAT — форум по информационной безопасности, OSINT и технологиям

ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию. Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club, и теперь снова доступен на новом адресе — forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.
Вернуться   Форум АНТИЧАТ > ПРОГРАММИРОВАНИЕ > PHP
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

  #971  
Старый 03.03.2009, 14:29
DDoSька
Постоянный
Регистрация: 05.05.2008
Сообщений: 403
Провел на форуме:
2375039

Репутация: 1160
Отправить сообщение для DDoSька с помощью ICQ
По умолчанию

Ребята, приведите пожалуйста пример простого парсера,который выдирает все из <title>(.*)</title>.
ЗЫ: С пыхой дружу, но решил переходить на многопоточность
Заранее благодарен
 
Ответить с цитированием

  #972  
Старый 03.03.2009, 17:02
demond
Участник форума
Регистрация: 05.11.2008
Сообщений: 105
Провел на форуме:
292722

Репутация: 71
По умолчанию

Цитата:
Сообщение от DDoSька  
Ребята, приведите пожалуйста пример простого парсера,который выдирает все из <title>(.*)</title>.
ЗЫ: С пыхой дружу, но решил переходить на многопоточность
Заранее благодарен
Код:
#!/usr/bin/perl -w
use locale;
$text = "<html>asda dddddasd<title>9asdfasd asdf asd asdf asdff asdfff 111</title>sadf</html>";
$text=~m/<title>(.*)<\/title>/ig;
print $1;
В переменной $1 будет все что тебя интересует.
Чтобы не было проблем с русским языком имеет смысл включить locale

Последний раз редактировалось demond; 03.03.2009 в 17:04..
 
Ответить с цитированием

  #973  
Старый 03.03.2009, 17:17
DDoSька
Постоянный
Регистрация: 05.05.2008
Сообщений: 403
Провел на форуме:
2375039

Репутация: 1160
Отправить сообщение для DDoSька с помощью ICQ
По умолчанию

Я знаю как это на php сделать:
PHP код:
$text=file_get_contents('http://google.com');
preg_match('#<title>(.*)</title>#',$text,$out);
echo 
$out[1]; 
Вот мне нужно тоже самое,только на PERL
То есть обязательно грабить с сайта
Я в перле не бум-бум ,извините.
Спасибо заранее
 
Ответить с цитированием

  #974  
Старый 03.03.2009, 17:25
budden
Участник форума
Регистрация: 26.07.2008
Сообщений: 267
Провел на форуме:
1343031

Репутация: 184
По умолчанию

demond
Не знаешь, как реализовать парсер для вот этого случая: http://forum.antichat.ru/showpost.php?p=1145622&postcount=963
Единственный момент - там очень большая страница, для памяти лучше со строками работать..
 
Ответить с цитированием

  #975  
Старый 03.03.2009, 18:55
demond
Участник форума
Регистрация: 05.11.2008
Сообщений: 105
Провел на форуме:
292722

Репутация: 71
По умолчанию

budden, прикрепи к своему сообщению готовый файл для парсинга, чтобы мне его самому не писать. Или лучше в личку. Тебе рабочий код нужен или идея? :-)
 
Ответить с цитированием

  #976  
Старый 03.03.2009, 20:32
demond
Участник форума
Регистрация: 05.11.2008
Сообщений: 105
Провел на форуме:
292722

Репутация: 71
По умолчанию

Цитата:
Сообщение от DDoSька  
Я знаю как это на php сделать:
PHP код:
$text=file_get_contents('http://google.com');
preg_match('#<title>(.*)</title>#',$text,$out);
echo 
$out[1]; 
Вот мне нужно тоже самое,только на PERL
То есть обязательно грабить с сайта
Я в перле не бум-бум ,извините.
Спасибо заранее
Код:
#!/usr/bin/perl
use LWP::Simple;
$content = get("http://www.mail.ru/");
die "Couldn't get it!" unless defined $content;
$content =~ m/<title>(.*?)<\/title>/img;
print $1;
Пользуйся на здоровье! :-)

Последний раз редактировалось demond; 03.03.2009 в 20:37..
 
Ответить с цитированием

  #977  
Старый 03.03.2009, 21:28
budden
Участник форума
Регистрация: 26.07.2008
Сообщений: 267
Провел на форуме:
1343031

Репутация: 184
По умолчанию

Цитата:
Сообщение от demond  
budden, прикрепи к своему сообщению готовый файл для парсинга, чтобы мне его самому не писать. Или лучше в личку. Тебе рабочий код нужен или идея? :-)
в РМ отправил, заранее спасибо.
 
Ответить с цитированием

  #978  
Старый 06.03.2009, 17:50
GAVVVR
Познающий
Регистрация: 08.04.2008
Сообщений: 60
Провел на форуме:
111221

Репутация: 2
Отправить сообщение для GAVVVR с помощью ICQ
Talking

Цитата:
Сообщение от GAVVVR  
Написал вроде скрипт как скрипт, а выдает при запуске:

При этом пропускает какие либо действия связанные с LWP.
Разобрался. . У меня было примерно так:
Цитата:
#! /usr/bin/perl -w
use LWP::UserAgent;
use HTTP::Cookies;
$ua = LWP::UserAgent->new(
agent => 'Opera/9.27 (Windows NT 5.1; U; ru)',
);
$ua->cookie_jar
( HTTP::Cookies->new(
'file' => 'C:/test/cookies.lwp',
'autosave' => 1,
)
);
$res = $ua->get ("localhost")->as_string;
#И так дале...
Почему то жестко ступил и во всем скрипте вместо http://localhost/ написал localhost
 
Ответить с цитированием

  #979  
Старый 10.03.2009, 01:33
S0ulVortex
Участник форума
Регистрация: 18.11.2007
Сообщений: 184
Провел на форуме:
1686744

Репутация: 246
Отправить сообщение для S0ulVortex с помощью ICQ
По умолчанию

Вобщем нужна помощь с учебником по perl скачал учебник называется "perel за 24 часа"
Ну почему я выбрал именно этот и так понятно, но как оказалось не все так просто прочитал пол учебника а толку реально 0 сам мало чего могу написать максимум это представление что такое perl. Посоветуйте учебник для новичка чтобы понятно было а не как там.
 
Ответить с цитированием

  #980  
Старый 10.03.2009, 11:42
demond
Участник форума
Регистрация: 05.11.2008
Сообщений: 105
Провел на форуме:
292722

Репутация: 71
По умолчанию

начинал с документации на citforum. А вообще много книжек у O'reilly, в том числе и для начинающих!
 
Ответить с цитированием
Ответ



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
[c/c++] Новичкам: задаем вопросы _Great_ С/С++, C#, Rust, Swift, Go, Java, Perl, Ruby 5421 21.04.2026 07:37
[php] Новичкам: задаем вопросы _Great_ PHP 16396 17.06.2010 21:19
Вопросы по Ipb 2.0 Voodoo_People Уязвимости CMS / форумов 26 15.02.2005 22:57



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT.XYZ