ANTICHAT — форум по информационной безопасности, OSINT и технологиям
ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию.
Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club,
и теперь снова доступен на новом адресе —
forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.

01.07.2007, 02:02
|
|
Новичок
Регистрация: 01.06.2007
Сообщений: 16
Провел на форуме: 45987
Репутация:
0
|
|
Приф всем, вот такой вопрос...
Реально ли сделать грабер контента с html паги, ну пример странички HTML:
Код HTML:
<html>
<head>
<meta http-equiv="Content-Language" content="ru">
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
<title>Новость</title>
</head>
<body>
<table cellpadding="0" cellspacing="0" width="644">
<tr>
<td height="55" width="644" colspan="3" valign="top"><b><font size="7">
Супер сайт</font></b></td>
</tr>
<tr>
<td height="253" width="90" valign="top">Навигация<p>1</p>
<p>2</p>
<p>3</p>
<p>4</p>
<p>5</td>
<td height="253" width="424" valign="top">
<p align="left"><b>Новости:</b></p>
<p>Итак, по последним данным нам стало....</td>
<td height="253" width="130" valign="top">ССЫЛКИ<p> </p>
<p>1</p>
<p>2</p>
<p>3</p>
<p>4</p>
<p> </td>
</tr>
<tr>
<td height="59" width="644" colspan="3" valign="top">
<p align="center">копирайт</td>
</tr>
</table>
</body>
</html>
Вот полный код страницы, можно ли на другом сайте каким-либо образом сграбить все что относится к этому куску кода:
...
<p align="left"><b>Новости:</b></p>
<p>Итак, по последним данным нам стало....
...
Можно или нет?
Если да, то подскажите каким образом.
Последний раз редактировалось nc.STRIEM; 01.07.2007 в 13:05..
|
|
|

01.07.2007, 02:16
|
|
Участник форума
Регистрация: 28.05.2007
Сообщений: 125
Провел на форуме: 638513
Репутация:
103
|
|
Regular Expressions используй и будет тебе счастье
-------------------------------------------------
PHP код:
$pattern = '/(<p align="left"><b>Новости:<\/b><\/p><p>)(.*)(<\/td>)/'
preg_match($pattern,$str,$cout)
-------------------------------------------------------------------------
в $cout[2] будет лежать "Итак, по последним данным нам стало...."
З.Ы.:РегЭксп примитивный,думаю профи подправят, но идею изложил
|
|
|

01.07.2007, 02:36
|
|
Флудер
Регистрация: 20.11.2006
Сообщений: 3,316
Провел на форуме: 16641028
Репутация:
2371
|
|
FreeNeDiX, используй теги [.php], [.html]
PHP код:
$pattern = '#<p align="left"><b>Новости:</b></p><p>(.*)</td>#is'
preg_match($pattern,$str,$cout)
Последний раз редактировалось Isis; 01.07.2007 в 02:38..
|
|
|

01.07.2007, 11:35
|
|
Участник форума
Регистрация: 26.12.2006
Сообщений: 107
Провел на форуме: 228267
Репутация:
27
|
|
В общем, нужен скрипт, который бы архивировал папки на сервере в .zip или .gzip, нашел такой скрипт
http://slil.ru/24577297
, но он работает почему то только на локалке, а на сервере не хочет  наверно из-за того что там safe mode: on. Может у кого-нибудь есть рабочий, что б в safe mode работал?
|
|
|

01.07.2007, 11:41
|
|
Новичок
Регистрация: 02.06.2007
Сообщений: 24
Провел на форуме: 119202
Репутация:
19
|
|
Сообщение от FreeNeDiX
можно ли на другом сайте каким-либо образом сграбить все что относится к этому куску кода:
PHP код:
$sh = file_get_contents("http://www.site.ru/news.html", False);
$sh = chop($sh);
Только "allow_url_open" должно быть "on".
|
|
|

01.07.2007, 11:56
|
|
Флудер
Регистрация: 20.11.2006
Сообщений: 3,316
Провел на форуме: 16641028
Репутация:
2371
|
|
spamoney, уже не раз говорили, что скачивать никто ничего не будет..
Выкладывай скрипт сюда!
|
|
|

01.07.2007, 13:17
|
|
Участник форума
Регистрация: 26.12.2006
Сообщений: 107
Провел на форуме: 228267
Репутация:
27
|
|
Сообщение от Isis
spamoney, уже не раз говорили, что скачивать никто ничего не будет..
Выкладывай скрипт сюда!
Там более 200 кб php кода, выложить не получается, форум выдает ошибку:
При размещении сообщения были допущены следующие ошибки::
1.Пожалуйста, заполните поля темы и текста сообщения. Вернитесь назад, заполните поля и попробуйте снова.
2.Набранное вами сообщение слишком короткое. Увеличьте ваше сообщение до 2 символов.
Может тогда кто-нибудь сможет написать скрипт для архивирования папок на сервере при включенном safe mode?
|
|
|

01.07.2007, 14:21
|
|
Флудер
Регистрация: 20.11.2006
Сообщений: 3,316
Провел на форуме: 16641028
Репутация:
2371
|
|
Сообщение от spamoney
Там более 200 кб php кода, выложить не получается, форум выдает ошибку:
Может тогда кто-нибудь сможет написать скрипт для архивирования папок на сервере при включенном safe mode?
А ты попробуй поставить 2 символа после закрытия тега [./php]
Ведь по-русски напсиано
|
|
|

01.07.2007, 16:09
|
|
Новичок
Регистрация: 01.06.2007
Сообщений: 16
Провел на форуме: 45987
Репутация:
0
|
|
Спасиб парни, буду тестить.
|
|
|

01.07.2007, 19:05
|
|
Новичок
Регистрация: 01.06.2007
Сообщений: 16
Провел на форуме: 45987
Репутация:
0
|
|
Хмм, регулярные выражения значит, в принципе все должно работать, скажите что не так?
<?php
$url = "http://site.nu/news.html";
$content = file_get_contents($url);
$pattern = '#<p align="left"><b>Новости:</b></p><p>(.*)</td>#is';
preg_match($pattern,$content,$out);
print($out);
?>
В итоге вместо нужной новости я вижу надпись Array.
Что не так?
|
|
|
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|