Страница 1 из 2

Двойной парсинг

Добавлено: 25 дек 2013, 13:58
viboxjuwin
Можно ли вытянуть вот с этой страницы сайта (ссылка ниже) и вопросы и ответы к ним на свой сайт?
Ссылка: [Ссылка удалена]

Re: Двойной парсинг

Добавлено: 25 дек 2013, 14:08
Duncon
Можно .

Re: Двойной парсинг

Добавлено: 25 дек 2013, 15:11
viboxjuwin
Спарсить вопросы я могу. Но как спарсить ответы?

Re: Двойной парсинг

Добавлено: 25 дек 2013, 15:21
Duncon
В тексте есть же ссылка - Ответов 1, берёшь её и парсишь ответы..

Re: Двойной парсинг

Добавлено: 25 дек 2013, 15:26
viboxjuwin
Но как это реализовать? В спарсенном тексте нажатие на ссылку переносит на сайт донора. Но не парсит данные из ссылки на наш сайт..

Re: Двойной парсинг

Добавлено: 25 дек 2013, 15:53
Duncon
Вопрос выглядит как - я могу создать один полигон, что мне делать если мне нужно создать 2 полигона?
Вы пишите что можете распарсить страницу с вопросами, но при этом не можете взять ссылку и то же самое проделать по ней (я смотрел все страницы с ответами однотипные). Приводите примеры чего вы делаете, глядишь кто поможет..

Re: Двойной парсинг

Добавлено: 25 дек 2013, 16:01
viboxjuwin
Я парсю страницу с вопросами и с ссылками на ответы к этим вопросам так:

<?php

//откуда будем парсить информацию
$content = iconv("windows-1251", "UTF-8", file_get_contents('http://www.9111.ru/answers/daily/2013_12_24/'));

// Определяем позицию строки, до которой нужно все отрезать
$pos = strpos($content, '<td class="td_q1 my-questions__cells my-questions__cells-left">');

//Отрезаем все, что идет до нужной нам позиции
$content = substr($content, $pos);

// Точно таким же образом находим позицию конечной строки
$pos = strpos($content, '<form action="http://www.9111.ru/questions/add/?utm_s ... rm#f_q_add" method="post">');

// Отрезаем нужное количество символов от нулевого
$content = substr($content, 0, $pos);

//если в тексте встречается текст, который нам не нужен, вырезаем его
$content = str_replace('','', $content);

// выводим спарсенный текст.
echo ($content);

//echo "вставляем сюда завершающий код";
?>

Re: Двойной парсинг

Добавлено: 25 дек 2013, 16:22
viboxjuwin
Сейчас мой парсинг-код выглядит так:

<?php

//откуда будем парсить информацию
$content = iconv("windows-1251", "UTF-8", file_get_contents('http://www.9111.ru/answers/daily/2013_12_24/'));

// Определяем позицию строки, до которой нужно все отрезать
$pos = strpos($content, '<td class="td_q1 my-questions__cells my-questions__cells-left">');

//Отрезаем все, что идет до нужной нам позиции
$content = substr($content, $pos);

// Точно таким же образом находим позицию конечной строки
$pos = strpos($content, '<form action="http://www.9111.ru/questions/add/?utm_s ... rm#f_q_add" method="post">');

// Отрезаем нужное количество символов от нулевого
$content = substr($content, 0, $pos);

//если в тексте встречается текст, который нам не нужен, вырезаем его
$content = str_replace('','', $content);

// выводим спарсенный текст.
echo ($content);

//echo "вставляем сюда завершающий код";
?>

Re: Двойной парсинг

Добавлено: 25 дек 2013, 16:23
viboxjuwin
Сейчас мой код для парсинга выглядит так:

Код: Выделить всё

<?php

//откуда будем парсить информацию
$content = iconv("windows-1251", "UTF-8", file_get_contents('http://www.9111.ru/answers/daily/2013_12_24/'));

// Определяем позицию строки, до которой нужно все отрезать
$pos = strpos($content, '<td class="td_q1 my-questions__cells my-questions__cells-left">');

//Отрезаем все, что идет до нужной нам позиции
$content = substr($content, $pos);

// Точно таким же образом находим позицию конечной строки
$pos = strpos($content, '<form action="http://www.9111.ru/questions/add/?utm_source=ask-form&utm_medium=form#f_q_add" method="post">');

// Отрезаем нужное количество символов от нулевого
$content = substr($content, 0, $pos);

//если в тексте встречается текст, который нам не нужен, вырезаем его
$content = str_replace('','', $content);

// выводим спарсенный текст.
echo ($content);

//echo "вставляем сюда завершающий код";
?>

Re: Двойной парсинг

Добавлено: 25 дек 2013, 16:44
viboxjuwin
Модераторы сайта не позволяют пройти моему сообщению с кодом на php.