Страница 1 из 1

Парсинг google

Добавлено: 18 сен 2013, 20:54
Crystallon
Доброго времени суток!
Пытаюсь парсить гугл, точнее с парсингом проблем нет, если бы не капча.
С капчей ситуация следующая:
Вместо выдачи перенаправляет на:
http://www.google.com/sorry/
беру от туда id капчи и загружаю картинку от сюда:
http://www.google.com/sorry/image?id={$id}&hl=en
Картинка успешно распознается антигейтом и я получаю код.
А вот с этого момента начинаются проблемы - гугл принимать капчу упорно отказывается и после отправки ему капчи сим образом:
http://www.google.com/sorry/Captcha?id= ... oogle.com/
он снова выдает страницу ввода капчи.

Уже 20 раз перепроверил где какие куки в браузере берутся, как какая ссылка выглядит итп, но упорно не работает...
Подскажите пожалуйста в чем могут быть грабли, наверняка многие имели дело с парсингом гугла.
Заранее спасибо!

P.S. Код не прикладываю т.к. дело тут не в коде, а в том что мне нужно понять как гугл определяет что я пытаюсь его парсить.

Re: Парсинг google

Добавлено: 19 сен 2013, 16:05
somewhere
Возможно на события что-то подвешено... на нажатие клавиш или получение фокуса окном ввода капчи. По этому событию гугл может принять некий флаг, который и позволяет думать, что ты - человек.

Re: Парсинг google

Добавлено: 19 сен 2013, 16:45
Crystallon
Думаю это исключено т.к. в браузере с отключенным JS все работает.

Re: Парсинг google

Добавлено: 19 сен 2013, 17:30
Duncon
Может стоит шапку послать мол программа является мозиллой фаерфокс или ещё каким популярным браузером?