Парсинг google

Вопросы по программированию, не подходящие в другие разделы.

Модераторы: Naeel Maqsudov, C_O_D_E

Ответить
Crystallon
Сообщения: 2
Зарегистрирован: 18 сен 2013, 20:53

Доброго времени суток!
Пытаюсь парсить гугл, точнее с парсингом проблем нет, если бы не капча.
С капчей ситуация следующая:
Вместо выдачи перенаправляет на:
http://www.google.com/sorry/
беру от туда id капчи и загружаю картинку от сюда:
http://www.google.com/sorry/image?id={$id}&hl=en
Картинка успешно распознается антигейтом и я получаю код.
А вот с этого момента начинаются проблемы - гугл принимать капчу упорно отказывается и после отправки ему капчи сим образом:
http://www.google.com/sorry/Captcha?id= ... oogle.com/
он снова выдает страницу ввода капчи.

Уже 20 раз перепроверил где какие куки в браузере берутся, как какая ссылка выглядит итп, но упорно не работает...
Подскажите пожалуйста в чем могут быть грабли, наверняка многие имели дело с парсингом гугла.
Заранее спасибо!

P.S. Код не прикладываю т.к. дело тут не в коде, а в том что мне нужно понять как гугл определяет что я пытаюсь его парсить.
Аватара пользователя
somewhere
Сообщения: 1858
Зарегистрирован: 31 авг 2006, 17:14
Откуда: 71 RUS
Контактная информация:

Возможно на события что-то подвешено... на нажатие клавиш или получение фокуса окном ввода капчи. По этому событию гугл может принять некий флаг, который и позволяет думать, что ты - человек.
It's a long way to the top if you wanna rock'n'roll
Crystallon
Сообщения: 2
Зарегистрирован: 18 сен 2013, 20:53

Думаю это исключено т.к. в браузере с отключенным JS все работает.
Аватара пользователя
Duncon
Сообщения: 2085
Зарегистрирован: 10 окт 2004, 14:11
Откуда: Питер
Контактная информация:

Может стоит шапку послать мол программа является мозиллой фаерфокс или ещё каким популярным браузером?
[syntax=Delphi] [/syntax]
Ответить