Доброго времени суток!
Пытаюсь парсить гугл, точнее с парсингом проблем нет, если бы не капча.
С капчей ситуация следующая:
Вместо выдачи перенаправляет на:
http://www.google.com/sorry/
беру от туда id капчи и загружаю картинку от сюда:
http://www.google.com/sorry/image?id={$id}&hl=en
Картинка успешно распознается антигейтом и я получаю код.
А вот с этого момента начинаются проблемы - гугл принимать капчу упорно отказывается и после отправки ему капчи сим образом:
http://www.google.com/sorry/Captcha?id= ... oogle.com/
он снова выдает страницу ввода капчи.
Уже 20 раз перепроверил где какие куки в браузере берутся, как какая ссылка выглядит итп, но упорно не работает...
Подскажите пожалуйста в чем могут быть грабли, наверняка многие имели дело с парсингом гугла.
Заранее спасибо!
P.S. Код не прикладываю т.к. дело тут не в коде, а в том что мне нужно понять как гугл определяет что я пытаюсь его парсить.
Парсинг google
Модераторы: Naeel Maqsudov, C_O_D_E
Возможно на события что-то подвешено... на нажатие клавиш или получение фокуса окном ввода капчи. По этому событию гугл может принять некий флаг, который и позволяет думать, что ты - человек.
It's a long way to the top if you wanna rock'n'roll
-
- Сообщения: 2
- Зарегистрирован: 18 сен 2013, 20:53
Думаю это исключено т.к. в браузере с отключенным JS все работает.
Может стоит шапку послать мол программа является мозиллой фаерфокс или ещё каким популярным браузером?
[syntax=Delphi] [/syntax]