Парсинг google
Добавлено: 18 сен 2013, 20:54
Доброго времени суток!
Пытаюсь парсить гугл, точнее с парсингом проблем нет, если бы не капча.
С капчей ситуация следующая:
Вместо выдачи перенаправляет на:
http://www.google.com/sorry/
беру от туда id капчи и загружаю картинку от сюда:
http://www.google.com/sorry/image?id={$id}&hl=en
Картинка успешно распознается антигейтом и я получаю код.
А вот с этого момента начинаются проблемы - гугл принимать капчу упорно отказывается и после отправки ему капчи сим образом:
http://www.google.com/sorry/Captcha?id= ... oogle.com/
он снова выдает страницу ввода капчи.
Уже 20 раз перепроверил где какие куки в браузере берутся, как какая ссылка выглядит итп, но упорно не работает...
Подскажите пожалуйста в чем могут быть грабли, наверняка многие имели дело с парсингом гугла.
Заранее спасибо!
P.S. Код не прикладываю т.к. дело тут не в коде, а в том что мне нужно понять как гугл определяет что я пытаюсь его парсить.
Пытаюсь парсить гугл, точнее с парсингом проблем нет, если бы не капча.
С капчей ситуация следующая:
Вместо выдачи перенаправляет на:
http://www.google.com/sorry/
беру от туда id капчи и загружаю картинку от сюда:
http://www.google.com/sorry/image?id={$id}&hl=en
Картинка успешно распознается антигейтом и я получаю код.
А вот с этого момента начинаются проблемы - гугл принимать капчу упорно отказывается и после отправки ему капчи сим образом:
http://www.google.com/sorry/Captcha?id= ... oogle.com/
он снова выдает страницу ввода капчи.
Уже 20 раз перепроверил где какие куки в браузере берутся, как какая ссылка выглядит итп, но упорно не работает...
Подскажите пожалуйста в чем могут быть грабли, наверняка многие имели дело с парсингом гугла.
Заранее спасибо!
P.S. Код не прикладываю т.к. дело тут не в коде, а в том что мне нужно понять как гугл определяет что я пытаюсь его парсить.