Охота на RAMBLER!!!! Приз 500 р.
Добавлено: 17 фев 2005, 12:55
Задача следующая: PERL или PHP скрипт должен получать содержимое старницы типа:
http://www.rambler.ru/cgi-bin/rambler_s ... madison.ru
Наберите это в браузере и увидите нужный результат. Теперь напишите скрипт, получающий содержимое данного URL и получите "цены на дрова", которые нафиг не нужны. Текст скрипта, от которого можно отталкиваться привожу ниже:
#!/usr/bin/perl
use LWP::UserAgent;
use LWP::Simple;
use HTTP::Headers;
use HTTP::Request::Common;
use CGI::Carp qw(fatalsToBrowser);
print "Content-type: text/html;\n\n";
$url='http://www.rambler.ru/cgi-bin/rambler_s ... madison.ru';
my $ua = new LWP::UserAgent;
$pg=$ua->request(GET $url,
USER_AGENT => 'Mozilla/4.0 (compatible; MSIE 6.0; Windows 98)',
CHARSET => 'windows-1251',
ACCEPT => '*/*',
ACCEPT_LANGUAGE => 'ru',
COOKIE => 'b=b; hotlog=1'
);
%h=%{$pg};
foreach $k (keys %h) {
$page=$page."\n
".$k.'='.$h{$k};
}
print "\n
+++++Answer headers
";
print join ('
',%{$h{'_headers'}});
print "\n
+++++Request
";
print join ('
',%{$h{'_request'}});
print '
+++++Answer
';
print $page;
Решение данной задачи нужно для написания смарт-агента. Верояно в протоколе HTTP есть что-то что я не знаю и знает RAMBLER. Буду благодрен за наводку на правильный путь.
За рабочий исходник (perl, php) плачу 500р. Скрипт должен работать на сервере в интернете - для проверки кидайте ссылки на работающий скрипт.
Обращайтесь по адресу: dick_fry@mail.ru
http://www.rambler.ru/cgi-bin/rambler_s ... madison.ru
Наберите это в браузере и увидите нужный результат. Теперь напишите скрипт, получающий содержимое данного URL и получите "цены на дрова", которые нафиг не нужны. Текст скрипта, от которого можно отталкиваться привожу ниже:
#!/usr/bin/perl
use LWP::UserAgent;
use LWP::Simple;
use HTTP::Headers;
use HTTP::Request::Common;
use CGI::Carp qw(fatalsToBrowser);
print "Content-type: text/html;\n\n";
$url='http://www.rambler.ru/cgi-bin/rambler_s ... madison.ru';
my $ua = new LWP::UserAgent;
$pg=$ua->request(GET $url,
USER_AGENT => 'Mozilla/4.0 (compatible; MSIE 6.0; Windows 98)',
CHARSET => 'windows-1251',
ACCEPT => '*/*',
ACCEPT_LANGUAGE => 'ru',
COOKIE => 'b=b; hotlog=1'
);
%h=%{$pg};
foreach $k (keys %h) {
$page=$page."\n
".$k.'='.$h{$k};
}
print "\n
+++++Answer headers
";
print join ('
',%{$h{'_headers'}});
print "\n
+++++Request
";
print join ('
',%{$h{'_request'}});
print '
+++++Answer
';
print $page;
Решение данной задачи нужно для написания смарт-агента. Верояно в протоколе HTTP есть что-то что я не знаю и знает RAMBLER. Буду благодрен за наводку на правильный путь.
За рабочий исходник (perl, php) плачу 500р. Скрипт должен работать на сервере в интернете - для проверки кидайте ссылки на работающий скрипт.
Обращайтесь по адресу: dick_fry@mail.ru