Страница 1 из 1
считывание информации с сайта
Добавлено: 05 апр 2009, 00:16
Dim...ON
добрый вечер всем читающим
У меня такая ситуация, раньше работал с программами, не связанными никак с Интернетом... а вот теперь возникла такая необходимость, считать информацию с сайта для обработки в локальной программе
Не подскаже ли кто из умельцев как лучше это делать? И какие вообще компоненты и/или другие средства и функции мне было бы полезно знать?
Заранее премного благодарен
Re: считывание информации с сайта
Добавлено: 05 апр 2009, 01:34
Naeel Maqsudov
Есть готовый компонент TWebBrowser. (Это самый простой путь)
Наверняка есть готовые компоненты - HTTP-клиенты.
Можно вообще обойтись без них. Для этого понадобится TClientCocket или любой другой компонент для работы с сокетами или даже просто функции WinSockAPI.
Установив сокентое соединение с нужным хостом по порту 80 (как правило). Надо отправить GET или HEAD или POST запрос, получить ответ и распарсить его.
Как формировать команды и как анализировать ответы написано главным образом в RFC2616:
http://www.ietf.org/rfc/rfc2616.txt
Re: считывание информации с сайта
Добавлено: 05 апр 2009, 10:50
Duncon
Вообще-то тырить инфу нехорошо, но иногда нужно

я через php такие вещи проворачиваю, в плане распарсить документ, куда удобнее и быстрее нежели через dom мучаться..
Re: считывание информации с сайта
Добавлено: 06 апр 2009, 15:22
mc-black
И еще один - самый простой (но не всегда подходящий) способ - Win32 API Функция UrlDownloadToFile - просто скачает 1 файл по ссылке, если это интернет-страница, то будет скачан только 1 html-файл, который тянет за собой все остальное. Для подключения UrlDownloadToFile использует общие Настройки подключения, прописанные в IE, в частности можно скачать файл даже через настроенный HTTP прокси-сервер без авторизации. Функция позволяет отслеживать прогресс закачки, закачка однопоточная.