Страница 1 из 1

Перевод текста из HTML в txt

Добавлено: 23 сен 2007, 13:47
Valkiria
:) Привет! Помогите пожалуйста снаписанием проги, которая переводила бы содержимое HTML странички в текстовый документ, в котором это содержимое должно оттображаться, расширение документа может быть doc или txt! Кто может помогите хоть чем - нибудь!!!!!

Re: Перевод текста из HTML в txt

Добавлено: 26 сен 2007, 14:30
Хыиуду
оut - выходной файл, s - строка.
flag:=false;
Цикл по всем строкам файла
for i:=1 to length(s) do
begin
if s='<' then flag:=true;
if not flag then write(out, s)
if s='>' then flag:=false;
end;

Re: Перевод текста из HTML в txt

Добавлено: 09 окт 2007, 20:48
Valkiria
Подскажите как можно сделать так что бы при переводе HTML странички в txt в этом же документе сохранялся адрес откуда была скачена эта страница.

Re: Перевод текста из HTML в txt

Добавлено: 10 окт 2007, 10:58
Хыиуду
Если сохранить эту страницу и открыть ее в Блокноте, в тексте страницы не будет строки http://forum.developing.ru/showthread.php?t=11301. Отсюда вывод: в тексте html-страницы не сохраняется исходный адрес. Ответ на ваш вопрос - никак.

Добавлено: 11 окт 2007, 12:54
BBB
Хыиуду писал(а):Если сохранить эту страницу и открыть ее в Блокноте, в тексте страницы не будет строки http://forum.developing.ru/showthread.php?t=11301. Отсюда вывод: в тексте html-страницы не сохраняется исходный адрес. Ответ на ваш вопрос - никак.
В общем случае да - никак.
Но, например, если я сохраняю HTML (в HTML-формате же) из IExplorer-а (6.0 - для полноты картины), то этот товарищ проявляет интеллект и добавляет в создаваемый файл строки:

Код: Выделить всё

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3c.org/TR/1999/REC-html401-19991224/loose.dtd">
<!-- saved from url=(0059)http://forum.developing.ru/newreply.php?do=newreply&p=44344 -->
Так что ИНОГДА можно найти исходняй адрес :)
Но в общем случае, повторюсь: да, согласен, никаких гарантий (и алгоритмов) нет.

PS. Я для себя давно уже взял привычку, что если сохраняю для себя из интернета HTML-файл, то после этого вручную в[до]писываю его URL в тэг <TITLE>:

Код: Выделить всё

<TITLE> [http://forum.developing.ru/newreply.php?do=newreply&p=44344] </TITLE>