Страница 1 из 1
Перевод текста из HTML в txt
Добавлено: 23 сен 2007, 13:47
Valkiria

Привет! Помогите пожалуйста снаписанием проги, которая переводила бы содержимое HTML странички в текстовый документ, в котором это содержимое должно оттображаться, расширение документа может быть doc или txt! Кто может помогите хоть чем - нибудь!!!!!
Re: Перевод текста из HTML в txt
Добавлено: 26 сен 2007, 14:30
Хыиуду
оut - выходной файл, s - строка.
flag:=false;
Цикл по всем строкам файла
for i:=1 to length(s) do
begin
if s='<' then flag:=true;
if not flag then write(out, s)
if s='>' then flag:=false;
end;
Re: Перевод текста из HTML в txt
Добавлено: 09 окт 2007, 20:48
Valkiria
Подскажите как можно сделать так что бы при переводе HTML странички в txt в этом же документе сохранялся адрес откуда была скачена эта страница.
Re: Перевод текста из HTML в txt
Добавлено: 10 окт 2007, 10:58
Хыиуду
Если сохранить эту страницу и открыть ее в Блокноте, в тексте страницы не будет строки
http://forum.developing.ru/showthread.php?t=11301. Отсюда вывод: в тексте html-страницы не сохраняется исходный адрес. Ответ на ваш вопрос - никак.
Добавлено: 11 окт 2007, 12:54
BBB
Хыиуду писал(а):Если сохранить эту страницу и открыть ее в Блокноте, в тексте страницы не будет строки
http://forum.developing.ru/showthread.php?t=11301. Отсюда вывод: в тексте html-страницы не сохраняется исходный адрес. Ответ на ваш вопрос - никак.
В общем случае да - никак.
Но, например, если я сохраняю HTML (в HTML-формате же) из IExplorer-а (6.0 - для полноты картины), то этот товарищ проявляет интеллект и добавляет в создаваемый файл строки:
Код: Выделить всё
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3c.org/TR/1999/REC-html401-19991224/loose.dtd">
<!-- saved from url=(0059)http://forum.developing.ru/newreply.php?do=newreply&p=44344 -->
Так что ИНОГДА можно найти исходняй адрес

Но в общем случае, повторюсь: да, согласен, никаких гарантий (и алгоритмов) нет.
PS. Я для себя давно уже взял привычку, что если сохраняю для себя из интернета HTML-файл, то после этого вручную в[до]писываю его URL в тэг <TITLE>:
Код: Выделить всё
<TITLE> [http://forum.developing.ru/newreply.php?do=newreply&p=44344] </TITLE>