
Перевод текста из HTML в txt
Модераторы: Хыиуду, MOTOCoder, Medved, dr.Jekill

оut - выходной файл, s - строка.
flag:=false;
Цикл по всем строкам файла
for i:=1 to length(s) do
begin
if s='<' then flag:=true;
if not flag then write(out, s)
if s='>' then flag:=false;
end;
flag:=false;
Цикл по всем строкам файла
for i:=1 to length(s) do
begin
if s='<' then flag:=true;
if not flag then write(out, s)
if s='>' then flag:=false;
end;
Искусство программирования - заставить компьютер делать все то, что вам делать лень.
Для "спасибо" есть кнопка "Спасибо" в виде звездочки внизу под ником автора поста.
Для "спасибо" есть кнопка "Спасибо" в виде звездочки внизу под ником автора поста.
Подскажите как можно сделать так что бы при переводе HTML странички в txt в этом же документе сохранялся адрес откуда была скачена эта страница.
Если сохранить эту страницу и открыть ее в Блокноте, в тексте страницы не будет строки http://forum.developing.ru/showthread.php?t=11301. Отсюда вывод: в тексте html-страницы не сохраняется исходный адрес. Ответ на ваш вопрос - никак.
Искусство программирования - заставить компьютер делать все то, что вам делать лень.
Для "спасибо" есть кнопка "Спасибо" в виде звездочки внизу под ником автора поста.
Для "спасибо" есть кнопка "Спасибо" в виде звездочки внизу под ником автора поста.
В общем случае да - никак.Хыиуду писал(а):Если сохранить эту страницу и открыть ее в Блокноте, в тексте страницы не будет строки http://forum.developing.ru/showthread.php?t=11301. Отсюда вывод: в тексте html-страницы не сохраняется исходный адрес. Ответ на ваш вопрос - никак.
Но, например, если я сохраняю HTML (в HTML-формате же) из IExplorer-а (6.0 - для полноты картины), то этот товарищ проявляет интеллект и добавляет в создаваемый файл строки:
Код: Выделить всё
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3c.org/TR/1999/REC-html401-19991224/loose.dtd">
<!-- saved from url=(0059)http://forum.developing.ru/newreply.php?do=newreply&p=44344 -->

Но в общем случае, повторюсь: да, согласен, никаких гарантий (и алгоритмов) нет.
PS. Я для себя давно уже взял привычку, что если сохраняю для себя из интернета HTML-файл, то после этого вручную в[до]писываю его URL в тэг <TITLE>:
Код: Выделить всё
<TITLE> [http://forum.developing.ru/newreply.php?do=newreply&p=44344] </TITLE>