Разработка "контент-фильтра"

Вопросы по программированию, не подходящие в другие разделы.

Модераторы: Naeel Maqsudov, C_O_D_E

Ответить
Direct
Сообщения: 1
Зарегистрирован: 06 июл 2010, 10:48

Здравствуйте!
Хочу разработать чисто для себя аддон для Mozilla Firefox или приложение которое будет функционировать независимо от используемого браузера, для фильтрации контента страниц определенного сайта. Я хочу чтобы результатом программы являлось игнорирование некоторой информации, чтобы она просто не отображалась по определенным условиям или заменялась чем-нибудь другим.
Например, пользователь регулярно просматривает какой-то сайт новостей, штатных средств настройки тем новостей нет, и вместе с новостями культуры отображаются новости кримнала, новости криминала, предположим идут из одного источника, рядом с блоком сообщения есть ссылка или оно всегда сопровождаются одним и тем же текстом, пользователь указывает эту ссылку или текст в приложении и после этого блоки информации с этими условиями не отображаются. Или меняются на что-то более интересное (заранее подготовленное, конечно).

Вопросы
1. Существуют ли уже подобные приложения? Если да, то названия. Может и разрабатывать ничего не надо, все уже есть)
2. Литература или другие источники информации по этой идее.
3. Какие разделы разработки ПО вообще касаются подобных идей (а то вот так даже в какой теме писать вопрос не знаю)) )?
4. Какие средства лучше всего подходят для реализации этой идеи?
Аватара пользователя
Duncon
Сообщения: 2085
Зарегистрирован: 10 окт 2004, 14:11
Откуда: Питер
Контактная информация:

1 В винде где-то есть огранечения получаемой информации - типа защита для детей..
Я бы сделал сервис который постоянно искал бы броузеры и просматривал их содержимое и заменял всё ненужное.. Ещё круче ловить HTML пакеты и парсить их тогда и броузера пасти не нужно.
2 Понимаешь что это частная задача.
3 Пиши админы разберут что куда, абы вопрос был адекватным.
4 Любые C++ Delphi, а вообще зависит от платформы..
[syntax=Delphi] [/syntax]
Аватара пользователя
somewhere
Сообщения: 1858
Зарегистрирован: 31 авг 2006, 17:14
Откуда: 71 RUS
Контактная информация:

1. Для лисы есть плагины-банерорезки. Они довольно неплохо настраиваются, судя по отзывам. Может стоит там покопать?
2. Поскольку необходимо работать с DOM в HTML, то и литература напрашивается сама-собой. Когда изучите HTML и структуру документа, то можно приступать к выбору языка программирования.
3. WEB-программирование и иже с ним.
4. Любые, с которыми вы умеете работать. Это можно выполнить даже выполнив javascript код в адресной строке.
It's a long way to the top if you wanna rock'n'roll
Аватара пользователя
Игорь Акопян
Сообщения: 1440
Зарегистрирован: 13 окт 2004, 17:11
Откуда: СПБ
Контактная информация:

для лиса есть ADblock Plus - режет рекламу путём выкусывания лишнего, рубит фреймы, флэш по адресам, изображения и пр.
Adblock Plus: Element hiding helper - скрывает отдельные элементы на уже загруженной странице. Использует DOM. И вот тут вырисовывается проблема. Как мне кажется новостной сайт не будет генерируя страницу как-то определять отдельные атрибуты для областей и следовательно структура с точки зрения DOM inspector не будет отличаться. Поэтому отделить нужную инфу от ненужной вряд ли удастся. Хотя можно посмотреть на конкретном сайте
Изображение
Ответить