Страница 1 из 1

CMS и контент-фильтры

СообщениеДобавлено: 22 авг 2012, 17:39
Telnov
Нелли, немного подумал над твоей задачей и вот какие соображения возникли.

1. Как уже писал тебе, сама по себе задача вычленения нежелательного текстового контента решается несложно (Regex и парсеры). Проблема, как мне представляется, в другом.
2. Есть тьма готовых "тупых" контент-фильтров, которые просто блокируют сайты и домены на основе всяких "чёрных списков", анализируя поток, идущий по http-протоколу. Это, очевидно, не то, что нужно.
3. Продвинутые CMS - системы управления контентом (это обобщенное название всяких форумов, блогов, чатов и т.д.) имеют свои встроенные средства фильтрации. Это делают серверные скрипты. Опять не то, что нужно.
4. Нужно фильтровать контент на клиентской стороне, блокируя некоторые фрагменты, но не блокируя web-страницы. Строго говоря, это может делать только браузер. То есть, чтобы решить задачу в такой постановке, нужно писать плагины для браузеров. Очень большой геморрой. Думаю, это не для студентов.

Такие вот пока печальные предварительные соображения.

Re: CMS и контент-фильтры

СообщениеДобавлено: 23 авг 2012, 09:35
Нелли
Витя, спасибо, что потратил время на обдумывание моей проблемы. Про парсеры и регулярные выражения я немного в курсе.
Если :
1) появится время написать фильтр, как я его задумала
2) он действительно заработает, как предполагалось
3) у тебя будет интерес его посмотреть,
то я его тебе вышлю.
:)

Удачи! Если какая-то проблема всплывет, непременно тебе сообщу.