Vlad Borovcov
написал 1 мая 2008 года в 19:55 (971 просмотр)
Ведет себя
как благородный джентельмен; открыл 35 тем в форуме, оставил 70 комментариев на сайте.
Здравствуйте!
Не подскжет ли кто, как с помощью ACL в squid’e сделать фильтрацию баннеров и «ненужных» сайтов?
Последние комментарии
- OlegL, 17 декабря 2023 года в 15:00 → Перекличка 21
- REDkiy, 8 июня 2023 года в 9:09 → Как «замокать» файл для юниттеста в Python? 2
- fhunter, 29 ноября 2022 года в 2:09 → Проблема с NO_PUBKEY: как получить GPG-ключ и добавить его в базу apt? 6
- Иванн, 9 апреля 2022 года в 8:31 → Ассоциация РАСПО провела первое учредительное собрание 1
- Kiri11.ADV1, 7 марта 2021 года в 12:01 → Логи catalina.out в TomCat 9 в формате JSON 1
ecobeing.ru
Экология и вегетарианство на благо всем живым существам Планеты.
примерно так:
acl banned url_regex -i «/etc/squid/banned»
http_access deny banned
соответственно, содержимое /etc/squid/banned, выглядит как:
porno\.com
mp3\.ru
и т.д.
спасибо большое)
Предварительно относительно общей логики обработки Acl’ов настоятельно рекомендую пошариться где-нибудь в районе <font color=«blue»>http://wiki.squid-cache.org/SquidFaq/</font>.
Я разглядывая документацию, понял что после url_regex надо писать регексп, ты же предлагаешь написать имя файла с регекспами. Второе удобнее, но как сквид поймёт: регексп я указал или файл?
Понял: если в кавычках, то это имя файла, иначе непосредственно regexp.
А никто не пробовал байесовый фильтр по content’у к сквиду прикрутить? Я склоняюсь к мысли, что иначе никак. Пытаюсь заставить сквид бороться с теми, кто считает, что «internet is for porn», и успехи в этом начинании меня не впечатляют.
Поиск в гугле подсказал, что существует http://www.poesia-filter.org/ , но, мне не очень нравится то количество депендансов, которые за собой оно тянет. То есть даже не количество, а то что оно тянет, с жабой я могу смириться, но gtk-то ему зачем?
Сейчас разглядываю сорцы c_icap, мысля туда включить байесовский фильтр, но там сложно разобраться, тк автор сильно не злоупотреблял комментариями.
Что-то я ещё смотрел, там даже вроде байеса есть что-то, но, как я понял, там денег хотят за создание базы данных. Вникать в подробности было лень.
При этом неделю назад, я где-то читал статейку, про фильтр на http, который байесом классифицирует, но вот убей меня не вспомню где.