Помогая проекту pythondigest.ru, а также находясь в перманентном поиске удаленки, очередной раз отметил для себя, что сбор и сортировка новостей - интересная задача. С приходом этого понимания решился наконец реализовать давнишнюю свою задумку - Агрегатор фидов Google Alerts.
Идея, конечно не оригинальна, на Github`e подобных проектов вагон и маленькая тележка, но на базе django я не нашел. Поэтому сел и написал свой агрегатор.
Штука получилась забавная. Собирая новости в полуавтоматическом режиме, позволяет накапливать данные для последующей статистики. Если запросы гуглу делать качественно и "отрезать" заведомо нерелевантные, то участия требует не много. Хотя, конечно, сильно зависит от вида запросов. Я собираю все о Django.
Проект закрыт
Django line - агрегатор и сортировщик результатов поисковых запросов Google Alerts. Приложение периодически опрашивает набор RSS фидов созданных с помощью Google Alerts. Полученные данные распарсиваются и распределяются по рубрикам на основе типовых источников.
Платформа разработки:
– Серверная часть NGINX + uWSGI + Django 1.5
– Верстка bootstrap 3.0
Как видно из картинки администратору доступна возможность править типы/категории новостей, находясь прямо в ленте. Это удобно для правки необработанных автоматом новостей.
Админку оставил пока стандартной, но по-максимуму вынес в нее возможности правки приложения:
- Набор фидов. Делаю "ручками" на Google Alerts, в приложение необходимо вставить только ссылку на фид и внутреннее название.
- Набор источников новостей для автоматического определения типа/категории. Например, в случае с Django новости из источника stackoverflow.com автоматом распределяются в категорию "Вопросы, ответы и обсуждения".
- Типы новостей, с порядком размещения в меню, выбором отображения на главной, выбором доступа посетитель/админ, стиль новостей данного типа в ленте.
Процесс разработки приложения не останавливаю и буду "прикручивать дополнительные плюшки".
Сейчас планирую настроить автоматическое удаление выбранных в админке категорий новостей (например, нерелевантных). Есть и другие мысли, но об этом после ...
Комментарии