uCrawler - облачный парсер новостей
Автоматический сбор новостей
с любых сайтов и Telegram каналов для вашего |

На любом языке. Без программирования.
Зачем нужен uCrawler?
Добавляйте последние новости с любых сайтов на свой веб-сайт или мобильное приложение с помощью API или экспорта в ElasticSearch, MySQL или Postgres.
Если у вас нет сайта, вы можете использовать наш готовый шаблон сайта новостей. Получите готовый новостной веб-сайт за 1 день с uCrawler CMS!
Создание новостных лент, отфильтрованных по ключевым словам, для мониторинга и анализа новостей.
Извлечение "чистых" данных. Мы извлекаем данные из любых статей и файлов PDF, Word, Excel, PowerPoint на веб-страницах и каналах Telegram.
Как это работает?
Работа uCrawler полностью автоматизирована, вам достаточно задать источники новостей.
1
Добавление групп и источников
В личном кабинете вы создаете группы и добавляете в них ссылки на любые новостные источники.

Также мы можем подобрать и добавить источники по вашему запросу.
2
Сбор и кластеризация данных
uCrawler автоматически каждые 5 минут собирает новости с указанных вами источников. С помощью технологий машинного обучения и нейронных сетей, новости группируются по темам с исключением дублей (как это делают Яндекс и Google Новости).
3
Интеграция
Интеграция новостной ленты на ваш сайт или в мобильное приложение осуществляется через API, RSS, XML или напрямую в вашу базу данных (MySQL, PostgreSQL) или в ElasticSearch.
Для упрощения интеграции мы создали примеры на Python, PHP, NodeJS.
Преимущества
uCrawler - уникальная технология, не имеющая аналогов на российском рынке.
Выгодно
Готовое решение для сбора статей и файлов с любых сайтов без лишних затрат на программирование.
Надежно
Мы гарантируем высокую скорость и стабильность работы сервиса.
Маштабируемость
Неограниченные возможности масштабирования тематик, языков и источников.
Мультиязычность
Возможность создать свою уникальную ленту новостей на любом языке.
Возможности
Мы предлагаем уникальную технологию по сбору и кластеризации статей и файлов с новостных сайтов и Telegram каналов.
Любые источники: динамические сайты и Telegram каналы
uCrawler умеет парсить новости с любых сайтов (даже без RSS и с динамическим контентом) и Telegram каналов. uCrawler собирает заголовок, исходный URL, картинки, полный текст (без тегов и с HTML тегами)
Сбор данных из файлов PDF, Word, Excel, PowerPoint
uCrawler умеет извлекать данные из PDF, Word, Excel, PowerPoint файлов, размещенных на веб-страницах. Например, пресс-релизы, финансовые отчеты, или научные статьи.
Простая интеграция
Мы поддерживаем различные форматы для интеграции с вашим сайтом или мобильным приложением : API, RSS, XML, экспорт в вашу базу данных (MySQL, PostgreSQL и др.), экспорт в ElasticSearch.
Фильтрация новостей по ключевым словам
Возможность создать категории с фильтрами по заданным ключевым словам или фразам. Гибкие уровни настройки фильтрации позволяют добиться нужного результата.
Попробуйте uCrawler уже сегодня!
Бесплатная демо версия.
Тарифы
Все тарифные планы включают:
Мощный сервер
Выбор любого языка (1 аккаунт = 1 язык)
Автоматический экспорт данных в ElasticSearch/MySQL/Postgres
Неограниченные API запросы
99.95% SLA
Техническая поддержка (email, Skype, Telegram)
Количество источников
Источник - URL веб-страницы, RSS-ссылка или канал Telegram. Если вам нужно более 300 источников, пожалуйста, свяжитесь с нами sales@ucrawler.app
Модуль фильтрации по ключевым словам
В аккаунт включен ElasticSearch для поиска и фильтрации новостного потока по ключевым словам
Модуль сбора данных из файлов (PDF, Word, Excel, PowerPoint)
Извлечение данных из файлов (PDF, Word, Excel, PowerPoint), расположенных на веб-страницах
Модуль сбора данных из Telegram каналов
Сбор сообщений из Telegram каналов
Ежемесячная стоимость:0
Email
По всем вопросам и предложения пишите: public@ucrawler.app
Запрос демо доступа
Цель
Тип интграции
Источники
Список источников (названия / URL), с которых хотели бы собирать новости, или названия категорий (Политика, Спорт, ИТ и тп)
Все права защищены. uCrawler. 2019