"domain" — доменное имя источника статьи
"api_url" — API URL текущей статьи. Можно использовать GET запрос для получения конкретной статьи по этой ссылке
"html" — текст статьи с HTML тэгами
"text" — "чистый" текст статьи без HTML тэгов
"lang" — язык статьи
"url" — оригинальный URL статьи из источника
"iframes" — iframes из текста статьи, если он есть
"pub_time" — UTC. Дата и время, когда статья была собрана с сайта источника
"meta_images" — ссылки на изображения из META тегов со страницы статьи
"score" — внутренний рейтинг статьи. Высчитывается путем сравнения цитируемости инфоповода среди собранных статей.
"title" — заголовок статьи
"images" — массив ссылок на изображения, которые мы смогли собрать из статьи. uCrawler не собираем изображения размеров менее 300x300px
- "url" — ссылка на картинку из источника
- "caption" — текст под изображением
- "length" — размер изображения (байты)
- "format" — формат изображения
- "width" — ширина изображения (px)
- "height" — высота изображения (px)
"sources" — ID и название источника, группы
- "group" — ID группы, которой принадлежит источник
- "group_name" — имя группы, которой принадлежит источник
- "source" — ID источника
- "source_name" — название источника
"icons" — массив ссылок на иконки из статьи
"video" — массив ссылок на видео, которые мы смогли собрать из статьи
"id" — уникальный идентификатор статьи в uCrawler