Приложение студентов Университета ИТМО поможет пабликам искать интересные новости и предсказывать, что попадет в топ

Как сделать интересную новость из региона достоянием общественности, помочь пабликам справляться с потоком входящих новостей, а пользователям — начать зарабатывать на контенте? В прошлом году на хакатоне «ВКонтакте» студенты кафедры компьютерных технологий Университета ИТМО Виктор Хованский и Евгений Варламов разработали приложение, которое не только способно фильтровать инфоповоды по темам и категориям, но и предсказывать, какая новость наберет больше всего лайков и репостов. Тогда команда стала победителем и получила предложение от администрации паблика «Лентач» продолжить разработку. В начале февраля приложение было выпущено в открытый доступ в сети «ВКонтакте», его уже опробовали подписчики «Лентача». О том, как эффективно фильтровать новости, предсказывать популярное и позволять пользователям зарабатывать на информации, ITMO.NEWS рассказал разработчик приложения Виктор Хованский.

Логотип Лентача

Идея

Работа над приложением началась еще в октябре минувшего года. С 20 по 22 октября в Петербурге проходил третий по счету хакатон «ВКонтакте», где участникам представили на выбор несколько задач от партнеров, в том числе от паблика «Лентач», который предложил новостной кейс в направлении «Медиа».

За это задание взялись пять команд, в том числе студенты Университета ИТМО Виктор Хованский и Евгений Варламов. За 40 часов им предстояло предложить решение проблемы, связанной с огромным потоком предлагаемого контента, который редакторам паблика приходилось обрабатывать вручную.

В результате команда Университета ИТМО разработала автоматизированный фильтр для всего входящего контента издания. Акцент в проекте был сделан на машинное обучение, с помощью которого разработчики реализовали функцию разбивки инфоповодов по категориям и темам. Приложение способно идентифицировать общий тон новости (позитивная, негативная, нейтральная) и умеет определять темы (политика, общество, мир, армия, экономика и другие).

Отдельная функция, которую также позволяет реализовать машинное обучение, – предсказание количества лайков и репостов. Если выпускающий редактор опубликует предложенную новость практически без изменений, то у него на руках будет приблизительная цифра лайков и репостов этой записи, отмечают разработчики.

Интерфейс приложения для Лентача
Интерфейс приложения для Лентача

Кроме того, авторы приложения предложили удобную админ-панель. Она представляет собой ленту присланных инфоповодов и позволяет фильтровать их по различным критериям: по дате, статусу обработки, по категориям. Также была разработана мобильная версия как администраторской, так и пользовательской части приложения.

Проект стал победителем в категории «Медиа», разработкой заинтересовались администраторы «Лентача», которые предложили авторам доработать приложение. Как отмечает Виктор Хованский, на доработку всех деталей проекта потребовалось порядка трех месяцев. Основные сложности, с которыми столкнулись разработчики, — работа с официальным клиентом «ВКонтакте» под iOS. Как выяснилось, он до сих пор некорректно работает с приложениями сообществ, поэтому, чтобы приложение запускалось на iPhone, потребовалось найти обходные пути. Техподдержка «ВКонтакте» подтвердила проблему и предложила решение, однако на доработку все равно пришлось потратить больше времени, чем планировалось изначально, рассказывает разработчик.

Как все работает

Сегодня приложение позволяет автоматически фильтровать присылаемые пользователями новости на основании заданных администратором правил, а также разбивает их по тональности (негативная или позитивная), темам и географии. Сейчас доступно порядка 30 тем — например, политика, экономика, юмор и другие, также приложение распознает новости из России или Украины.

Начать работать с приложением просто: пользователь находит в малочисленном региональном паблике или на сайте регионального СМИ интересную новость, прикрепляет ссылку в приложении и добавляет свое описание.

«После этого наша система автоматически извлекает из текста ссылку, догружает определенную информацию. Например, если это сообщество во “ВКонтакте” и оно закрыто, мы должны особым способом от лица пользователя прочитать информацию, этот момент тоже учитывается. После мы прогнозируем категории (например, политика, экономика, юмор и так далее), это довольно быстрая операция, занимает буквально миллисекунды. А следующим шагом запускаем долгосрочную задачу на прогнозирование репостов и лайков, это более длительная операция, занимает порядка минуты. Далее пользователь видит, что его новость добавлена в приложение и получает сообщение, что она обрабатывается», — объясняет Виктор Хованский.

Команда разработчиков Traffox на хакатоне «ВКонтакте»
Команда разработчиков Traffox на хакатоне «ВКонтакте»

Редакция получает оповещение о поступившей новости и приступает к ее обработке. При этом инфоповод может не пройти еще на первом этапе. Администратор сообщества может заранее установить фильтры по определенным ключевым словам. Например, если ему не интересны новости об Олимпиаде, все соответствующие инфоповоды будут автоматически заблокированы. Кроме того, можно блокировать ссылки на новости определенных изданий. К примеру, редакция «Лентача» не принимает новости ТАССа, «Интерфакса» и других федеральных СМИ, потому что регулярно мониторит их сама.

В случае, если новость прошла все фильтры, а также финальную проверку у редактора, она поступает на обработку райтеру и пикчеру, а после публикуется обычным отложенным сообщением. В это время редакция выставляет статус в приложении, что новость принята и опубликована. Соответствующее оповещение приходит пользователю. Каждый день, неделю и месяц обновляется рейтинг пользователей по количеству опубликованных новостей. Кроме того, пользователи, указавшие в аккаунте при старте приложения свой телефонный номер, получают вознаграждение за опубликованные новости. Сейчас эта опция реализуется через «Яндекс.Деньги».

Сейчас приложение принимает ссылки как на новости в пабликах «ВКонтакте», так и на сайтах. При этом, если, например, сообщество не доверяет качеству информации в пабликах, администрация может автоматически настроить прием только с сайтов СМИ. Аналогичным образом можно заблокировать и сайты, оставив только паблики. В перспективе, чтобы дополнительно фильтровать фейковые новости, разработчики планируют в том числе самостоятельно проработать список ненадежных источников, чтобы приложение автоматически не принимало новости от них.

В приложении можно блокировать и самих пользователей. Если подписчик несколько раз подряд шлет неприемлемый контент, то он автоматически отправляется в бан на некоторое время.

Интерфейс приложения для Лентача
Интерфейс приложения для Лентача

Итоговая версия приложения была запущена в начале февраля в паблике «Лентач». Администрация тестировала его на протяжении пяти дней, после чего временно отключила, чтобы подробно проанализировать статистику. За это время через приложение «Лентач» получил порядка 2000 предложенных новостей, для сравнения — за предыдущий год пользователи прислали сообществу традиционным способом — через форму «Предложить новость» в группе «ВКонтакте» — около 1000 сообщений.

Перспективы

Сейчас разработчики подали заявку в официальный каталог приложений «ВКонтакте», однако уже на первом этапе на приложение обратили внимание несколько десятков крупных сообществ.

«На данный момент в официальном каталоге находится порядка 20-30 приложений, и каждая новая заявка рассматривается очень досконально, потому что, по сути, мы встраиваем свой сайт во «ВКонтакте». У нас очень много прав, поэтому надо делать серьезный аудит безопасности, — говорит Виктор Хованский. — Но когда добавим, любое сообщество может найти его и добавить к себе. Впрочем, после того, как мы провели публичный тест у «Лентача», на нас вышли около 50 сообществ — либо написали нам, либо самостоятельно приступили к тесту»

Для всех сообществ разработчики планируют реализовать минимальную функциональность — это возможность получать новости от пользователей, разбивать их по темам и географии. Однако чтобы предсказать, сколько та или иная новость наберет лайков и репостов, потребуются дополнительные ресурсы. Эту опцию команда планирует реализовать под каждого партнера в отдельности.

Виктор Хованский
Виктор Хованский

«Пока наше предсказание по лайкам и репостам узкоспециализировано под аудиторию «Лентача». Ведь то, что понравится подписчикам «Лентача» не всегда понравится подписчикам другого сообщества. Чтобы это предсказывать, нам нужен большой объем данных, их нужно где-то хранить. Поэтому во время работы выяснилось, что мы не можем сделать эту функцию универсальной для всех, — продолжает Виктор Хованский. — Мы планируем, что она будет дополнительной услугой для партнеров, с помощью которой мы в том числе намерены впоследствии монетизировать приложение»

Еще одной дополнительной опцией для партнеров станет возможность кастомизации интерфейса. Пока приложение выдержано в классическом стиле «ВКонтакте». Кроме того, в перспективе разработчики планируют расширять количество тем. В частности, помимо категории «Страна», появится разбивка и по городам. На сегодняшний момент, как отмечает Виктор Хованский, разработчики уже получили несколько предложений о сотрудничестве от крупных сетей региональных пабликов из Саратовской области, Твери, Пскова и других городов.

Редакция новостного портала
Архив по годам:
Пресс-служба