Содержание
Команда дата-журналистики делает исследования на основе данных сервисов Яндекса. Это обезличенная агрегированная информация, которая не рассказывает о конкретном пользователе, зато даёт представление об интересах людей в целом и мире вокруг. Темы исследований самые разные — от анализа лексики русскоязычного рэпа до статистики запросов пользователей о значении снов. Игорь Лощиц и Максим Матющенко рассказывают, как придумывают темы, находят информацию — и для чего всё это нужно.
Чем занимается команда исследований
Максим Матющенко: «Мы создаём истории на основе данных»
С помощью данных сервисов Яндекса мы рассказываем, чем интересуются люди, как общаются с сервисами Яндекса и друг с другом.
Несколько лет назад у нас был целый трек исследований о лексике русского языка: мы сравнивали тексты столетней давности с современными, находили устаревшие слова и неологизмы, говорили о региональной лексике.
У Яндекса много данных — почему бы не создавать на их основе что-то интересное?
Мы публикуем разные форматы: от больших исследований, например «Как изменилась погода в России с середины прошлого века», до постов в соцсетях, например «Чему хотят научить детей в разном возрасте?». Исследования могут быть полезными, такие как карты навыков фронтендеров и ML-разработчиков, или развлекательными вроде «Из чего сделаны песни о любви».
Как изменился отдел за 10 лет
Игорь Лощиц: «Сначала в команде никто не умел писать код»
В начале 2010-х мы были подразделением на стыке редактуры и пиара, и среди нас не было аналитиков и разработчиков. Только гуманитарии: социологи, экономисты, психологи.
С годами мы научились писать на Python, делать интерактивные графики, стали глубже погружаться в аналитику. Начали сами работать с логами, доставать и анализировать данные, чтобы не зависеть от того, что выгрузят коллеги. В последние годы к нам стали приходить люди с техническим бэкграундом.
Сейчас у нас своего рода предприятие полного цикла
Мы производим продукт под ключ. У нас есть аналитики, редакторы и дизайнеры — такая маленькая студия дата-журналистики и инфографики. Мы всё делаем сами: достаём данные, считаем, пишем, рисуем, выпускаем.
Откуда берутся темы исследований
Игорь Лощиц: «Чаще всего мы ищем материал для рассказа о продукте»
Так, несколько лет назад мы сделали материал для Яндекс Путешествий — сейчас они известны и популярны, а тогда это был новый сервис, который активно развивался. Поскольку данных самих Путешествий было очень мало, мы изучили запросы к поиску Яндекса и выяснили, куда люди собираются поехать в отпуск или командировку.
Или, например, чтобы подсветить функционал отзывов в Картах, мы взяли тексты отзывов и посчитали, на что посетители обращали внимание, когда ругали или хвалили заведения, а ещё посмотрели, чем отличаются отзывы туристов и местных. Одно из моих любимых последних исследований — про «животные» названия улиц: к нам пришли ребята из Карт с идеей сравнить частоту «собачьих» и «кошачьих» названий. А мы решили изучить все «зооадреса».
Игорь Лощиц: «Иногда мы замечаем что-то любопытное, копаясь в поисковых запросах»
Так в 2019 году появилось исследование «Фильм, в котором». Мы обратили внимание на поисковые запросы, с помощью которых люди пытаются вспомнить название фильма, — например, «фильм, в котором лингвисты спасают мир». Мы называем это исследование «вечный референс», потому что нас до сих пор периодически просят сделать что-то подобное.

Исследование «Фильм, в котором»
Так же родилась идея исследования «Десять лет красоты»: мы увидели запросы о причёсках, маникюре и макияже и сделали проект совместно с Яндекс Услугами.
Максим Матющенко: «Порой мы вдохновляемся работами коллег»
Студия инфографики The Pudding когда-то сделала исследование о текстах англоязычного рэпа. Нам понравилась тема, мы захотели сделать подобное о русскоязычном рэпе — и пошли с этой идеей к Яндекс Музыке. Конечно, в процессе мы придумали много нового, но базово вдохновились работой коллег. Так вышел материал «Русский рэп как набор слов».
Самое важное — интересная история. Мы не делаем исследования о сервисах и продуктах Яндекса, не рассказываем, сколько новых людей пришло в продукт, чем он хорош и почему набирает популярность. Мы берём данные этих сервисов и рассказываем про жизнь вокруг: что интересует людей, что меняется со временем. Для нас это принципиально. Иначе это будет уже не исследование.
















