DATA — ЭТО
ПРОСТО
КАК ЖУРНАЛИСТУ
РАБОТАТЬ С ДАННЫМИ?
НЕКРАТКОЕ РУКОВОДСТВО
Дата-журналистика — это не магия, а новый способ рассказывать истории. Она учит нас «беседовать» с числами и графиками, а не бояться их. Впрочем, если тебе по-прежнему кажется, что цифры — это скучно или страшно, то самое время опровергнуть это мнение.
АНДРЕЙ
ДОРОЖНЫЙ
дата-журналист
«Я считаю, что журналистика в России умерла. Остался только контент. Мы конкурируем с блогерами, с котами, с красивыми людьми в интернете. И мы эту битву уже проиграли. Нам нужно уходить в другое — в контент, который помогает решать задачи аудитории»
ЕСЛИ ТЫ ХОЧЕШЬ
РАСШИРИТЬ КРУГОЗОР,
ТО ПРОЕКТ ДЛЯ ТЕБЯ
Цель лонгрида — развеять страх перед данными и показать, как устроена работа дата-журналиста — от выбора темы до публикации инфографики.
«ЗАЧЕМ МНЕ ЭТО?»
СПРОСИШЬ ТЫ НАВЕРНЯКА
ДАННЫЕ — ЯЗЫК СОВРЕМЕННОСТИ
СМОЖЕШЬ СДЕЛАТЬ СЛОЖНОЕ ПРОСТЫМ
ИНВЕСТИЦИЯ В СЕБЯ
Дата-журналистика отвечает на запрос современной аудитории: получать сложную информацию в наглядной и понятной форме. Британский психолог и профессор по нейропсихологии в университете Бристоля Ричард Лэнгтон Грегори отмечает, что визуально-информационные сюжеты воздействуют на подсознание, делая восприятие материала более острым​. Проще говоря, график порой расскажет читателю больше, чем тысяча слов​. 
Визуализация — не диковинка. Еще в начале ХХ века их научились вставлять в газеты, а иллюстрированные энциклопедии вообще изобрели в незапамятные времена. Фрески и росписи в церквях, рассказывающие библейские сюжеты, росписи гробниц фараонов, кстати, — это тоже визуализация.
Однако практика дата-журналистики в России — пока удел немногих. Как пишет исследователь Дарья Авилочкина, «журналист, работающий с данными, должен сочетать в себе и "технаря", и "гуманитария"​».
Давай разберёмся, как в общем устроен процесс. Дата-журналистика включает несколько последовательных этапов, в каждом из которых есть свои хитрости:
ОТ ИДЕИ
ДО ПУБЛИКАЦИИ
Kaggle
Это платформа для анализа данных и машинного обучения, а также сообщество специалистов по Data Science.

Здесь можно изучать машинное обучение, писать свои и разбирать чужие прогнозные модели, участвовать в соревнованиях и общаться с дата-сайентистами.

Сервис полностью бесплатен. Kaggle используют и начинающие, и опытные дата-сайентисты со всего мира.
01
ИДЕЯ И ПОДГОТОВКА
  • ПРИДУМЫВАЕМ ТЕМУ
  • ДЕЛИМ ЕЁ НА ЧАСТИ
  • ФОРМУЛИРУЕМ ГИПОТЕЗУ
АНДРЕЙ
ДОРОЖНЫЙ
дата-журналист
«Если я найду в данных что-то, что зацепит человека и вызовет эмоцию — это работает лучше котиков. Если ты не попал в тему, всё остальное не имеет смысла. Заголовок должен качать. Если вам самим хочется это прочитать, значит можно делать»
ПРИДУМЫВАЕМ ТЕМУ
И ДЕЛИМ ЕЕ НА ЧАСТИ
Одну большую проблему очень удобно разбить на несколько подтем, в каждой из которых данные скажут что-то новое. Такой подход помогает избежать перегрузки читателя и поддерживает интерес: из подтем рождается драматургия, когда история развивается и постепенно подводит к главному выводу.
Темой может стать вопрос о социальной проблеме, экономике, экологии — главное, чтобы она заинтересовала аудиторию. Набрасываем рабочий план: какие данные понадобятся, что можно узнать из открытых источников. Простые тесты идеи (например, запрос «Росстат + ваша тема» или поиск Kaggle) покажут, есть ли уже нужная статистика.
АНДРЕЙ
ДОРОЖНЫЙ
дата-журналист
«Я завёл себе список из 10 тем. Примерно прикидываю, есть ли по ним данные. Проверяю за час — и отбрасываю, если пусто. Так я не теряю время на темы, из которых ничего не выйдет»
«А КАК ЭТО СДЕЛАТЬ?»
СПРОСИШЬ ТЫ НАВЕРНЯКА
КАК ОПРЕДЕЛИТЬ КАКУЮ ТЕМУ БРАТЬ, А КАКУЮ ОТБРОСИТЬ?
КАК СОЗДАТЬ успешную историю?
КАК ОРИЕНТИРОВАТЬСЯ
В ТЕМАХ?
Ты можешь опираться на исследования медиапотребления целевой аудитории. Чем больше ты знаешь о своей целевой аудитории, тем проще создавать релевантный и интересный материал. Подобную информацию о медиапотреблении можно найти в открытом доступе — на сайтах «Медиаскопа», МГУ или ВЦИОМа.
Чтобы сделать успешную историю, нужно тестировать ее актуальность. Если тебе самому не интересно, то скорее всего, и другим тоже не будет. Самый простой способ — задать вопрос своим подписчикам в соцсетях.
Подпишись на форумы / сообщества, где люди делятся вопросами и проблемами по определенной тематике. Анализируй, какие вопросы популярны, а какие нет. Старайся развивать насмотренность. 
КАК СФОРМУЛИРОВАТЬ
РАБОЧУЮ ГИПОТЕЗУ?
Гипотеза — это идея, которую ты хочешь проверить с помощью данных.

Например:
  • Тема: уровень безработицы в регионах России
  • Гипотеза: в регионах с высоким уровнем высшего образования уровень безработицы ниже

Это конкретный вопрос: «Правда ли, что образование снижает безработицу?» — и ответ на него можно проверить данными.
С помощью гипотезы можно сформулировать идею, которую
ты проверяешь, прежде чем превращать данные в визуализацию.
ВОТ, АЛГОРИТМ:

Есть ли статистика по аренде? По регионам? За нужный период?

Например: Если сравнить города до 500 тыс. населения и мегаполисы, то окажется, что рост аренды там выше.

Что-то увидел, услышал или заподозрил? Например: «Кажется, в небольших городах сильно выросли цены на аренду».

Исходи из наблюдения или проблемы
Проверь, можно ли это подтвердить или опровергнуть данными

Сформулируй в формате «если — то» или «связано ли, А с Б»

Журналисты часто добывают данные парсингом: судебные решения через скрипты, экспортом из соцсетей, выгрузкой API. К примеру, расследование о «ВИП-кочевниках» использовало открытый реестр государственных служащих (ЕГРСО), обработанный программным кодом​.
02
СБОР ДАННЫХ
  • ПОИСК ИНФОРМАЦИИ
  • ФИЛЬТРАЦИЯ СЫРЫХ ТАБЛИЦ
  • ПРОВЕРКА НА ОШИБКИ
СОБИРАЕМ ЦИФРОВУЮ
«СЫРУЮ ИНФОРМАЦИЮ»
АНДРЕЙ
ДОРОЖНЫЙ
дата-журналист
«Почему-то многие не любят Росстат, например, считая, что Росстат — шляпа полная. Я так не считаю, считаю, что Росстат — это гениальная организация. Росстат принимает данные от разных других ведомств, с другой стороны, делает собственные исследования, статистически довольно верные»
Источники могут быть разными:
  • Официальная статистика.
Не пугайся бюрократической формы: если сайт неудобен, стоит написать письмо в нужный департамент. Однако учти, что в большинстве случаев необходимо написать официальный запрос от лица журналиста, представителя общественной организации или академического сообщества.
  • Альтернативные источники.
Есть свободно доступные данные на порталах вроде Kaggle или World Bank. Журналисты часто добывают данные парсингом: судебные решения через скрипты, экспортом из соцсетей, выгрузкой по API.

Национальные

порталы

Региональные

ведомства

Коммерческие базы данных

Электронные

реестры

Опросы

Росстат

Официальная статистика

Альтернативные источники

ПРИМЕРЫ ИСТОЧНИКОВ:
ЧТО УЧИТЫВАТЬ
ПРИ СБОРЕ ДАННЫХ?
Данные — как грибы после дождя: может попасться белый, а может и поганка. Задача дата-журналиста — понять, что перед тобой, и не отравить читателя.

  • Актуальность — год выпуска и дата обновления данных. Да, цифры из 2017 года могут выглядеть красиво, но если ты хочешь говорить о том, что происходит сейчас, они тебе не помогут.
  • Полнота — есть ли все нужные показатели? Бывает, выкладывают красивую таблицу, но в ней половина значений — прочерки.
  • Структура — есть ли четкие заголовки столбцов, нормальный формат (csv, JSON)? Если тебе прислали скриншот с цифрами — это не данные.
  • Методология сбора — как эти данные получены? Если Росстат — то, скорее всего, всё хорошо. Если «опрос в телеграм-канале среди подписчиков» — надо быть осторожным.
КАК ОЦЕНИТЬ НАДЁЖНОСТЬ ИСТОЧНИКА?
  • Первичный это источник или нет? Лучше брать данные с официальных порталов (Росстат, Минфин, ЕМИСС, Открытые данные правительства РФ), чем с вторичных обзоров в блогах.
  • Есть ли у датасета документация или методология? Надежный источник всегда объясняет, как и зачем он собирает данные.
  • Известна ли организация? Если ты впервые слышишь про нее, проверь, что это вообще.
  • Можно ли проверить данные на другом ресурсе? Перекрёстная проверка — твой друг. Если цифры из неофициального источника совпадают с официальными данными — хорошо. Если нет — разбираемся.
КАК СОБРАТЬ ДАННЫЕ САМОМУ?
Данные можно собрать самостоятельно, а иногда и не просто можно, а иногда нужно. Вот несколько вариантов:

  • Парсинг сайтов — если данные где-то есть, но в неудобной форме (например, списки на сайте мэрии), можно использовать Python.
  • Запросы через API — многие сервисы, например, Telegram, дают открытый доступ к данным.
  • Официальные письма в госорганы (работает, но требует терпения).
  • Сбор через Google Forms, Typeform и др. — можно запускать опросы, главное — правильно формулировать вопросы.
«А КАК ЭТО СДЕЛАТЬ?»
СПРОСИШЬ ТЫ НАВЕРНЯКА
Как не ошибиться?
НА КАКИЕ ИСТОЧНИКИ ОПИРАТЬСЯ?
Всегда перепроверяй, откуда у тебя цифры. Лучше потратить день на верификацию, чем выложить красивую, но фейковую инфографику. Фактчекинг — одна из серьезных проблем в дата-журналистике. Статистику можно интерпретировать множеством способов, и без должной проверки легко исказить смысл данных.
Если ты боишься ошибиться, опирайся на источники, которым доверяешь ты сам и твоя целевая аудитория. Найди эксперта, который подтвердит твои доводы. Противостоять общественному мнению — дело непростое и часто неблагодарное. Даже если после публикации ты столкнешься с критикой или хейтом, это не обязательно значит, что твоя интерпретация была ошибочной.
03
ОЧИСТКА ДАННЫХ
  • УДАЛЕНИЕ ДУБЛИКАТОВ
  • ОБРАБОТКА ПРОПУЩЕННЫХ ЗНАЧЕНИЙ
  • СТАНДАРТИЗАЦИЯ ЗНАЧЕНИЙ
ЧИСТИМ, ЧИСТИМ,
ТРУБОЧИСТИМ...
Если ты открывал выгрузку из муниципальных открытых данных, то ты знаешь это чувство. Таблица весит 34 МБ, но при этом в ней:

  • даты в трех разных форматах;
  • десятичные дроби через запятую и точку;
  • скрытые сноски и ненужные строки с заголовками в середине таблицы;
  • дублирующиеся строки, случайные символы и «пустоты» с пробелами.

Очистка данных — это как монтаж звука в подкасте. Вроде никто не слышит, но если этого не сделать — слушать (или в нашем случае — анализировать и создавать историю) будет невозможно.
КАКИЕ ЗАДАЧИ РЕШАЕТ ОЧИСТКА ДАННЫХ?
УДАЛЕНИЕ ДУБЛИКАТОВ
ПОИСК И ОБРАБОТКА ПРОПУЩЕННЫХ ЗНАЧЕНИЙ
СТАНДАРТИЗАЦИЯ ФОРМАТОВ
ОЧИСТКА МУСОРА ИЗ СТРОК
ПЕРЕИМЕНОВАНИЕ СТОЛБЦОВ
Даже один дубликат может исказить финальную визуализацию, особенно при подсчете среднего значения или медианы.
  • В Excel или Google Sheets можно использовать встроенные функции «Удалить дубликаты».
Важно: сначала проверяй, что дубликаты действительно лишние — иногда повторяющаяся запись может означать реальный случай.
  • Заполнить пропуски средним/медианой, если это допустимо
Средним значением, если данные без сильных выбросов (например, возраст, рост, температура, расходы), а доля пропусков не превышает 10%.
Если есть выбросы — например, в доходах, времени отклика, то лучше использовать медиану. Она устойчивее к экстремальным значениям.
  • Исключить строки с пробелами
  • Или заменить на «N/A» и аккуратно визуализировать
Даты: 01.01.2024, 1 января 2024, 2024/01/01 — всё это может быть
в одном файле. Числа: 3.500, 3,500,
3 500, 3500 — и всё это может означать одно и то же. Необходимо привести всё к единому виду: даты — в ISO (2024−01−01), числа — с одной системой разделения.
  • В Excel или Google Sheets легко можно применить «Формат/форматирование ячеек» и привести все к единому виду.
  • пробелы в начале/конце строки
  • непечатаемые символы (невидимые теги, неразрывные пробелы)
  • переносы строк внутри ячеек
Назови всё понятно и однозначно: Год, Регион, Число безработных,
Доля женщин — так, чтобы ты сам понял через неделю.
ПОЧЕМУ ОЧИСТКА ТАК КРИТИЧНА?
Неочищенные данные — это всегда риск для анализа. Если материал «грязный», то любые выводы будут строиться на сомнительной основе. В результате журналист работает не с реальной картиной, а с искаженным отражением.

Отдельная проблема — визуализация. Даже небольшие ошибки в данных могут «поехать» на графиках, особенно если использовать автоматические сервисы вроде Datawrapper, Flourish или Tableau. Диаграммы будут выглядеть некорректно, а это сразу подрывает доверие к материалу.

Именно поэтому очистка — это не просто подготовительный этап, а гарантия того, что история на данных будет убедительной и честной.
04
АНАЛИЗ ДАННЫХ
  • ПЕРЕПРОВЕРЯЕМ СЕБЯ
  • МЕТОДЫ АГРЕГАЦИИ
  • ПОИСК ВЗАИМОСВЯЗЕЙ
ПЕРЕПРОВЕРКА
ЛУЧШЕ, ЧЕМ НЕДОВЕРКА
АНДРЕЙ
ДОРОЖНЫЙ
дата-журналист
«Мне не важно, сколько данных — 100 тысяч строк или 1 миллион. Важно, чтобы данные решали задачу. Важно, чтобы они помогали рассказать нужную историю»
Когда исходная таблица очищена, наступает время анализа. Здесь данные начинают «говорить» и превращаться в историю. Важно не просто посчитать цифры, а понять их контекст и достоверность. Для этого нужно понимать, на чём строится твой анализ и какие решения ты принимаешь до того, как начнёшь считать и визуализировать.
Подготовка и анализ данных занимает большую часть всего времени проекта
Прежде чем строить таблицы и делать выводы авторы книги Data Yoga советуют еще раз все перепроверить и задать себе следующие вопросы:

  • Какой источник данных я использую? Есть ли к ним доступ? Кто владелец этих данных?
  • Что является основной единицей наблюдения — человек, регион, сделка, день?
  • Уникальны ли данные для каждой записи, или они повторяются во времени?
  • Нужны ли мне детальные данные, или можно агрегировать их до более высокого уровня — например, не по каждому дню, а по месяцам?
  • Как часто обновляется источник? Хватит ли мощности инструмента, чтобы анализировать весь объем?
Знакомство с данными
— это как первая встреча
с героем будущей истории
Пройди по таблице, посмотри, какие значения встречаются; сделай несколько черновых визуализаций, посмотри где выбросы или аномалии. Полезно записывать свои наблюдения — потом это поможет тебе (или коллегам) быстрее разобраться, почему ты принял те или иные решения.

Когда данных много, важно научиться их сжимать — искать закономерности, а не разглядывать каждую строку. Здесь помогают методы агрегации и меры центральной тенденции:

  • сумма — показывает общий объем (например, суммарное количество безработных в регионе);
  • среднее — помогает понять общую картину или сравнить одну категорию с другой;
  • медиана — показывает реальную «середину» распределения, не давая выбросам исказить картину;
  • минимум / максимум — позволяют увидеть крайние значения;
  • количество — сколько раз встречается то или иное значение;
  • дисперсия и разброс помогают понять, насколько данные однородны. Например, два региона могут иметь одинаковый средний доход, но совершенно разный «разброс» зарплат внутри;
  • мода — значение или значения, которые встречаются в наборе данных чаще всего.
КОГДА СЛОВА СТАНОВЯТСЯ ЧИСЛАМИ?
Для простого анализа достаточно Google Sheets или Excel: сводные таблицы, фильтры, условное форматирование. Для больших наборов данных — Python (пакеты pandas, matplotlib). Главное: начинай с простого. Даже одна сводная таблица может раскрыть историю, если правильно задать вопрос.

Для текстовых данных ты не можешь посчитать сумму, зато можешь узнать, сколько раз упоминается слово или категория — это тоже форма агрегации. Речь о контент-анализе — методе систематизации и количественной оценки содержания текстов и медиаматериалов для выявления частотности тем, слов или их сочетаний.
АНДРЕЙ
ДОРОЖНЫЙ
дата-журналист
«У нас есть табличный редактор. Неважно, чем вы пользуетесь, Google таблицами или Excel. Это лучший инструмент для работы с данными»
КАК НАЙТИ СВЯЗЬ МЕЖДУ ПЕРЕМЕННЫМИ?

Когда ты переходишь от простых подсчетов к поиску смыслов, начинается самое интересное — поиск связей между переменными. Иногда кажется, что один показатель влияет на другой: например, чем выше уровень образования, тем ниже безработица. Но это нужно проверить с помощью анализа зависимостей. Самые распространённые методы здесь — корреляционный, дисперсионный и регрессионный анализ.

01
02
03
Корреляционный анализ
Корреляция помогает понять, связаны ли два показателя вообще. Если зависимость есть, ты видишь, как они «движутся» вместе — например, рост цен может сопровождаться ростом спроса, но это еще не доказывает, что одно вызывает другое. Корреляция показывает связь, а не причину.
Дисперсионный анализ
Дисперсионный анализ нужен, когда ты сравниваешь несколько групп и хочешь узнать, влияет ли один фактор на другой. Отличаются ли уровни безработицы в регионах с разной долей промышленности? Метод помогает проверить, действительно ли различия статистически значимы, а не случайны.
Регрессионный анализ
Он показывает, насколько сильно один фактор влияет на другой. Это попытка построить модель зависимости: если доход увеличивается на 10%, то насколько изменится потребление? Такие модели позволяют предсказывать тенденции. Это важно, чтобы показать, как цифры становятся историей.
ПОРА ПРОВЕРИТЬ ГИПОТЕЗУ!
Если данные подтверждают твою идею — отлично, у тебя есть история, основанная на фактах. Если нет — тоже хорошо: значит, ты открыл, что ситуация сложнее, чем казалось. В дата-журналистике не страшно «ошибиться» в гипотезе. Главное — честно показать путь, по которому ты к выводу пришёл.
Гипотеза проверяется тогда, когда ты сравниваешь группы, показатели или периоды и смотришь — есть ли закономерность. Например, если ты предположил, что в регионах с высоким уровнем образования безработица ниже, нужно сравнить показатели по этим регионам и увидеть, действительно ли разница существует.
АНДРЕЙ
ДОРОЖНЫЙ
дата-журналист
«Если у тебя есть гипотеза, а данные должны ее подтверждать, то всегда будь готов к тому, что результат может быть не таким, как ты ожидал»
Почему правильно интерпретировать данные очень важно?
Любая дата-история строится на интерпретации чисел. Но если ты не понимаешь, что именно считаешь, легко попасть в ловушку «средней температуры по больнице». Например, при анализе зарплат корректнее брать медиану, а не среднее арифметическое — так результат будет отражать реальную ситуацию, а не искажаться из-за доходов топ-менеджеров.

Хороший дата-журналист — это не просто человек, умеющий делать графики. Это человек, который понимает структуру данных, умеет задавать им вопросы и знает, как избежать ошибок анализа.
05
ЦИФРЫ
В КАРТИНКУ
  • ВИДЫ ВИЗУАЛИЗАЦИЙ
  • ПРИЗНАКИ ХОРОШЕЙ ИНФОГРАФИКИ
  • КАК ВЫБРАТЬ?
КАРТИНКА – ЭТО
ВИЗУАЛИЗАЦИЯ ДАННЫХ
АНДРЕЙ
ДОРОЖНЫЙ
дата-журналист
«Визуализация — это кодирование вербальной информации в виде графика. Четыре вида графиков, которые понимают все: кружочек, линия, столбики и карта»
Для журналиста визуализация — это инструмент, который делает историю ясной и убедительной: данные перестают быть абстрактными значениями и начинают работать как аргументы. Главная задача журналиста — не просто пересказать цифры, а правильно их структурировать. Визуализация помогает увидеть закономерности и донести их до читателя.

Какие виды визуализаций существуют в дата-журналистике?
Ключевой инструмент в журналистике данных — инфографика. В маркетплейсах под этим словом подразумевается картинка товара с его ценой, но мы сейчас о другом. В журналистике инфографикой называют представление статистической информации через графики, диаграммы, временные шкалы и карты. По мнению М. М. Живейновой, именно инфографика является главным инструментом дата-журналистики.

У каждого вида визуализации есть своя задача. Чтобы график «работал» на историю, важно выбирать формат по смыслу. Как отмечает Андрей Дорожный, есть четыре базовых типа, которые понимают все: кружочек, линия, столбик и карта. Если говорить академично — пайчарт, линейный график, столбиковая диаграмма и геовизуализация. Эти формы — универсальный язык данных.
Круговая диаграмма
Пайчарт помогает показать доли и соотношения внутри целого. Она наглядна, когда данных немного, и важно показать, какую часть занимает каждый элемент. Например, структура расходов бюджета региона или распределение занятости по отраслям.
Линейный график
Он используется для отображения изменений во времени. Это идеальный инструмент, если нужно показать динамику — рост, спад, сезонные колебания. Например, изменение уровня безработицы по месяцам или динамику цен на жилье.
Столбиковая диаграмма
Барчарт позволяет сравнивать категории между собой. Она хорошо подходит, если ты хочешь показать, где значения выше или ниже. Например, сравнить уровень доходов в разных регионах или долю выпускников, поступивших в вузы.
Геовизуализация
Это способ визуализировать пространственные данные. Карта помогает увидеть территориальные различия и тенденции, которые сложно заметить в таблице. Например, распределение безработицы по регионам или плотность населения в городах.
КАК СДЕЛАТЬ КРУТУЮ ВИЗУАЛИЗАЦИЮ?
Главное правило — не перегружай визуализацию деталями.
Один график должен четко отвечать на один вопрос. Если зритель понимает, в чём идея, уже через несколько секунд — значит, визуализация получилась удачной.

Признаки хорошей инфографики:
  • схематичность и простота;
  • ясность, точность, лаконичность, вовлеченность аудитории;
  • прозрачность. Источники должны быть указаны, чтобы читатель мог проверить данные.

Каждый из четырех видов визуализации можно использовать отдельно или комбинировать, но в центре всегда остается одно: визуализация должна усиливать историю, а не усложнять ее.
КАК ВЫБРАТЬ ПРАВИЛЬНЫЙ
ТИП ГРАФИКА?
График — это инструмент, и у каждого типа есть своё предназначение. Функция определяет форму: не существует универсального графика, но всегда есть правильный под задачу.

Самый эффективный способ — ориентироваться на функцию графика, а не на его форму. В этом вам поможет «Каталог визуализации данных», где собраны все распространенные виды визуализаций.
06
ИСТОРИЯ
В ДАННЫХ
  • КАК СОЗДАТЬ НАРРАТИВ
  • ЗАГОЛОВОК ПО ТЕМЕ
  • ВАЖНЫЕ ЭЛЕМЕНТЫ СТОРИТЕЛЛИНГА
СТОРИТЕЛЛИНГ — ЭТО
ИСКУССТВО СЛОВА
АНДРЕЙ
ДОРОЖНЫЙ
дата-журналист
«Цифры — это не просто сухие данные. Это способ рассказать что-то, что иначе мы не могли бы проверить. Например, где живут самые богатые или бедные в стране — этого глазами не увидишь, но цифры могут это показать»
Сторителлинг — это искусство превращать информацию в историю, которая захватывает и объясняет. В журналистике данных он выполняет особую роль: задача журналиста не просто показать цифры или графики, а выстроить вокруг анализа полноценный нарратив. Каждая цифра, каждый показатель должны работать на сюжет: объяснять, выявлять закономерности, акцентировать внимание на главном.
С ЧЕГО НАЧАТЬ
И ЧЕМ ЗАКОНЧИТЬ?
Один из классических способов построить материал — перевёрнутая пирамида. Сначала ты даёшь самое важное — суть истории, главный факт или вывод. Затем добавляешь детали и объяснения, раскрываешь контекст, а уже после приводишь дополнительные данные и нюансы. Такой подход особенно полезен, если твоя аудитория спешит и хочет быстро понять, «о чём история».

Но в дата-журналистике часто работает и другой подход — постепенное раскрытие. Здесь история строится по принципу исследования: сначала возникает вопрос или гипотеза, а дальше ты шаг за шагом раскрываешь сюжет через данные. Читатель движется вместе с тобой — от наблюдения к выводу. Этот способ ближе к классическому сторителлингу, где есть завязка, развитие, кульминация и финал.
Перед началом работы стоит решить, какую траекторию будет проходить твой читатель. Ты можешь начать с готового вывода и показать, как данные к нему привели — или наоборот, постепенно подводить к открытию. Первый вариант сработает, если важно быстро донести идею; второй — если хочешь вовлечь аудиторию в процесс поиска и удивить финалом.

При этом важно помнить о визуальной стороне рассказа. Используй принцип Data-ink ratio — соотношение информации к оформлению. Чем больше «чернил» уходит на смысл, а не на украшения, тем чище и честнее выглядит визуализация. Но в журналистике допустимо немного больше выразительности: если история требует эмоций — добавь метафору, цвет или образ. Главное, чтобы это помогало истории, а не отвлекало от неё.
КАК ЖЕ ПРАВИЛЬНО
СОСТАВИТЬ ЗАГОЛОВОК,
ОТРАЖАЮЩИЙ ТЕМУ?
Плохой заголовок

«Статистика производства картофеля в России». Ты его читаешь — и остаешься на том же месте, где был. Он ничего не даёт.

Дата-журналистика — это прежде всего журналистика.
Без интересной темы и захватывающего начала не получится создать действительно сильный материал. Красивая визуализация — это лишь половина успеха; вторая половина зависит от того, насколько ваша тема актуальна и отвечает на запросы аудитории.

Заголовок в формате вопроса — лучший для публикации. Ты сразу даешь понять и себе, и аудитории, на какой именно вопрос ты отвечаешь.

«А вы знаете, сколько на самом деле стоит картошка?» — это хук. Сразу хочется узнать, а значит — работает.

Хороший заголовок
Что еще важно при создании нарратива?
В центре истории всегда человек или явление. Данные здесь — герои-сыщики, которые помогают раскрыть сюжет. Они показывают закономерности, объясняют тенденции, но не вызывают эмоций. Чтобы твой материал не остался просто набором цифр и графиков, обязательно добавляй человеческий голос — реальные истории и мнения экспертов.

Герои
Реальные люди помогают читателю увидеть взаимосвязь данных и жизни. Через их опыт цифры обретают смысл. История без героя может быть точной, но останется холодной. Герой — это проводник: он помогает понять, как статистика отражается в жизни, что стоит за процентами, графиками и динамикой. Человеческий взгляд превращает факты в историю, к которой можно сопереживать. 
Эксперты
Если ты только начинаешь в дата-журналистике, важно понять: эксперт — это не обязательно профессор с регалиями. Это человек, который глубоко разбирается в теме. Например, если ты делаешь материал о медицинской статистике — это может быть старший сотрудник больницы или аналитик из Минздрава. Главное — чтобы человек понимал процесс изнутри и мог объяснить, как цифры связаны с реальностью.
Где искать экспертов? Начни с открытых источников — университетов, исследовательских центров, НКО, профессиональных сообществ. В социальных сетях можно найти специалистов, которые пишут о своей теме, например аналитики или независимые эксперты. Также можно обращаться к профильным ведомствам или организациям — у них часто есть пресс-службы, которые готовы предоставить комментарий.


АНДРЕЙ
ДОРОЖНЫЙ
дата-журналист
«Просто берешь скучную статистику, например, число предпринимателей по регионам — и находишь объяснение: „Ага, льготная налоговая ставка — вот почему в Калмыкии резкий рост!“»
Не нужно включать всё, что удалось собрать. Отбирай данные, которые помогают раскрыть твой главный тезис. Каждая история должна вести читателя к осмысленному заключению, подтверждённому данными. Сторителлинг помогает упаковать факты в логичный, убедительный рассказ, где читатель понимает не только «что», но и «почему».
Графики, карты, диаграммы становятся частью нарратива, а не отдельной иллюстрацией. Они должны отвечать на вопрос «зачем этот визуальный элемент здесь» и показывать ключевую мысль. Сначала задай себе вопросы: что действительно ценно для моих читателей? Какие из этих данных способны что-то изменить в их восприятии?
Как понять, стоит ли делать дата-сторителлинг?
Издание The Pudding, известное своими яркими и необычными дата-историями, разработало простой способ определить, есть ли смысл создавать материал на основе данных.

Прежде чем приступать к работе, полезно задать себе несколько вопросов:
  • Есть ли у тебя уникальный или свежий вопрос, на который ты можешь ответить?
  • Можно ли этот вопрос проанализировать с помощью данных?
  • Есть ли возможность получить нужные данные для анализа?
  • Получились ли результаты исследования интересными и значимыми для аудитории?

Для каждого шага The Pudding приводит наглядные примеры своих проектов — их изучение помогает понять, как идеи превращаются в полноценные дата-истории.
07
ПУБЛИКАЦИЯ И «КУХНЯ»
  • ОПЯТЬ ПЕРЕПРОВЕРКА
  • КАК ИЗБЕЖАТЬ ОШИБОК
  • ТЕСТ: КАКОЙ ТЫ ЖУРНАЛИСТ
перепроверка перед финалом
На финальном этапе ты готовишь материал к выходу. Научная честность важна: проверьте цифры, пересчитайте результаты, дайте коллегам взглянуть на логику повествования, попросите комментарий у эксперта. Многие издания практикуют публикацию исходных данных и методологии (так читатели могут воспроизвести расчёты). Это вызывает доверие, но при этом будь готов к вопросам — некоторые методы могут показаться сложными широкому кругу читателей, и это нормально​.

Скорректируй заголовок, он может призывать к открытию «скрытой» правды через цифры: например, «Почему каждый третий волгоградец экономит на еде: данные Росстата» (где «каждый третий» — перевод из таблицы).

Решите заранее, как опубликуете: интерактивный лонгрид, статический график в онлайн-СМИ или карусель картинок в соцсетях. Технические ограничения подскажут вам, насколько интерактивным может быть график. Возможно, понадобится упаковать несколько таблиц в одну диаграмму или наоборот: разбить сложный сюжет на серию мини-графиков.
Распространенные ошибки
и как их избежатЬ
Новичкам (да и профи) важно знать, чего лучше не делать:

  • Игнорировать проверку данных. В спешке можно неправильно объединить таблицы или запутаться в исходниках, в данных появятся ошибки. Избежать этого помогает двойная проверка: можно попросить кого-то перепроверить расчеты или просмотреть данные вручную, если где-то ты видишь неожиданный результат. Учись думать как «детектив»: если результат кажется сомнительным, обязательно выясняй, почему.
  • Искажение графика ради «кликбейта». Классика жанра: обрубить ось графика, использовать 3D-диаграммы и лишние «украшения». Все это затрудняет понимание графика. Если хочешь привлечь взгляд, лучше сделай интерактив или используй яркие цвета, но числа (начиная с нуля) всегда должны быть под осью.
АНДРЕЙ
ДОРОЖНЫЙ
дата-журналист
«Самая большая ошибка — это неправильный выбор темы. Все остальное можно исправить, но плохая тема никогда не спасет проект»
  • Сложная инфографика — хорошо, но не всегда уместно. Если аудитория не понимает результат, то цель не достигнута. Всегда начинай с пробного чтения: покажи коллегам или друзьям график, спроси, что они видят. Если отвечают «похоже на диаграмму», а не на содержание, схему стоит упростить. Особенно будь осторожен с 3D- и круговыми диаграммами с большим количеством секторов. Людям сложнее сравнивать площади секторов, чем площади прямоугольников, поэтому много секторов в пайчарте делать не нужно. Лучше сделать много прямоугольников в барчарте.
  • Ломаться над любыми данными. Иногда ты просто не найдешь в наборе данных никакой интересной истории — и это нормально. Не тратьте бессмысленно время на «добычу» сообщения из пустышки. Лучше переключитесь на проверку другой гипотезы или другой источник.
  • Нарушать этику и приватность. Данные бывают личные: например, номера паспортов или частные реестры. Уважайте закон о персональных данных — и всегда обезличивайте информацию. Лучше перестраховаться и не разглашать лишнего, чем получить штраф или судебный иск.
АНДРЕЙ
ДОРОЖНЫЙ
дата-журналист
«Журналистика активно конкурирует с блогингом и контентом. Официальные медиа, такие как „Коммерсант“, РБК, „Ведомости“, будут продолжать существовать, но они изменят свою роль. Журналистика растворится в обычной журналистике, и навыки журналиста должны расширяться. Навык нарисовать график или собрать данные станет таким же важным, как и умение писать текст. Журналист, который не будет умеет делать этого, будет получать 20 рублей»
Помните: каждый опытный дата-журналист когда-то пробовал то же самое с нуля. В современном мире, где технологии внедряются в многие сферы, дата-журналистика предлагает быть «мостом» между цифрами и читателем. Она требует немного усилий, но даёт гораздо больше — глубокое понимание проблем.
КАКОЙ ТЫ ДАТА-ЖУРНАЛИСТ?
И напоследок небольшой тест, чтобы закрепить базу в шутливой форме!
Начать
Что такое дата-журналистика?
Правильно!
Дальше
Проверить
Узнать результат
На диаграмме Y-ось резко обрезана (урезается в начале) — это…
Правильно!
Дальше
Проверить
Узнать результат
Столбчатая диаграмма подходит, если нужно…
Правильно, но... Для времени лучше подойдет линейный график, однако для отображения короткого периода могут подойти и «столбцы»
Правильно! Столбцы отлично показывают разные группы
В этом случае лучше использовать круговую диаграмму
Дальше
Проверить
Узнать результат
Что делать, если не можете добыть данные из официальных источников?
Так делать не стоит!
Дальше
Проверить
Узнать результат
Самая главная цель дата-журналистики — это…
Конкурсы — это так, дополнение ;)
Дальше
Проверить
Узнать результат
Ты кот-лапотник
Главное — не останавливаться и учиться! Не волнуйся, если ответил на тест не идеально — ошибки случаются у всех. Начни с одной маленькой истории, и со временем цифры перестанут быть страшными.
Пройти еще раз
Ты кот-незнайка
Главное — не останавливаться и учиться! Не волнуйся, если ответил на тест не идеально — ошибки случаются у всех. Начни с одной маленькой истории, и со временем цифры перестанут быть страшными.
Пройти еще раз
Ты кот-студент
Грызешь гранит науки, но не со всей силой. Главное — не останавливаться и учиться! Не волнуйся, если ответил на тест не идеально — ошибки случаются у всех. Начни с одной маленькой истории, и со временем цифры перестанут быть страшными.
Пройти еще раз
Ты кот-хорошист
Почти идеально! Молодец! Отдохни немного и снова за учебу.
Пройти еще раз
Ты кот-ботаник
Ты прекрасен на все 100%! Поздравляем! Отдохни, а потом снова грызть гранит науки.
Пройти еще раз
ПОДБОРКА МАТЕРИАЛОВ
Чтобы не останавливаться на теории, мы собрали подборку источников, которые помогут тебе глубже разобраться в дата-журналистике. Здесь — книги, телеграм-каналы и проекты, где можно подсмотреть приёмы, вдохновиться примерами и научиться работать с данными на практике.
Проект подготовлен под руководством доцента кафедры журналистики и медиалингвистики ИФиЯК СФУ Дарьи Александровны Устюжаниной.
Выражаем благодарность за помощь в подготовке проекта Андрею Дорожному,
дата-журналисту и специалисту по визуализации данных, старшему преподавателю факультета медиакоммуникаций НИУ ВШЭ.
Эксперт проекта:
Андрей Дорожный
Автор проекта:
Мария Отливникова
ИСТОЧнИКИ ПРОЕКТА
  1. Орлова К. Беседа дата-журналистов в Clubhouse: «В любой непонятной ситуации делайте дата-арт» / К. Орлова // Информационная культура: [сайт]. — 2021. — 4 марта. — URL: https://www.infoculture.ru/2021/03/04/data-journalists-in-clubhouse/ (дата обращения: 13.09.2025).
  2. Грегори Р. Л. Разумный глаз / Р. Л. Грегори ; перевод с англ. А. И. Когана. — Москва : URSS, 2003.
  3. Авилочкина, Д. Журналистика данных в Российских расследовательских СМИ (На примере «Новой газеты» / Д. Авилочкина // Журналистика в современном медиапространстве: глобализация, конвергенция, мультимедийность : материалы ХVIII Международной научно-практической интернет-конференции / Тамбовский государственный университет имени Г.Р. Державина. — Тамбов, 2020. 
  4. Симакова, С. И. Инфографика: визуализация цифрового контента / С. И. Симакова // Вестник Волжского университета им. В.Н. Татищева. – 2012. – № 3(10). – С. 219-226.
  5. Живейнова, М. М. Картография как способ визуализации данных в материалах информационных сайтов / М. М. Живейнова // Дизайн СМИ: тренды XXI века. – 2016. – С. 38–42.
  6. Лаптев, В. В. Инфографика: основные понятия и определения / В. В. Лаптев // Terra Linguistica. – 2013. – C. 180–187.
  7. Симакова, С. И. Таймлайн как средство визуализации данных / С. И. Симакова // Сборник трудов конференции «Профессиональная культура журналиста цифровой эпохи». – 2017. – С. 80–82. 
Made on
Tilda