Термин «журналистика данных» сейчас у многих на слуху – по крайней мере, в таких развивающихся странах, как Пакистан.
Благодаря инициативам, включающим открытое правительство, открытые данные,закон о праве на получение информации(RTI) и закон солнечного света, в развивающихся странах граждане получают все больше доступа к данным.
Существует также широкий спектр бесплатных, простых в использовании онлайн-инструментов для работы с наборами данных, позволяющих по-новому рассказывать истории. Они открывают ранее недоступные возможности для журналистов даже в таких местах, где у редакций нет ресурсов или желания для создания больших команд, работающих в журналистике данных. Все, что нам нужно сделать, – это научиться использовать эти инструменты.
Что такое журналистика данных?
Одно из моих любимых определений журналистики данных принадлежит редактору данных Google Саймону Роджерсу, который написал: «Журналистика данных – это способ использования чисел для того, чтобы как можно лучше рассказывать истории. Она не имеет отношения к математике или рисованию графиков или даже к написанию кода. Она, прежде всего, относится к историям – и математика, и графики, и код – все служит этой цели».
Понимание этого в большой степени способствует снятию нерешительности и страха, которые некоторые журналисты испытывают, впервые приступая к работе над материалом в жанре журналистики данных. Конечно, для работы над некоторыми журналистскими проектами, использующими большие наборы данных, нужны команды, состоящие из нескольких человек: журналистов, разработчиков и программистов. Но и один журналист может довольно много сделать, используя простой анализ данных, чтобы по-новому рассказать историю. Безусловно, мы видим и очень сложные материалы в жанре журналистики данных, но это не должно пугать новичков. В конце концов, речь идет о придании данным значения и о возможности рассказать историю, стоящую за цифрами.
Поиск и извлечение данных
Несмотря на принятие закона о праве на получение информации и на возможность получения большей информации о деятельности правительств, доступ к данным остается проблемой для журналистов. Часто онлайн-данные хранятся, например, в PDF-файлах, и журналистам трудно получить к ним доступ. Но технологии помогают нам конвертировать такие файлы в электронные таблицы.
Одно из самых простых мест, с которого можно начать поиск наборов данных, – это статистический офис Организации Объединенных Наций по вопросам образования, науки и культуры (ЮНЕСКО). Вы можете загружать наборы данных по разным странам или по четырем основным темам – образование, наука и инновации, культура и коммуникации.
Для извлечения данных из PDF-файлов и перевода их в форматы CSV и Excel можно использовать хороший бесплатный инструмент Tabula. Другой бесплатный инструмент Online OCR может также извлекать текст из PDF-файлов и конвертировать данные в форматы Excel и Word. Инструмент распознает до 46 языков (полный список языков можно найти здесь).
Не стоит недооценивать силу Excel
Несмотря на появление множества других инструментов, Microsoft Excel остается мощным средством для анализа и визуализации данных. В Интернете можно найти полезные бесплатные обучающие материалы, например, этот (или этот), которые помогут начинающим журналистам данных научиться сортировать и фильтровать наборы данных и сводить их в общие таблицы. Люди, отдающие предпочтение видео, могут также найти бесплатные видеоуроки. Будьте терпеливы к себе и получайте удовольствие от поиска новой информации и обучения. Золотое правило гласит: начинайте с малого.
Визуализация данных и сторителлинг
В дополнение к сортировке и фильтрации наборов данных, журналисты могут использовать визуализацию для выявления ранее незаметных тенденций и закономерностей, скрытых в цифрах. Excel позволяет создавать простые визуализации, но существует много других бесплатных инструментов, которые можно использовать, работая над журналистскими материалами.
Один из таких инструментов – необыкновенно простой сервис для графического дизайна Canva. Для его использования не нужно иметь опыт в графическом дизайне. Google Fusion Tables – также удивительное и простое в использовании приложение для визуализации данных, оно хорошо подходит для начинающих, так же, как и Infogr.am. Pixel Map – еще одно приложение, которое подходит для журналистов онлайновых и печатных медиа.
Мы используем эти инструменты, чтобы представить аудитории привлекательные и интересные истории. Всегда имейте в виду, что основы журналистики остаются теми же, независимо от того, используете ли вы данные.
Другие советы
Другой способ получить навыки в журналистике данных – посещение бесплатных Массовых открытых онлайн-курсов (MOOC), которые предлагают различные организации. Кроме того, Глобальная сеть расследовательской журналистики (GIJN) предлагает список ресурсов по журналистике данных.
И обратите внимание на этот справочник по журналистике данных.
Пакистанский журналист, сотрудник The News International Халид Хаттак живет и работает в Лахоре. Больше узнать о нем можно на его веб-сайте Data Stories, который он открыл в прошлом году, чтобы рассказывать о работе с данными и использовании их в журналистских материалах.
Хаттак запустил Data Stories после посещения тренинга по работе с данными в Центре передового опыта в области журналистики в Карачи, который был организован совместно сМеждународным центром для журналистов и включал семинар стипендиата программы ICFJ Knight Шахерьяра Попалзаи.
Основное изображение Chris Khamken, лицензия CC сайта Flickr.