Что такое сторителлинг данных?

Что такое сторителлинг данных Изучение

Каждый день большие и малые бизнес-решения принимаются на основе данных. И сегодня у нас больше данных, чем когда-либо прежде. От Fitbits до спутников у нас есть доступ к огромному количеству сложных наборов данных, широко называемых большими данными.

Чтобы делать выводы из всех этих данных и извлекать из них полезную информацию, бизнес-лидеры и лица, принимающие решения, обращаются к специалистам по науке о данных, которые используют передовые технологии и методы для анализа и интерпретации этих данных. Затем специалисты по науке о данных должны передать свои выводы руководству, чтобы они могли принимать решения на основе данных.

На этом этапе перевода часто могут возникать проблемы. Причина, по которой вас может удивить: плохое повествование. Вот Forbes о важности рассказывания историй в науке о данных : «Многие из активно набираемых людей с учеными степенями в области экономики, математики или статистики испытывают трудности с эффективным донесением своих идей до других — по сути, рассказывая историю своих чисел».

Рассказывание историй было определено как один из самых важных нетехнических навыков для специалистов по данным, и компании повышали квалификацию своих специалистов по данным, чтобы научить их навыкам рассказывания историй на основе данных.

Если вы рассказчик, вы уже обладаете одним из самых важных нетехнических навыков в науке о данных. Если вы специалист по данным, навыки рассказывания историй о данных будут иметь решающее значение, чтобы помочь вам вносить изменения и доносить бизнес-аналитику до вашей аудитории.

Специалист по данным, рассказчик данных

Не каждая роль в науке о данных требует навыков рассказывания историй, но те, которые передают ключевую информацию из анализа данных лицам, принимающим решения, делают это. В большинстве случаев роль специалиста по обработке и анализу данных заключается в том, чтобы донести эти ключевые идеи до заинтересованных сторон.

Чтобы извлечь ценную информацию из сложных наборов данных, специалисты по данным используют множество технических инструментов, таких как код, статистический анализ и алгоритмы машинного обучения. Однако, чтобы эффективно донести свои выводы до своей аудитории, они должны сообщить их таким образом, чтобы их аудитория могла их понять.

Эксперты по данным должны исходить из того, что их аудитория не разделит их технических знаний в области науки о данных. Фактически, техническое резюме их выводов может быть полностью потеряно при переводе. Вместо этого эксперты по данным могут эффективно сообщать о своих выводах, представляя их в виде истории данных — истории, рассказанной для сообщения выводов и практических идей, обнаруженных в данных.

Истории необходимы для управления действиями, основанными на данных, по многим причинам, две из которых:

  • Рассказы лучше запоминаются, чем цифры
  • Истории могут вызывать эмоции у читателя, а цифры — нет.

Последний пункт важен, так как нейробиология доказывает нам, что большинство решений движимы эмоциями, а не логикой.

Книга Made to Stick иллюстрирует власть повествования над числами. В одном примере он иллюстрирует, как некоммерческая организация Beyond War преодолела безразличие людей, услышав статистику о том, сколько существует ядерного оружия и сколько детей оно может убить. Однако им удалось найти способ достучаться до людей, организовав демонстрации, которые через звук передавали разрушительное воздействие всего этого ядерного оружия.

Неспособность представить данные в виде истории угрожает способности убедить аудиторию действовать. И цена неудачного рассказывания историй о данных может быть трагической.

Один неудачный пример неудавшегося повествования на основе данных можно найти в истории Игнаца Земмельвайса. Земмельвейс был акушером, который решил выяснить, почему в одной из родильных клиник, в которых он работал, наблюдался высокий уровень смертности среди поступивших матерей. В то время эти смерти понимались как состояние, известное как родильная горячка (сегодня мы знаем, что причиной была плохая гигиена).

Читайте также:  Вызов Golang

Земмельвейс внимательно наблюдал за своей проблемой и предположил, что потенциальное решение будет заключаться в том, чтобы все врачи мыли руки перед работой в родильном доме. Он ввел политику мытья рук, которая, конечно же, привела к резкому снижению смертности от родильной горячки (включая несколько месяцев, когда вообще не было).

Однако решение Земмельвейса просуществовало недолго. Многие студенты-врачи пренебрегли политикой. В конце концов, врачи приняли политику мытья рук на свой счет, и возникшая в результате драма не только стоила Игнацу его положения, но, что более важно, жизни многих других матерей, поскольку послеродовая лихорадка вернулась в клинику в полную силу.

Брент Дайкс внимательно изучил этот исторический случай, чтобы извлечь важные выводы о важности рассказывания историй на основе данных.

По словам Дайкса, Земмельвайс упустил некоторые из эффективных практик рассказывания историй на основе данных :

  • Использование эффективных визуализаций для иллюстрации данных (он использовал таблицы данных, но мог бы использовать графики для демонстрации тенденций роста и снижения)
  • Быть внимательным к знаниям аудитории (если бы он встретил их там, где они были, он мог бы помочь прояснить недоразумения и донести свое сообщение)

И, что немаловажно, размышляет Дайкс: «Одна из самых больших ошибок, допущенных Земмельвейсом, заключалась в том, что он не смог рассказать историю с помощью своих данных. Одна только интересная статистика не убедит скептиков… Представьте, если бы он смог заставить своих коллег-акушеров подумать о своих собственных матерях и той важной роли, которую они сыграли в их жизни».

Данные не говорят сами за себя, и именно поэтому мы должны представить их в виде историй, чтобы действительно оказать влияние.

Что такое сторителлинг данных?

Рассказывание историй о данных — это навык науки о данных, который использует данные, визуальные эффекты и повествование, чтобы убедить группу лиц, принимающих решения, предпринять определенные действия.

Рассказывание историй о данных — это навык науки о данных

Анализ данных

Это самая техническая часть процесса, которая включает в себя кодирование и статистический анализ для анализа наборов данных. Многие части этого процесса могут быть выполнены аналитиком данных, но специалисты по данным также решают эти задачи. После анализа данных обнаруживаются отношения и шаблоны, которые представляют собой понимание данных, которые информируют бизнес-аналитику.

При анализе набора данных важно получить точные результаты, поскольку они станут основой для вашего повествования. Существует множество важных методов, которые помогают обеспечить точность анализа, в том числе:

  • Использование полных наборов данных, включая выбросы
  • Очистка данных для поддержания точности

Визуализация данных

Вспоминая попытки Земмельвейса навязать мытье рук, мы знаем, что одним из его недостатков было представление аудитории таблиц данных, а не визуального представления. Таблица не является эффективной визуализацией данных. Это требует, чтобы аудитория выполняла работу по чтению записей в каждой ячейке и определяла для себя взаимосвязь между точками данных. Это огромная работа, которую нужно оставить зрителям, и, честно говоря, мы не можем на них рассчитывать!

Скорее, рассказчик данных должен подкрепить свое понимание эффективной визуализацией данных.

Визуализация данных может принимать различные формы, в том числе:

  • Графики
  • Круговые диаграммы
  • Графики рассеяния
  • Картинки
  • Видео

Существует множество различных типов отношений, которые вы можете представить с помощью визуализации данных, и ни одна визуализация не подходит для каждого типа работы. Поэтому важно выбрать наиболее эффективную визуализацию для данной ситуации.

Например, у круговой диаграммы есть свои правила и запреты:

  • Используйте их, чтобы показать части по отношению к целому
  • Используйте их, чтобы проиллюстрировать, что одна часть целого сравнительно велика или мала.
  • Не используйте их, если части не составляют 100%
  • Не используйте их для сравнения размера каждой части целого.

Описание данных

Повествование, которое вы расскажете, соединит ключевые выводы из ваших данных, предоставит контекст и приведет к действенному выводу. Как и в любой хорошей художественной истории, хорошая история о данных должна:

  • Будь незабываемым
  • Подключиться к аудитории
  • Иметь начало, середину и конец
  • Есть персонажи, проблема/конфликт и разрешение

Но в отличие от множества ролей, которые может сыграть художественная история, главная цель истории, основанной на данных, — убедить лиц, принимающих решения, принять определенный курс действий.

Читайте также:  Как работают фильтры Ansible?

С этой целью хорошая история данных должна:

  • Убедить аудиторию в достижении четкой цели
  • Оставайтесь простыми и сосредоточенными

5 шагов, чтобы рассказать историю данных

Существуют различные фреймворки для повествования данных. Ни один из способов не является правильным, но вот один подход, который вы можете использовать.

1. Определите свою проблему

Эффективная история данных должна быть сосредоточена на одной четкой проблеме, которая в конечном итоге будет решена.

2. Обращайтесь к данным за шаблонами и идеями

Анализ поможет вам увидеть корреляции в ваших данных. Затем вам нужно будет рассмотреть причинно -следственные связи, лежащие в основе данных, и выдвинуть гипотезу об изменении, которое может привести к решению вашей проблемы.

3. Познакомьтесь со своей аудиторией

Что знает ваша аудитория и что ее волнует ?

Понимание вашей аудитории будет иметь решающее значение, чтобы помочь вам установить с ними эмоциональную связь и эффективно убедить их в действии.

4. Создайте описание данных

Здесь вы берете свое численное понимание и облекаете его в слова, которые легко понимает ваша аудитория.

В вашем повествовании должна быть четкая сюжетная линия, в том числе:

  • Начало: Предоставление контекста и представление ваших персонажей.
  • Середина: представление проблемы и напряжения, которое она создает для персонажей и аудитории.
  • Окончание: четкий призыв к действию для аудитории, который помогает решить проблему.

Вам также необходимо определить:

  • Обстановка: это помогает вашей аудитории погрузиться в вашу историю, так как вы не можете предположить, что они знают весь контекст.
  • Персонажи: ваша аудитория будет больше общаться с людьми из вашей истории, чем просто с данными.

5. Создавайте эффективные визуальные эффекты

Данные содержат шаблоны и идеи, но визуальные эффекты будут тем, что привлекает и связывает вашу аудиторию.

Чтобы сделать информационную историю запоминающейся и увлекательной, попробуйте предложить визуальные эффекты для начала, середины и конца вашего повествования.

И, конечно же, убедитесь, что изображение лучше всего подходит для отношений, которые вы пытаетесь показать.

Каждый вид визуализации имеет свою специфику. Например, при отображении тенденции роста эффективны графики, а не круговые диаграммы.

Рассказ с осторожностью

Новичку в теме данные могут показаться объективными. Однако существует высокий уровень интерпретации между корреляцией, которую определяют расчеты, и причинно-следственной связью и нарративом, интерпретируемым ученым и/или рассказчиком.

Поскольку их интерпретации определяют лидерские решения, рассказчики данных должны помнить о том, что они должны выполнять свою работу с надлежащим чувством ответственности.

Осторожный рассказчик должен уметь создавать нарративы на основе данных, оставаясь при этом:

  • Empathetic
  • Unbiased
  • Ethical

При этом анализ данных должен быть точным, а визуализация не должна вводить в заблуждение.

Пример вводящего в заблуждение графика можно увидеть на следующем рисунке от Venngage, где были включены только определенные точки данных, чтобы изобразить вводящую в заблуждение тенденцию роста:

Рассказывание историй похоже на выдвижение аргумента, и можно построить два разных аргумента, основанных на одном наборе предпосылок или «истин». Для этого крайне важно, чтобы у нас были вдумчивые рассказчики, которые также учитывают сложность и контекст реального мира при просмотре данных и имеют чувство ответственности при интерпретации чисел, стоящих перед ними.

Проникновение в науку о данных в качестве рассказчика

Если вы заядлый рассказчик, у вас уже есть один из самых важных нетехнических навыков, необходимых в науке о данных. И если вам понравится возможность решать проблемы с числами и кодом, наука о данных — это оппортунистический карьерный путь, в котором вы можете сочетать все эти элементы.

Чтобы начать заниматься наукой о данных, вам необходимо освоить основы математики, статистики, языков программирования и других технологий. Одними из самых популярных языков, используемых для науки о данных, являются Python (многоцелевой язык) и R (используемый специально для статистических вычислений).

Оцените статью
bestprogrammer.ru
Добавить комментарий

Adblock
detector