Тематический анализ качественных данных


07.10.2019 Время чтения - 11 минут 823

тематический анализ

Тематический анализ – метод определения таких основных категорий данных UX-исследований, как интервью, фокус-групп, и полевых исследований.

Раскрытие темы качественных данных может быть непредсказуемо сложным. Представим, что подводя итоги количественного исследования стало ясно, что вы набрали на 25% отзывов больше, чем конкуренты. Но как вы в таком случае обобщите весь этот фидбек?

На ранних стадиях проектов часто проводят поисковые исследования. Такое исследование часто дает много качественных данных, которые могут включать в себя:
Качественные данные об отношении к продукту, такие как мысли, убеждения, и самооценка респондентов, полученные из опросов и фокус-групп.
Качественные поведенческие данные, поведение людей, полученное с помощью контекстного исследования и других этнографических подходов.

Тематический анализ, который может сделать кто угодно, акцентирует внимание на важных аспектах качественных данных, что в свою очередь облегчает раскрытие тем.

Что такое тематический анализ?

Тематический анализ — это систематический метод разделения и систематизации большого количества данных, полученных в качественных исследований, суть которого состоит в маркировании отдельнх наблюдений и цитат определёнными кодами для облегчения поиска важных тем.

Исходя из названия, тематический анализ означает поиск по темам.

Определение темы:

  • Описание убеждений, практик, потребностей или других явлений, обнаруженных в данных;
  • Существует, когда связанные по смыслу результаты повторяются среди участников или источников данных.

Проблемы анализа качественных данных

Многие исследователи сталкиваются с большим разнообразием проблем при работе с качественными данными, полученными в ходе UX-исследований, проведённых на ранних стадиях проекта. В таблице ниже приведены самые распространённые из них.

проблемы анализа качественных данных таблица

При отсутствии систематического процесса проблемы выше могут легко возникнуть при анализе качественных данных. Тематический анализ организует исследователей , фокусируя их на алгоритме действий, которому необходимо следовать при анализе качественных данных.

Инструменты и методы проведения тематического анализа

Тематический анализ может быть выполнен разными способами. Подходящий метод определяется на основе:

  • Данных;
  • Контекста и ограничений анализа данных;
  • Личного стиля работы исследователя

3 самых распространённых метода:

  • Использование специального ПО;
  • Ведение логов (логгирование);
  • Построения диаграмм сходства.

Использование специального ПО

Для анализа больших объемов качественных данных довольно часто используется специальное ПО, известное как CAQDAS (компьютерное программное обеспечение для анализа качественных данных). Исследователи загружают стенограммы и заметки в программу, после чего систематически анализируют текст с помощью формального кодирования. Программное обеспечение помогает обнаруживать темы с использованием различных инструментов визуализации (деревья или облака слов, позволяющие манипулировать закодированными данными различными способами).

Преимущества:

  • Анализ очень тщателен.
  • Файл проекта (содержит необработанные данные) может быть предоставлен другим пользователям. Такой подход популярен в студенческих проектах.

Недостатки:

  • Отнимает много времени из-за большого количества кодов, которые необходимо сжать в небольшой список;
  • Дорого;
  • Сложно синхронизировать анализ с другими исследователями
  • Требует изучения ПО;
  • Может чувствовать себя ограниченным

Ведение логов (логгирование)

Запись мыслей и идей – весьма распространённая практика среди исследователей, практикующих методологию обоснованной теории. Логгирование основано на этой методологии и подразумевает ведение записей насчёт идей и мыслей. Часто такие записи называют заметками.

Преимущества:

  • Процесс стимулирует размышления путём написания подробных заметок.
  • У исследователей есть подробные записи того, как они пришли к той или иной теме.
  • Дёшево и сердито.

Недостатки:

  • Сложно работать в группе

Методы построения диаграмм сходства

Данные выделяются и сортируются по группам, из которых со временем станут очевидными темы.

Преимущества:

  • Подходит для совместной работы;
  • Быстрое определение тем;
  • Дёшево и гибко;
  • Визуальный процесс, поддерживающий итеративный анализ.

Недостатки:

  • Не настолько тщателен в сравнении с другими методами;
  • Сложно осуществить при большом количестве данных и различиях между ними.

Коды и кодирование

Все методы тематического анализа подразумевают под собой некоторую степень кодирования (не путать с программированием).

Определение: Код — это слово или фраза, которая работает в качестве маркировки для отрывка текста.

Код описывает содержание текста и является сокращением более сложной информации. (Хорошая аналогия состоит в том, что код описывает данные так же, как и ключевое слово описывает статью или как хештег описывает твит.) Исследователи очень часто не только дают имя каждому коду, но также и описывают его значение, указывая примеры текста. Эти описания будут особенно полезны, если за кодирование данных отвечает более, чем один человек или если кодирование выполняется долго по времени.

Определение: Кодирование — это процесс маркировки сегментов текста соответствующими кодами.

После присвоения кодов легко идентифицировать и сравнивать некоторые отрывки текста. Коды позволяют легко сортировать информацию и анализировать данные для выявления сходств или различий со взаимосвязью между частями текста. Только так можно прийти к осознанию основных тем.

тематический анализ алгоритм

Типы кодов:

Коды могут быть:

  • Описывающие: описывают суть данных;
  • Интерпретационные (пояснительные): аналитическая информация о данных с интерпретирующей линзой исследователя.

Чтобы увидеть примеры описывающих и пояснительных кодов, давайте посмотрим на цитату из интервью, проведённое с практикующим UX-дизайнером.

«Моя компания организовала мне встречу, где предложила курс продолжительностью в полтора дня. Когда я пришёл туда, инструктор сделал то, что тогда мне показалось ужасным, но теперь я понимаю, что неоценимый опыт. Первое, что мы сделали – подписали листы бумаги, на которых записали наш худший страх в управлении, сдали их ведущему, после чего он сказал, что завтра эту ситуацию придётся разыграть. На следующий день мы начали практиковаться. Часть команды без меня должна была вычитать мой страх и решить, как они будут действовать, после чего я выходил к ним и мы 10 минут разыгрывали ситуацию. И это действительно помогло мне осознать, что нечего бояться, и что наши страхи действительно только в нашей голове, осознание чего заставило меня понять, что я могу справляться с этими ситуациями».

Вот возможные описывающий и интерпретирующий коды для текста выше:
Описывающий код: как приобретаются навыки
Обоснование кодовой метки: участников попросили описать, как они приобрели определенные навыки.

Интерпретирующий код: саморефлексия
Обоснование кодовой метки: участник описывает, как этот опыт изменил его убеждения и как это отразилось на его страхах.

Шаги проведения тематического анализа

Независимо от того, какой инструмент вы используете (ПО, логгирование или диаграммы), процесс проведения тематического анализа можно разбить на 6 этапов.

6 шагов тематического анализа
Тематический анализ включает в себя 6 различных этапов: сбор данных, их изучение, кодирование, создание новых кодов, день перерыва с последующим возвратом к анализу.

Шаг 1: сбор данных

Начните с таких необработанных данных, как беседы, стенограммы фокус-групп, заметки или записи в дневнике. Рекомендуется переводить аудиозаписи из интервью в текстовую форму для анализа.

Шаг 2: изучите все данные от начала до конца

Перед началом анализа ознакомьтесь с данными, даже если вы непосредственно проводили исследование. Прочитайте все свои стенограммы и записи, прежде чем анализировать их. На этом этапе вы можете подключить всю свою команду.

Проведите семинар (или серию семинаров, если ваша команда очень большая или у вас много данных), следуя этим шагам:

  1. Перед тем, как члены вашей команды получат доступ к данным, напишите все свои вопросы, касаемые исследования, на доске,  чтобы во время работы они были перед глазами.
  2. Раздайте каждому участнику стенограмму или заметку/запись. Попросите выделить всё, что они считают важным.
  3. После того, как все закончат изучать свои записи, попросите каждого передать свою стенограмму или запись слудующему члену команды. Повторяйте это до тех пор, пока одна из заметок не побывает в руках у каждого.
  4. Обсудите результаты анализа.
Photo of a team member highlighting a printed transcript.
Семинар, на котором каждый член команды читает каждую запись, выделяя важные фрагменты, – хороший способ заставить команду активно взаимодействовать с текстом, а не просто читать его.

Лучше всего, когда ваша команда наблюдает за всеми вашими исследованиями. Иногда это может быть невозможно, если у вас слишком много сессий или очень большая команда. Если же всего несколько человек из команды будут наблюдать пару-тройку сессий то существует шанс того, что у них будет неполное понимание всего происходящего. Семинар может решить эту проблему, так как в нём каждый будет принимать участие.

Шаг 3: Кодируйте текст, основываясь на его смысле

На этапе кодирования выделенные разделы должны быть распределены по категориям, чтобы упростить процесс сравнения их между собой.

На этом этапе постарайтесь не забыть своих целей исследования. Распечатайте интересующие вас вопросы и разместите их или на стене или на доске в комнате проведения анализа.

Вы можете вовлечь свою команду в этот этап кодирования, если у вас есть достаточно времени. Если же время ограничено, сделайте этот шаг самостоятельно, после чего пригласите свою команду просмотреть ваши коды и помочь прояснить темы.

Когда вы пишете код, просматривайте каждый отрывок текста, спрашивая себя: «О чём это?». Дайте отрывку имя, описывающее данные (описывающий код). На этом этапе можно добавить к тексту интерпретирующие коды.

Код можно создать как до, так и после сортировки данных. В следующих двух подразделах этого шага описывается, как и когда эти коды можно добавлять.

Традиционный метод: создание кодов перед сортировкой

Суть традиционного подхода заключается в кодировании предложений, абзацев, и фраз. Будет полезным ведение учёта всех используемых кодов и их описания, чтобы можно было обращаться к этому списку при кодировании других разделов (особенно, если текст кодируется несколькими людьми). Этот подход позволяет избежать параллельного создания нескольких независимых кодов.

После того как весь текст был закодирован, вы можете сгруппировать все данные с одинаковым кодом.

Если вы используете CAQDAS для этого процесса, то программное обеспечение автоматически регистрирует коды, которые вы назначите для их повторного использования. Это ПО так же даёт возможность просматривать весь текст, закодированный одним и тем же кодом.

CAQDAS программное обеспечение
Полосы показывают, какие части текста были закодированы. Все коды, используемые в этом проекте, отображаются на панели кодов. Двойной щелчок по коду отобразит все данные, закодированные этим словом.

Быстрый метод: сначала – сортировка, после – кодирование

Вместо того, чтобы придумывать код при выделении текста, нужно разбить (физически или в цифровой форме) и кластеризировать все похожие отрывки. После этого отобранным данным присваивается код. При выполнении кластеризации в цифровом виде можно вставить закодированные разделы в новый документ или какую-нибудь платформу для совместной работы.

На рисунках ниже, сортировка была сделана вручную. Разрезанные записи прикрепляли к доске, перемещая их, до тех пор, пока они те попали в естественные тематические группы. После чего каждой группе был присвоен свой стикер с расшифровкой кодирования.

тематический анализ: 6 шагов
Выделенные фрагменты текста были разрезаны ножницами и приклеены к доске.
тематический анализ: 6 шагов
Номер участника или тип данных (т.е. беседа или исследование) был написан на наклейке. Такая практика поддерживает связь стикеров с полными данными, облегчая их сравнение.
тематический анализ: 6 шагов
Выбранные фрагменты были сгруппированы по текстовой теме и получили описательный код.

В конце этого этапа вы должны получить данные с их кодами, сгруппированные по темам.

Давайте посмотрим на пример. Я взял интервью у 3 человек об их опыте приготовления пищи дома. В этих интервью участники говорили о том, что они предпочитают готовить. Речь шла о конкретных проблемах, с которыми они сталкивались во время готовки (например, диетические требованиях, ограничения в бюджете, нехватка времени и физического пространства) и о решениях некоторых из этих проблем.

После сортировки выделенных фрагментов по темам я получил 3 широких описывающих кода и соответствующие группы:

  • Кулинарный опыт: незабываемые положительные и отрицательные переживания, связанные с кулинарией;
  • Болевые точки: всё, что мешает или затрудняет процесс готовки;
  • Вещи, которые помогают: всё, что помогает или может помочь преодолеть определенные трудности.

Шаг 4: Создание новых кодов, включающих потенциальные темы

Просмотрите все коды и изучите причинно-следственные связи, сходства или различия, чтобы узнать, сможете ли вы раскрыть основные темы. Во время этого процесса некоторые коды придётся отложить, заархивировать, или удалить, и создать новые. Если вы используете подход физического сопоставления, подобный тому, который обсуждался на шаге №3, то некоторые из этих первоначальных категорий могут исчезать или расширяться при поиске тем.

Задайте себе следующие вопросы:

  • Что происходит в каждой группе?
  • Как связаны эти коды?
  • Могут ли они ответить на мои исследовательские вопросы?

Возвращаясь к теме кулинарии, при анализе текста и поиске связи между данными в каждой группе я заметил, что два участника сказали, что им нравятся хорошо сочетающиеся с другими ингредиенты, которые можно готовить по-разному. Третья участница заявила о желании иметь набор ингредиентов, которые можно использовать для разных блюд в течение недели, а не покупать каждый раз отдельные для новых блюд. Таким образом, появилась новая тема о гибкости ингредиентов. Для этой темы я придумал код с подробным описанием, который подходит всем.

тематический анализ: 6 шагов
В этом примере исследования была сформирована новая группа, в которую входят цитаты, упоминающие необходимость ингредиентов, которые можно использовать по-разному – либо потому, что их можно приготовить несколькими способами, либо потому, что их можно употреблять в несколько разных приемов пищи в течение недели. Группа была помечена интерпретирующим кодом, который подходит всем ингредиентам.

Шаг 5: Возьмите один день перерыва

Отличной идеей будет сделать перерыв и вернуться к работе со свежей головой. Так вы сможете ясно увидеть существенные закономерности в данных.

Шаг 6: Оцените свои темы на предмет соответствия

На этом этапе не будет лишним привлечь других людей для помощи. Ваши решения могут быть оспорены и подвергнуты критике свежим взглядом. Эта практика уменьшает вероятность того, что ваша интерпретация будет иметь личные предубеждения.

Пристально рассмотрите темы и задайте себе эти вопросы:

  • Хорошо ли тема подкреплена данными?
  • Насыщена ли тема множеством примеров?
  • Согласны ли другие исследователи с вашими темами?

Если ответ хоть на один на этих вопросов отрицательный – вам стоит вернуться к доске анализа. Предполагая, что у вас есть звуковые записи, стоит потратить больше времени на шаги 4-6.

Заключение

Используйте тематический анализ в качестве руководства для эффективного просмотра большого количества качественных данных. Не существует только одного способа совершения тематического анализа. Выберите метод, соответствующий виду и объему собранных вами данных. По возможности приглашайте других в процесс анализа, чтобы повысить его точность и узнать, как ваша команда знает поведение, мотивацию и потребности ваших пользователей. Анализ может отнять довольно много времени, поэтому есть хорошее правило – выделяйте столько времени, сколько у вас было для сбора данных.

Оригинал статьи.

Читайте так же: AR и VR в сфере коммунальных услуг