Прогнозная аналитика в области здравоохранения
14 августа
Статьи

Перспективы больших данных

Ни для кого не секрет, что здравоохранение в США представляет собой ужасающую картину, характеризующуюся дороговизной, неэффективностью и хаосом. В 2012 году авторы книги "Как наука о данных меняет здравоохранение: Решение дилеммы Ванамейкера (How Data Science Is Transforming Health Care: Solving the Wanamaker Dilemm) рассказали о том, что каждый год США тратит более 2,6 трлн. долларов на здравоохранение; 600 млрд долларов из которых включают в себя процедуры, которые не эффективны или даже причиняют вред.

Еще грустнее становится от того, что расходы на здравоохранение составили 17,6% от ВВП в 2013 году, 600 млрд долларов из них - это растраты и мошенничество. Ожидается, что к 2020 году этот показатель вырастет почти до 20%. США занимают 37 место среди стран с развитой экономикой по средней продолжительности жизни и другим показателям состояния здоровья.

Есть те, кто утверждают, что большие данные - решение этой проблемы. Хотя здравоохранение начинает использовать свой потенциал крайне медленно (для более подробной информации см. наши разделы по биотехнологии и фармацевтике), есть надежда, что:

  • увеличение расходов вынудит поставщиков медицинских услуг перейти от системы оплаты за услуги (чем больше лечебных процедур, тем лучше) к системе, в основе которой лежит результат (награждение поставщиков за целенаправленное лечение, которое действительно эффективно).
  • врачи продолжат двигаться в направлении доказательной медицины, анализируя данные из огромного количества источников для принятия решения о назначении лечения.
  • в 2012 году Национальные институты здравоохранения выделили порядка 15 миллионов долларов на финансирование восьми проектов по исследованию использования больших объемов данных.

Это ставит ученых, занимающихся данными, на первое место. Если грамотно использовать потенциал больших данных, это поможет врачам принимать более взвешенные решения во всех областях - от назначения индивидуального лечения до профилактической работы.

И да! Одно из самых главных преимуществ использования больших данных в здравоохранении - это сокращение расходов!

Персонализированная медицина

Представьте, что вы - врач, занимающийся лечением пациентов, больных раком. В прошлом вы, вероятно, определяли план лечения на основании результатов двойных слепых исследований. Эти исследования были скрупулезными, но они могли не учитывать различия между пациентами.

Большие данные меняют эти правила. Теперь можно объединять и анализировать массивы данных, полученных в результате:

  • клинических исследований
  • непосредственных наблюдений других врачей
  • электронных медицинских записей
  • социальных сетей пациентов
  • геномики (см. ниже)
  • и многого другого...

Одна из важнейших задач - создание персонального плана лечения на основе индивидуальных особенностей организма. Вместо назначения пациенту препарата, который применяется в 80% случаев (например, тамоксифен - препарат от рака груди), вы сможете использовать науку о данных для того, чтобы определить индивидуальную схему приема лекарств для этой пациентки.

Геномика

Удешевление секвенирования ДНК и геномные технологии следующего поколения меняют схему ведения бизнеса поставщиков услуг. Как указывает Майкл Уолкер, теперь у нас появилась возможность картировать всю последовательность ДНК и анализировать десятки тысяч показателей крови для оценки состояния здоровья:

«Геномные технологии следующего поколения позволяют специалистам по данным существенно увеличить количество геномных данных, собранных на базе большой популяции. В сочетании с новыми подходами информатики, которые интегрируют многие виды данных с геномными данными в исследованиях болезней, мы будет лучше понимать генетические основы болезней и ответа организма на лекарственные препараты».

Исследователи стремятся к достижению в высшей степени индивидуального подхода. Для начала Управление по контролю за продуктами и лекарствами (FDA) начало выпускать метки с указанием различных доз, предназначенных для больных в зависимости от их набора генов.

Прогнозная аналитика и профилактика

Профилактика всегда лучше лечения. Иногда и в здравоохранении удается сэкономить много денег. (Например, Центры по обслуживанию Medicare и Medicaid могут оштрафовать медицинские учреждения, показатели повторной госпитализации которых превышают усредненные, на основании того, что они могли бы сделать больше для предотвращения медицинских проблем.)

Возьмем, к примеру, сотрудничество Медицинского центра Mount Sinai и бывшего гуру Facebook - Джеффа Хаммербачера. Центр ставил перед собой задачу уменьшить показатели повторной госпитализации. Хаммербачер предложил использовать прогнозную аналитику:

  • В экспериментальном исследовании Хаммербачер и его команда совместили данные по болезням, прошлым обращениям в больницу и другие факторы для того, чтобы определить риск повторной госпитализации пациента.
  • Затем больничный персонал проводил с пациентами, для которых была определена высокая доля подобного риска, регулярные консультации, чтобы помочь им избежать повторного заболевания.

Этот медицинский центр оказался не одинок в своем начинании. В 2008 году медицинский центр Texas Health объединил усилия с компанией Healthways с целью объединения и анализа информации о страховых претензиях и клинических данных. Они преследовали ту же самую цель – выявить пациентов с высокой долей риска и предложить им индивидуальное лечение.

В 2013 году специалисты по работе с данными из учреждения здравоохранения Methodist Health System провели анализ претензий к уполномоченным организациям по оказанию медицинской помощи от 14,000 пациентов и 6000 сотрудников. Какова была их цель? Наверное, вы уже догадались. Они пытались определить, кто из пациентов в будущем будет нуждаться в дорогостоящем лечении.

Контроль за пациентами и домашние устройства

Врачи могут многое, но они не могут следить за своими пациентами ежеминутно. Датчики, размещаемые на теле, позволяют отслеживать все показатели, начиная от сердечного ритма и заканчивая уровнем тестостерона и воды в организме.

Датчики - это лишь один из способов, благодаря которым медицинские технологии могут выйти за пределы больничной койки. Практически каждый день появляются новые устройства медицинского мониторинга для домашнего использования и мобильные приложения. Сканер для диагностики меланомы? Индивидуальное ЭЭГ-устройство для мониторинга работы сердца? – Без проблем.

В первую очередь, эти устройства предназначены для пациентов, но, естественно, они также собирают данные.

Например:

  • GPS-датчик от компании Asthmapolis, который начали использовать еще в 2011 году, фиксировал использование ингаляторов астматиками. Эта информация сопоставляется, анализируется и объединяется с данными по катализаторам астмы из Центра по контролю и профилактике заболеваний (например, высокий уровень пыльцы в Новой Англии) для того, чтобы помочь врачам определить, каким образом предотвратить приступы болезни.
  • Мобильное приложение Ginger.io, выпущенное в 2012 году, с согласия пациентов сохраняло данные об их звонках, сообщениях, местонахождении и передвижениях. Они сопоставлялись с информацией по охране психического здоровья от НИЗ и других источников, чтобы выявить потенциальные проблемы. Слишком много телефонных звонков поздней ночью, например, могли сигнализировать о более высоком риске приступов тревожного расстройства.
  • Компания Eliza, базирующаяся в Бостоне, для улучшения соблюдения режима приема препаратов пациентов отслеживает, какие виды напоминаний лучше работают с теми или иными типами людей. Умное направленное воздействие предполагает больше анализа.

Самомотивированный уход

Теперь мы живем в мире, который можно охарактеризовать фразой «Спасение пациента - дело рук самого пациента». Такие разработки, как, например, индивидуальное генетическое тестирование (23andMe.com), социальные сети пациентов и поведенческие приложения, напр., Be Well, позволяют людям контролировать состояние своего здоровья.

Это приводит ученых в восторг. В книге "Большие данные и ориентация на потребителя в здравоохранении" (Big Data and the Consumerization of Healthcare) автор предполагает включить в приложение Be Well долгосрочный анализ поведенческих моделей. Большие данные могут помочь людям создать «жизненный отчет», который сопоставит происходящие изменения с текущими условиями и даст им новое видение их благополучия.

У пациентов появляются и другие преимущества. Их опыт может послужить источником данных. В той же статье из серии статей о науке данных автор отмечает:

«В сообществах наподобие группы PatientsLikeMe зарегистрировано более 150 000 пациентов, которые рассказывают про свои симптомы, проблемы, опыт лечения и истории излечения, которые охватывают более 1000 состояний».

Это громадное количество информации о симптомах, лечении и побочных эффектах, с которой хотели бы ознакомиться больницы, фармацевтические компании и ученые.

Моделирование заболеваний и картирование

Одним из самых ярких примеров использования науки о данных в последние годы стало отслеживание заболеваний (и поиск способов, чтобы остановить или предотвратить их).

Например:

  • В 2013 году в рамках проекта 24-Hour Data Science Code-a-Thon, который запустила организация Kaiser Permanente, команды использовали технологии Hadoop для картирования случаев респираторных заболеваний (например, приступы астмы происходили в районах с более высоким уровнем содержания озона в течение более продолжительных летних периодов времени).
  • При разработке приложения с открытым исходным кодом Spatio-Temporal Epidemiological Modeler (STEM) (моделирование пространственно-временных эпидемиологических моделей), как об этом сообщалось в 2013 году, исследователи обнаружили связь между изменениями местного климата и температуры и вспышками заболеваниями малярией и лихорадкой денге.
  • Медицинский центр Mount Sinai посредством картирования мест заболеваний диабетом 2 типа надеется улучшить процедуру лечения. После выявления подобных мест исследователи сосредотачиваются на генетических факторах, которые связаны с этими средами. На основании этих исследований они могут выработать руководство для врачей и предложить более специализированное лечение.

Для подобных примеров одна иллюстрация лучше тысячи слов. Посмотрите на диабетические карты медцентра Mount Sinai, которые есть в этой статье, взятые из Fast Co.Exist.

Электронная медицинская карта

Пожалуй, самая заманчивая мечта - это полностью цифровая и поражающая своей всеобъемлемостью электронная медицинская карта (ЭМК). Иногда ее еще называют "электронная история болезни" (ЭИБ). Один этот драгоценный файл будет содержать всю информацию о здоровье пациента, данные в нем всегда будут актуальны и его можно будет переслать через любую сеть.

А долго ли еще осталось до ЭМК? Скажем так: карты от нас на расстоянии выстрела. Однако это не мешает специалистам по данным фантазировать о файле, который будет содержать:

  • Структурированные данные по каждому пациенту, обсуживающемуся в учреждении здравоохранения (например, результаты лабораторных анализов, социально-демографическая информация, история выписки рецептов и т.д.)
  • Специализированные неструктурированные данные (например, комментарии врачей-специалистов, терапевтов и медсестер)
  • Неструктурированные личные данные (например, комментарии от работников, занимающихся уходом на дому, членов семьи пациента, самих пациентов и работников социальной сферы)
  • Сохраненные изображения (например, рентгеновские снимки и МРТ)
  • Геномные данные

Департамент здравоохранения и социальных служб США уже работает над планом для обеспечения широкого внедрения ЭМК, однако успешной его реализацией будет считаться полная централизации действий между правительством и центрами.

Одна ЭМК поможет справиться со всеми проблемами? Ничего странного, история знает и другие удивительные примеры.

История анализа данных в здравоохранении

«Меня часто спрашивают, что я думаю об американской системе здравоохранения. Ну, «думаю, это была бы неплохая идея», если мы процитируем Ганди», – Пол Фармер

В пасмурные дни 1950 года вскоре после начала войны в Корее молодой физиолог/стоматолог Роберт Ледли получил предложение, от которого он не мог отказаться:

«Военные позвонили мне в Нью-Йорк... и полковник сказал мне: "Ну, если вы добровольно пойдете в армию, мы сделаем вас лейтенантом, офицером. А если вы не хотите быть добровольцем, вас все равно заберут и отправят в учебку. Поэтому я решил стать добровольцем».

После работы в больнице общего профиля Walter Reed Ледли в 1952 году пригласили в Национальное бюро стандартов. Там он впервые увидел компьютер Standards Eastern Automatic Computer (SEAC). Это была любовь с первого взгляда.

Ледли понял, что SEAC может решать сложные уравнения, которые не под силу ни одному человеку. Он увидел, что физики, математики и компьютеры могут быть объединены для решения медицинских и биологических проблем.

В 1959 году Ледли и рентгенолог Ли Б. Ластед объединили усилия и опубликовали работу под названием "Рассуждения об основах медицинской диагностики». Статья стала своеобразным букварем по техникам исследования операций, в ней затрагивалась символическая логика, теория вероятностей и полезности, и приводились мнения образованных врачей о потенциале баз данных и электронной диагностики. Компьютеризация медицины получила серьезные аргументы в свою пользу.

Медицинская информатика

Ледли был не единственным исследователем, заинтересованным в возможностях компьютерных наук. Концепция медицинской информатики – изучение ресурсов и методов управления информацией в области здравоохранения – возникала и в других странах.

Но для послевоенного и богатого правительства США эта область была особенно интересной. Работа Ледли помогла проложить путь для изменений. В период с 1960 по 1964 Национальные институты здравоохранения потратили более 40 млн долларов на открытие десятков биомедицинских исследовательских центров, занимающихся технологиями.

Также в 1960-х появилась компьютеризированная библиографическая база данных MEDLARS/MEDLINE, собранная Национальной библиотекой медицины, проводились научные исследования и эксперименты с языками программирования.

MUMPS

Одним из них стал MUMPS (Massachusetts General Hospital Utility Multi-Programming System - ОС Клинической больницы штата Массачусетс). MUMPS был разработана Нилом Паппалардо, Куртисом Марблом и Робертом Гринесом в 1966-1967 и существенно помог созданию и интеграции медицинских баз данных. Тем не менее, в начале 1970-х MUMPS стал самым распространенным языком программирования в области клинического применения.

Это время, если можно так выразиться, стало десятилетием мира, любви и данных:

  • Ранние 1960-е: Моррис Коллен, врач из отдела исследований организации Kaiser Permanente, разрабатывает систему для автоматизации процедуры 10-летнего многопрофильного медицинского обследования и создает прототип электронной медицинской карты.
  • 1965: Начинается работа по созданию Систематизированной номенклатуры в патологии (SNOP) - попытка систематизировать язык патологии для использования в компьютерных системах. В 1974 году эта работа была расширена на всю медицинскую терминологию, так появилась знаменитая Систематизированная номенклатура медицинских терминов (SNOMED).
  • 1965: Конгресс вносит поправки в Закон о социальном обеспечении для создания Medicare и Medicaid. Это вынуждает поставщиков медицинских услуг вести документацию по оказываемому уходу за больными. Интерес к медицинской информатике получает значительный импульс.

В здравоохранении начинают использовать компьютеры для формирования статистических отчетов для правительства, создания медицинских приложений, централизации медицинских записей и, самое главное, организации выставления счетов.

Обещание PROMIS

Несмотря на все эти благие начинания, компьютеризированная медицина в 1970-х оставалась сборной солянкой. Производители компьютеров не всегда понимали рынок здравоохранения, а больницы не всегда понимали, что делать с компьютерами.

Поставщики медицинских услуг, которые сделали этот решительный шаг, столкнулись с проблемами границ быстродействия и возможностей обработки. Что еще хуже, системы были слабо интегрированы между собой.

Тем не менее, медики продолжали упорно идти вперед:

  • В 1968 году доктор Лоуренс Уид разрабатывает проблемно-ориентированную медицинскую информационную систему (PROMIS). Несмотря на то, что PROMIS не получила широкого признания, это была хорошая попытка создать интегрированную систему, охватывающую все аспекты здравоохранения, включая лечение пациентов, а также проблемно-ориентированных медицинских записей (POMR).
  • В конце 1960 и начале 1970-х в рамках похожего проекта в медицинском центре Intermountain доктор Гомер Уорнер и его коллеги разработали систему HELP (оценка состояния здоровья путем логической обработки). HELP стала одной из первых версий национальной электронной медицинской карты.

И, конечно, в это же время зародился Интернет. К концу десятилетия идея коммуникационных технологий по передаче данных онлайн вышла за пределы крупных учебных медицинских центров. Врачи начали получать мгновенный доступ к компьютеризированным базам данных.

Выигрывают все

Появление доступных, более мощных технологий в конце 1970-х и начале 1980-х ускорило изменения. Крупным и многопрофильным поставщикам пришлось подстраиваться под требования отрасли. Организации начали разрабатывать протоколы для сбора информации и данных в области здравоохранения.

Однако только во второй половине 80-х и начале 90-х годов внимание медицинских технологий стало смещаться в сторону клинической интеграции и повышения качества ухода за пациентами.

Это произошло потому, что, в конце концов, все поняли, что им нужно друг от друга. Благодаря Интернету, сетевым технологиям, масштабным базам данных и разработке программного обеспечения для реляционных баз данных, данные внезапно оказались повсюду.

Даже политики взяли это на заметку. В 1996 году Эдвард Кеннеди и Нэнси Кассебаум провели через Конгресс Закон об ответственности и переносе данных о страховании здоровья граждан (HIPAA), а также закон Кеннеди – Кассебаума. Целью закона было стимулирование использования электронного обмена данными в системе здравоохранения США посредством выработки национальных стандартов для электронных транзакций в сфере здравоохранения. В HIPAA также были включены положения о конфиденциальности пациентов.

HITECH

Затем наступило новое тысячелетие, а вместе с ним появились и новые «обязательства». И как раз здесь все и усложнилось. Как пишут авторы отчета McKinsey под названием Революция больших данных в американском здравоохранении:

  • Потребители и поставщики медицинских услуг начали оцифровку историй пациентов.
  • Фармацевтические компании продолжают передавать многолетние данные научных исследований и разработок в медицинские базы данных.
  • Федеральное правительство и прочие заинтересованные стороны начали предоставлять доступ общественности к сокровищницам медицинских знаний, в том числе к данным о клинических исследованиях и информации о больных, пользующихся государственной системой страхования.

Устройства, гаджеты и КПК стали повсеместно использоваться в медицинских учреждениях. Возможности хранения данных продолжают увеличиваться. Поток доступной информации превратился в полноводную реку, наводняемую:

  • Данными исследований фармацевтических компаний (например, результатами клинических испытаний)
  • Клиническими данными (например, историями болезни пациентов)
  • Данными об услугах и стоимости процедур (например, оценки расходов на процедуры)
  • Данными о поведении пациентов (например, история обращения за медицинской помощью)
  • Биологическими данными (например, геномикой)

В 2004 году Джордж Буш учредил Бюро по национальной координации медицинских информационных технологий с целью стимулирования технологического развития и электронных информационных потоков в этой области.

Эта задача приобрела новый смысл, когда в 2009 году Конгресс принял Закон о применении медицинских информационных технологий в экономической деятельности и клинической практике (HITECH). Таким образом, правительство показало, что готово тратить миллиарды долларов на стимулирование и внедрение медицинских информационных технологий и создание общенациональной сети электронных медицинских записей (EHRs).

Перспективы больших данных

Ни для кого не секрет, что здравоохранение в США представляет собой ужасающую картину, характеризующуюся дороговизной, неэффективностью и хаосом. В 2012 году авторы книги "Как наука о данных меняет здравоохранение: Решение дилеммы Ванамейкера (How Data Science Is Transforming Health Care: Solving the Wanamaker Dilemm) рассказали о том, что каждый год США тратит более 2,6 трлн. долларов на здравоохранение; 600 млрд долларов из которых включают в себя процедуры, которые не эффективны или даже причиняют вред.

Еще грустнее становится от того, что расходы на здравоохранение составили 17,6% от ВВП в 2013 году, 600 млрд долларов из них - это растраты и мошенничество. Ожидается, что к 2020 году этот показатель вырастет почти до 20%. США занимают 37 место среди стран с развитой экономикой по средней продолжительности жизни и другим показателям состояния здоровья.

Есть те, кто утверждают, что большие данные - решение этой проблемы. Хотя здравоохранение начинает использовать свой потенциал крайне медленно (для более подробной информации см. наши разделы по биотехнологии и фармацевтике), есть надежда, что:

  • увеличение расходов вынудит поставщиков медицинских услуг перейти от системы оплаты за услуги (чем больше лечебных процедур, тем лучше) к системе, в основе которой лежит результат (награждение поставщиков за целенаправленное лечение, которое действительно эффективно).
  • врачи продолжат двигаться в направлении доказательной медицины, анализируя данные из огромного количества источников для принятия решения о назначении лечения.
  • в 2012 году Национальные институты здравоохранения выделили порядка 15 миллионов долларов на финансирование восьми проектов по исследованию использования больших объемов данных.

Это ставит ученых, занимающихся данными, на первое место. Если грамотно использовать потенциал больших данных, это поможет врачам принимать более взвешенные решения во всех областях - от назначения индивидуального лечения до профилактической работы.

И да! Одно из самых главных преимуществ использования больших данных в здравоохранении - это сокращение расходов!

Персонализированная медицина

Представьте, что вы - врач, занимающийся лечением пациентов, больных раком. В прошлом вы, вероятно, определяли план лечения на основании результатов двойных слепых исследований. Эти исследования были скрупулезными, но они могли не учитывать различия между пациентами.

Большие данные меняют эти правила. Теперь можно объединять и анализировать массивы данных, полученных в результате:

  • клинических исследований
  • непосредственных наблюдений других врачей
  • электронных медицинских записей
  • социальных сетей пациентов
  • геномики (см. ниже)
  • и многого другого...

Одна из важнейших задач - создание персонального плана лечения на основе индивидуальных особенностей организма. Вместо назначения пациенту препарата, который применяется в 80% случаев (например, тамоксифен - препарат от рака груди), вы сможете использовать науку о данных для того, чтобы определить индивидуальную схему приема лекарств для этой пациентки.

Геномика

Удешевление секвенирования ДНК и геномные технологии следующего поколения меняют схему ведения бизнеса поставщиков услуг. Как указывает Майкл Уолкер, теперь у нас появилась возможность картировать всю последовательность ДНК и анализировать десятки тысяч показателей крови для оценки состояния здоровья:

«Геномные технологии следующего поколения позволяют специалистам по данным существенно увеличить количество геномных данных, собранных на базе большой популяции. В сочетании с новыми подходами информатики, которые интегрируют многие виды данных с геномными данными в исследованиях болезней, мы будет лучше понимать генетические основы болезней и ответа организма на лекарственные препараты».

Исследователи стремятся к достижению в высшей степени индивидуального подхода. Для начала Управление по контролю за продуктами и лекарствами (FDA) начало выпускать метки с указанием различных доз, предназначенных для больных в зависимости от их набора генов.

Прогнозная аналитика и профилактика

Профилактика всегда лучше лечения. Иногда и в здравоохранении удается сэкономить много денег. (Например, Центры по обслуживанию Medicare и Medicaid могут оштрафовать медицинские учреждения, показатели повторной госпитализации которых превышают усредненные, на основании того, что они могли бы сделать больше для предотвращения медицинских проблем.)

Возьмем, к примеру, сотрудничество Медицинского центра Mount Sinai и бывшего гуру Facebook - Джеффа Хаммербачера. Центр ставил перед собой задачу уменьшить показатели повторной госпитализации. Хаммербачер предложил использовать прогнозную аналитику:

  • В экспериментальном исследовании Хаммербачер и его команда совместили данные по болезням, прошлым обращениям в больницу и другие факторы для того, чтобы определить риск повторной госпитализации пациента.
  • Затем больничный персонал проводил с пациентами, для которых была определена высокая доля подобного риска, регулярные консультации, чтобы помочь им избежать повторного заболевания.

Этот медицинский центр оказался не одинок в своем начинании. В 2008 году медицинский центр Texas Health объединил усилия с компанией Healthways с целью объединения и анализа информации о страховых претензиях и клинических данных. Они преследовали ту же самую цель – выявить пациентов с высокой долей риска и предложить им индивидуальное лечение.

В 2013 году специалисты по работе с данными из учреждения здравоохранения Methodist Health System провели анализ претензий к уполномоченным организациям по оказанию медицинской помощи от 14,000 пациентов и 6000 сотрудников. Какова была их цель? Наверное, вы уже догадались. Они пытались определить, кто из пациентов в будущем будет нуждаться в дорогостоящем лечении.

Контроль за пациентами и домашние устройства

Врачи могут многое, но они не могут следить за своими пациентами ежеминутно. Датчики, размещаемые на теле, позволяют отслеживать все показатели, начиная от сердечного ритма и заканчивая уровнем тестостерона и воды в организме.

Датчики - это лишь один из способов, благодаря которым медицинские технологии могут выйти за пределы больничной койки. Практически каждый день появляются новые устройства медицинского мониторинга для домашнего использования и мобильные приложения. Сканер для диагностики меланомы? Индивидуальное ЭЭГ-устройство для мониторинга работы сердца? – Без проблем.

В первую очередь, эти устройства предназначены для пациентов, но, естественно, они также собирают данные.

Например:

  • GPS-датчик от компании Asthmapolis, который начали использовать еще в 2011 году, фиксировал использование ингаляторов астматиками. Эта информация сопоставляется, анализируется и объединяется с данными по катализаторам астмы из Центра по контролю и профилактике заболеваний (например, высокий уровень пыльцы в Новой Англии) для того, чтобы помочь врачам определить, каким образом предотвратить приступы болезни.
  • Мобильное приложение Ginger.io, выпущенное в 2012 году, с согласия пациентов сохраняло данные об их звонках, сообщениях, местонахождении и передвижениях. Они сопоставлялись с информацией по охране психического здоровья от НИЗ и других источников, чтобы выявить потенциальные проблемы. Слишком много телефонных звонков поздней ночью, например, могли сигнализировать о более высоком риске приступов тревожного расстройства.
  • Компания Eliza, базирующаяся в Бостоне, для улучшения соблюдения режима приема препаратов пациентов отслеживает, какие виды напоминаний лучше работают с теми или иными типами людей. Умное направленное воздействие предполагает больше анализа.

Самомотивированный уход

Теперь мы живем в мире, который можно охарактеризовать фразой «Спасение пациента - дело рук самого пациента». Такие разработки, как, например, индивидуальное генетическое тестирование (23andMe.com), социальные сети пациентов и поведенческие приложения, напр., Be Well, позволяют людям контролировать состояние своего здоровья.

Это приводит ученых в восторг. В книге "Большие данные и ориентация на потребителя в здравоохранении" (Big Data and the Consumerization of Healthcare) автор предполагает включить в приложение Be Well долгосрочный анализ поведенческих моделей. Большие данные могут помочь людям создать «жизненный отчет», который сопоставит происходящие изменения с текущими условиями и даст им новое видение их благополучия.

У пациентов появляются и другие преимущества. Их опыт может послужить источником данных. В той же статье из серии статей о науке данных автор отмечает:

«В сообществах наподобие группы PatientsLikeMe зарегистрировано более 150 000 пациентов, которые рассказывают про свои симптомы, проблемы, опыт лечения и истории излечения, которые охватывают более 1000 состояний».

Это громадное количество информации о симптомах, лечении и побочных эффектах, с которой хотели бы ознакомиться больницы, фармацевтические компании и ученые.

Моделирование заболеваний и картирование

Одним из самых ярких примеров использования науки о данных в последние годы стало отслеживание заболеваний (и поиск способов, чтобы остановить или предотвратить их).

Например:

  • В 2013 году в рамках проекта 24-Hour Data Science Code-a-Thon, который запустила организация Kaiser Permanente, команды использовали технологии Hadoop для картирования случаев респираторных заболеваний (например, приступы астмы происходили в районах с более высоким уровнем содержания озона в течение более продолжительных летних периодов времени).
  • При разработке приложения с открытым исходным кодом Spatio-Temporal Epidemiological Modeler (STEM) (моделирование пространственно-временных эпидемиологических моделей), как об этом сообщалось в 2013 году, исследователи обнаружили связь между изменениями местного климата и температуры и вспышками заболеваниями малярией и лихорадкой денге.
  • Медицинский центр Mount Sinai посредством картирования мест заболеваний диабетом 2 типа надеется улучшить процедуру лечения. После выявления подобных мест исследователи сосредотачиваются на генетических факторах, которые связаны с этими средами. На основании этих исследований они могут выработать руководство для врачей и предложить более специализированное лечение.

Для подобных примеров одна иллюстрация лучше тысячи слов. Посмотрите на диабетические карты медцентра Mount Sinai, которые есть в этой статье, взятые из Fast Co.Exist.

Электронная медицинская карта

Пожалуй, самая заманчивая мечта - это полностью цифровая и поражающая своей всеобъемлемостью электронная медицинская карта (ЭМК). Иногда ее еще называют "электронная история болезни" (ЭИБ). Один этот драгоценный файл будет содержать всю информацию о здоровье пациента, данные в нем всегда будут актуальны и его можно будет переслать через любую сеть.

А долго ли еще осталось до ЭМК? Скажем так: карты от нас на расстоянии выстрела. Однако это не мешает специалистам по данным фантазировать о файле, который будет содержать:

  • Структурированные данные по каждому пациенту, обсуживающемуся в учреждении здравоохранения (например, результаты лабораторных анализов, социально-демографическая информация, история выписки рецептов и т.д.)
  • Специализированные неструктурированные данные (например, комментарии врачей-специалистов, терапевтов и медсестер)
  • Неструктурированные личные данные (например, комментарии от работников, занимающихся уходом на дому, членов семьи пациента, самих пациентов и работников социальной сферы)
  • Сохраненные изображения (например, рентгеновские снимки и МРТ)
  • Геномные данные

Департамент здравоохранения и социальных служб США уже работает над планом для обеспечения широкого внедрения ЭМК, однако успешной его реализацией будет считаться полная централизации действий между правительством и центрами.

Одна ЭМК поможет справиться со всеми проблемами? Ничего странного, история знает и другие удивительные примеры.

История анализа данных в здравоохранении

«Меня часто спрашивают, что я думаю об американской системе здравоохранения. Ну, «думаю, это была бы неплохая идея», если мы процитируем Ганди», – Пол Фармер

В пасмурные дни 1950 года вскоре после начала войны в Корее молодой физиолог/стоматолог Роберт Ледли получил предложение, от которого он не мог отказаться:

«Военные позвонили мне в Нью-Йорк... и полковник сказал мне: "Ну, если вы добровольно пойдете в армию, мы сделаем вас лейтенантом, офицером. А если вы не хотите быть добровольцем, вас все равно заберут и отправят в учебку. Поэтому я решил стать добровольцем».

После работы в больнице общего профиля Walter Reed Ледли в 1952 году пригласили в Национальное бюро стандартов. Там он впервые увидел компьютер Standards Eastern Automatic Computer (SEAC). Это была любовь с первого взгляда.

Ледли понял, что SEAC может решать сложные уравнения, которые не под силу ни одному человеку. Он увидел, что физики, математики и компьютеры могут быть объединены для решения медицинских и биологических проблем.

В 1959 году Ледли и рентгенолог Ли Б. Ластед объединили усилия и опубликовали работу под названием "Рассуждения об основах медицинской диагностики». Статья стала своеобразным букварем по техникам исследования операций, в ней затрагивалась символическая логика, теория вероятностей и полезности, и приводились мнения образованных врачей о потенциале баз данных и электронной диагностики. Компьютеризация медицины получила серьезные аргументы в свою пользу.

Медицинская информатика

Ледли был не единственным исследователем, заинтересованным в возможностях компьютерных наук. Концепция медицинской информатики – изучение ресурсов и методов управления информацией в области здравоохранения – возникала и в других странах.

Но для послевоенного и богатого правительства США эта область была особенно интересной. Работа Ледли помогла проложить путь для изменений. В период с 1960 по 1964 Национальные институты здравоохранения потратили более 40 млн долларов на открытие десятков биомедицинских исследовательских центров, занимающихся технологиями.

Также в 1960-х появилась компьютеризированная библиографическая база данных MEDLARS/MEDLINE, собранная Национальной библиотекой медицины, проводились научные исследования и эксперименты с языками программирования.

MUMPS

Одним из них стал MUMPS (Massachusetts General Hospital Utility Multi-Programming System - ОС Клинической больницы штата Массачусетс). MUMPS был разработана Нилом Паппалардо, Куртисом Марблом и Робертом Гринесом в 1966-1967 и существенно помог созданию и интеграции медицинских баз данных. Тем не менее, в начале 1970-х MUMPS стал самым распространенным языком программирования в области клинического применения.

Это время, если можно так выразиться, стало десятилетием мира, любви и данных:

  • Ранние 1960-е: Моррис Коллен, врач из отдела исследований организации Kaiser Permanente, разрабатывает систему для автоматизации процедуры 10-летнего многопрофильного медицинского обследования и создает прототип электронной медицинской карты.
  • 1965: Начинается работа по созданию Систематизированной номенклатуры в патологии (SNOP) - попытка систематизировать язык патологии для использования в компьютерных системах. В 1974 году эта работа была расширена на всю медицинскую терминологию, так появилась знаменитая Систематизированная номенклатура медицинских терминов (SNOMED).
  • 1965: Конгресс вносит поправки в Закон о социальном обеспечении для создания Medicare и Medicaid. Это вынуждает поставщиков медицинских услуг вести документацию по оказываемому уходу за больными. Интерес к медицинской информатике получает значительный импульс.

В здравоохранении начинают использовать компьютеры для формирования статистических отчетов для правительства, создания медицинских приложений, централизации медицинских записей и, самое главное, организации выставления счетов.

Обещание PROMIS

Несмотря на все эти благие начинания, компьютеризированная медицина в 1970-х оставалась сборной солянкой. Производители компьютеров не всегда понимали рынок здравоохранения, а больницы не всегда понимали, что делать с компьютерами.

Поставщики медицинских услуг, которые сделали этот решительный шаг, столкнулись с проблемами границ быстродействия и возможностей обработки. Что еще хуже, системы были слабо интегрированы между собой.

Тем не менее, медики продолжали упорно идти вперед:

  • В 1968 году доктор Лоуренс Уид разрабатывает проблемно-ориентированную медицинскую информационную систему (PROMIS). Несмотря на то, что PROMIS не получила широкого признания, это была хорошая попытка создать интегрированную систему, охватывающую все аспекты здравоохранения, включая лечение пациентов, а также проблемно-ориентированных медицинских записей (POMR).
  • В конце 1960 и начале 1970-х в рамках похожего проекта в медицинском центре Intermountain доктор Гомер Уорнер и его коллеги разработали систему HELP (оценка состояния здоровья путем логической обработки). HELP стала одной из первых версий национальной электронной медицинской карты.

И, конечно, в это же время зародился Интернет. К концу десятилетия идея коммуникационных технологий по передаче данных онлайн вышла за пределы крупных учебных медицинских центров. Врачи начали получать мгновенный доступ к компьютеризированным базам данных.

Выигрывают все

Появление доступных, более мощных технологий в конце 1970-х и начале 1980-х ускорило изменения. Крупным и многопрофильным поставщикам пришлось подстраиваться под требования отрасли. Организации начали разрабатывать протоколы для сбора информации и данных в области здравоохранения.

Однако только во второй половине 80-х и начале 90-х годов внимание медицинских технологий стало смещаться в сторону клинической интеграции и повышения качества ухода за пациентами.

Это произошло потому, что, в конце концов, все поняли, что им нужно друг от друга. Благодаря Интернету, сетевым технологиям, масштабным базам данных и разработке программного обеспечения для реляционных баз данных, данные внезапно оказались повсюду.

Даже политики взяли это на заметку. В 1996 году Эдвард Кеннеди и Нэнси Кассебаум провели через Конгресс Закон об ответственности и переносе данных о страховании здоровья граждан (HIPAA), а также закон Кеннеди – Кассебаума. Целью закона было стимулирование использования электронного обмена данными в системе здравоохранения США посредством выработки национальных стандартов для электронных транзакций в сфере здравоохранения. В HIPAA также были включены положения о конфиденциальности пациентов.

HITECH

Затем наступило новое тысячелетие, а вместе с ним появились и новые «обязательства». И как раз здесь все и усложнилось. Как пишут авторы отчета McKinsey под названием Революция больших данных в американском здравоохранении:

  • Потребители и поставщики медицинских услуг начали оцифровку историй пациентов.
  • Фармацевтические компании продолжают передавать многолетние данные научных исследований и разработок в медицинские базы данных.
  • Федеральное правительство и прочие заинтересованные стороны начали предоставлять доступ общественности к сокровищницам медицинских знаний, в том числе к данным о клинических исследованиях и информации о больных, пользующихся государственной системой страхования.

Устройства, гаджеты и КПК стали повсеместно использоваться в медицинских учреждениях. Возможности хранения данных продолжают увеличиваться. Поток доступной информации превратился в полноводную реку, наводняемую:

  • Данными исследований фармацевтических компаний (например, результатами клинических испытаний)
  • Клиническими данными (например, историями болезни пациентов)
  • Данными об услугах и стоимости процедур (например, оценки расходов на процедуры)
  • Данными о поведении пациентов (например, история обращения за медицинской помощью)
  • Биологическими данными (например, геномикой)

В 2004 году Джордж Буш учредил Бюро по национальной координации медицинских информационных технологий с целью стимулирования технологического развития и электронных информационных потоков в этой области.

Эта задача приобрела новый смысл, когда в 2009 году Конгресс принял Закон о применении медицинских информационных технологий в экономической деятельности и клинической практике (HITECH). Таким образом, правительство показало, что готово тратить миллиарды долларов на стимулирование и внедрение медицинских информационных технологий и создание общенациональной сети электронных медицинских записей (EHRs).