ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Этика и правовое регулирование использования больших баз данных в медицине
1 Российский национальный исследовательский медицинский университет имени Н. И. Пирогова, Москва, Россия
2 Научно-исследовательский институт системной биологии и медицины Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека, Москва, Россия
3 Федеральное медико-биологическое агентство, Москва, Россия
4 Российская медицинская академия непрерывного профессионального образования, Москва, Россия
5 Московский государственный юридический университет имени О. Е. Кутафина (МГЮА), Москва, Россия
Для корреспонденции: Наталья Васильевна Орлова
ул. Островитянова, д. 1, г. Москва, 117997, Россия; ur.xednay@513hcarv
Финансирование: работа выполнена авторами в ФБУН НИИ СБМ Роспотребнадзора в рамках государственного задания «Разработка методов молекулярно‑генетической диагностики для квантификации саногенеза у здоровых людей», код научной темы «Норма», номер государственного учета научно‑исследовательской, опытно‑конструкторской работы в ЕГИСУ НИОКТР 122030900062–5
Вклад авторов: Н. В. Орлова — анализ научного материала, обзор публикаций по теме статьи, составление резюме, написание текста статьи; Г. Н. Суворов, К. С. Горбунов — разработка дизайна статьи, редактирование статьи.
ЕДИНАЯ ИНФОРМАЦИОННАЯ БАЗА ДАННЫХ В ЗДРАВООХРАНЕНИИ РОССИИ
В здравоохранении Российской Федерации ускоренными темпами осуществляется переход к цифровой медицине. Стратегия цифровой трансформации здравоохранения включает создание единого цифрового контура, медицинские платформенные решения федерального уровня, персональные медицинские помощники, искусственный интеллект. Реализация новых проектов направлена на обеспечение единого подхода к оказанию медицинской помощи, внедрение системы контроля, статистического учета и анализа, использование электронных документов для управления системой здравоохранения. Планируемое широкое применение информационных технологий в медицине должно соответствовать этическим нормам и основываться на законодательной базе.
В целях совершенствования информационных технологий вышло постановление Правительства Российской Федерации от 09.02.2022 № 140 «О единой государственной информационной системе в сфере здравоохранения (ЕГИСЗ)» [1]. ЕГИСЗ должна связать между собой все региональные медицинские организации. Функции ЕГИСЗ включают обработку и хранение медицинской документации и сведений о здоровье граждан, формирование аналитической информации на основе обезличенных персональных данных с дальнейшим использованием в статистике и исследованиях, а также для разработок и применения решений на основе искусственного интеллекта. ЕГИСЗ должна объединить сведения о лекарственном обеспечении граждан, в том числе имеющих право на льготное обеспечение лекарствами и медицинскими изделиями, включить федеральные базы медицинских документов о смерти и о рождении, структурированные электронные медицинские карты, централизованные системы «Лабораторные исследования» и «Центральный архив медицинских изображений». Создание единой информационной базы данных в здравоохранении позволит улучшить взаимодействие медицинских учреждений, повысит доступность и эффективность оказания медицинской помощи, в том числе с использованием искусственного интеллекта и телемедицинских консультаций.
БОЛЬШИЕ БАЗЫ ДАННЫХ В МЕДИЦИНЕ
Сбор и архивирование медицинских данных в медицине имеют многовековую историю. Накопление в здравоохранении больших данных (от англ. Big Data) с применением информационных технологий значительно расширяет возможности их использования и может стать эффективным инструментом для развития как практической медицины, так и в научных целях для изучения распространенности и патогенеза заболеваний, выявления факторов риска и разработки новых эффективных методов лечения. Использование в Big Data медицинских карт (ЭМК), в том числе электронных, а также других медицинских документов сопряжено с рядом трудностей: некачественное заполнение ЭМК, многократное дублирование данных, отсутствие полноты данных и единой системы ведения ЭМК, отсутствие структурированности записей. Организационные проблемы связаны с устаревшими технологиями в отдельных медицинских организациях, отсутствием единой нормативно-справочной информации. Реализация проекта цифровой трансформации здравоохранения с формированием ЕГИСЗ направлена на устранение вышеперечисленных проблем, что позволит более широко использовать базу данных в научных исследованиях. Возможности информационных технологий уже сейчас позволяют использовать ЭМК. Для извлечения информации из ЭМК и машинной обработки требуется специальная подготовка, включая извлечение информации с помощью искусственного интеллекта и других технологий, позволяющих извлекать данные из неструктурированных записей, очистку, преобразование, фильтрацию, разделение, перевод, объединение, сортировку и проверку данных [2].
В современной медицине Вig Data наиболее востребованы в биоинформатике и биомедицине. Проекты по геномному секвенированию включают тысячи людей, животных, насекомых и микроорганизмов. Использование больших баз расширяет диагностические возможности интерпретации результатов массивного параллельного секвенирования. Результаты исследований применяются для определения риска заболеваний, диагностики, включая пренатальное тестирование, прогнозирования течения заболеваний, создание качественно новых препаратов. Технологии с использованием больших баз данных применяются для исследования микробиома. Базы данных содержат информацию в масштабе миллиардов коротких считываний, которые можно развернуть для создания композиционных и функциональных профилей сотен и тысяч видов микробов, существующих в данном микробиоме [3].
Использование больших данных и блокчейнов в фармакологии позволяет значительно расширить число исследовательских центров и сократить продолжительность клинических исследований лекарственных средств. Использование Вig Data в системной биологии и медицине позволяет выявлять маркеры прогноза различных заболеваний. Для поиска биомаркеров применяются модели множественного воздействия для выявления их взаимосвязи с иммуномом, эпигенетикой — мишенями для метилирования микроРНК и ДНК и длиной теломер. Проводится оценка влияния окружающей среды на организм в зависимости от генетического статуса [4]. С помощью больших данных и искусственного интеллекта расширяются возможности прогнозирования катастрофических событий, в том числе эпидемий [5].
Большие данные анализируются и используются во всех сферах жизни. Ожидается, что в будущем одна треть информационных данных во всем мире придется на здравоохранение. Кроме ЭМК в качестве больших баз используют медицинские регистры различных заболеваний (ВИЧ-инфекция, туберкулез, онкологические и др.), базы когортных и клинических исследований, биобанки и паномику. Уже сейчас существующие базы данных включают от тысяч до миллионов человек. Например, Датская когорта DOC * X содержит социально-экономические данные и сведения о состоянии здоровья более 6 миллионов взрослых и 1,2 миллиона детей, геномные данные Британского биобанка составляют около полумиллиона британских граждан, база данных «Многопараметрический интеллектуальный мониторинг в интенсивной терапии II» (MIMIC–II) включает около 30 000 пациентов отделения интенсивной терапии.
ЭТИЧЕСКИЕ ПРОБЛЕМЫ ИСПОЛЬЗОВАНИЯ БОЛЬШИХ БАЗ ДАННЫХ
В медицинские Вig Data входят демографические данные, результаты лабораторных и инструментальных исследований, информация о проведенном лечении. Использование информации о пациентах ставит перед исследователями этические вопросы. Биомедицинские данные представляют собой сведения, составляющие врачебную тайну, которая защищена законодательством. Право на конфиденциальность подразумевает, что личная информация, предоставленная пациентами, не будет раскрыта позже без его разрешения, за исключением случаев, установленных этически и юридически. Информационные технологии в сфере здравоохранения включают защиту целостности и конфиденциальности данных. Согласно регламентирующим документам одним из основных требований ЕГИСЗ является обезличивание данных [6]. Это в значительной мере ограничивает возможности интерпретации полученных результатов, включая оценку роли окружающей среды, гигиенических характеристик условий жизни, производственных факторов риска, особенности системы здравоохранения в регионе проживания. В настоящее время для изучения влияния различных факторов на изменение биомаркеров используют эпидемиологические, экологические, географические, климатические, демографические данные, анализ социальных сетей, статистические сведения лечебных учреждений, экономические и социологические показатели. На эти сведения не распространяется закон о врачебной тайне. Однако анализ больших баз данных позволяет по косвенным параметрам определить индивидуумов с особенными характеристиками. Например, по обеспечению лекарственными препаратами можно определить пациентов с ВИЧ-инфекцией, туберкулезом, орфанными заболеваниями и др. Применение технологий по изучению цифровых следов нарушает тайну личной жизни. Анализ запросов в социальных сетях может прогнозировать риск суицида и правоправных действий. Регистры пациентов с инвалидностью, генетическими нарушениями, психическими заболеваниями, алкоголизмом, наркоманией в случае раскрытия приватности данных могут привести к дискриминации при приеме на работу, страхованию, кредитованию и другим негативным социальным последствиям. Базы данных представляют интерес как коммерческих структур, так и у государственных органов.
Анализ этических проблем при использовании больших баз, проведенный Ienca M, et al., показал, что доминирующей проблемой является неприкосновенность частной жизни и конфиденциальность (n = 146), на втором месте находятся проблемы информированного согласия (n = 49), честность и справедливость (n = 34) — на третьем месте, доверие (n = 23) — на 4-м, далее — право собственности и др. (рисунок) [7].
Использование больших баз данных выявило ряд новых этических проблем. Анализ взаимосвязи параметров больших баз данных с этническими особенностями, географическим местоположением, загрязнением окружающей среды создают прецеденты необходимости защиты по «групповой идентичности». Информация о предрасположенности большой группы людей, объединенных по определенному признаку, к психическим, генетическим заболеваниям, сексуальной ориентации, наркомании, преступности среди несовершеннолетних, может потенциально привести к проблемам индивидуумов в различных сферах жизни. Совет Европы предложил признать право «не подвергаться профилированию» в качестве нового права для предотвращения дискриминации отдельных лиц или групп людей [8].
Использование больших данных позволяет выявить закономерности между условиями окружающей среды, образом жизни и заболеваемостью. Возникают этические риски использования данной информации не только для разработки рекомендаций, а принуждения к изменению образа жизни на государственном уровне, что приводит к ограничению индивидуального права на неприкосновенность частной жизни.
Еще одной этической проблемой является интерпретация полученных данных в результате анализа больших баз. За счет включения большого количества пациентов исследования на основе больших баз данных обладают высоким уровнем доказательности. Однако результаты могут зависеть от опыта и добросовестности учреждений и лиц, осуществляющих анализ баз данных и интерпретацию. Результаты, полученные при анализе больших баз, не обладают безусловной доказательностью и нуждаются в дополнительной проверке, а также необходимости дополнения данными других исследований [9].
ПРАВОВОЕ РЕГУЛИРОВАНИЕ ИСПОЛЬЗОВАНИЯ БОЛЬШИХ БАЗ ДАННЫХ
Вопросы биомедицинской этики при использовании больших баз данных рассматриваются в документах разных стран.
- Большие данные: использование возможностей, сохранение ценностей (Администрация Президента США, 2014) [10].
- Сбор, связывание и использование данных в биомедицинских исследованиях и здравоохранении: этические проблемы, Наффилдский Совет по биоэтике (Великобритания, 2015) [11].
- Большие данные и суверенитет медицинских данных как формирование информационной свободы (Немецкий совет по этике, 2017) [12].
- Этический кодекс IMIA для специалистов по медицинской информатике и Кодекс профессионального и этического поведения AMIA [13, 14].
Этические вопросы использования персональных медицинских данных нашли отражение в международных документах. Всемирная медицинская ассоциация в 2016 г. опубликовала декларацию об этических соображениях в отношении баз данных здравоохранения и биобанков [15]. В 2016 г. в Европе был принят Регламент (ЕС) 2016/679 Европейского парламента и Совета о защите физических лиц в отношении обработки персональных данных и о свободном перемещении таких данных [16]. В 2017 г. был принят Отчет Международного комитета по биоэтике ЮНЕСКО о больших данных и здоровье (2017) [8].
ВАРИАНТЫ РЕШЕНИЯ ЭТИЧЕСКИХ ПРОБЛЕМ ИСПОЛЬЗОВАНИЯ БОЛЬШИХ БАЗ ДАННЫХ
Решение этических проблем, связанных с конфиденциальностью, предлагает несколько алгоритмов безопасности медицинских данных, целью которых является способность информационной системы безопасного хранения, создание программ, исключающих выявление любой связи между реальными и псевдоидентификационными данными. Для повышения безопасности предполагается использование шифрования (ключ, алгоритм) информации, которая могла бы идентифицировать пациента, а также код доступа в виде пароля. Вариантом меры безопасности рассматривается возможность использования «пустых псевдоидентификаций», которые повышают безопасность за счет уменьшения возможности сопоставления информационных данных с реальной личностью [17].
Для защиты данных предлагается метод псевдонимизации, при котором идентификационные данные преобразуются, а затем заменяются спецификатором, который не может быть связан с идентификационными данными без знания определенного пароля. Для конфиденциальности рекомендуется исключение хранения личной информации с псевдонимизированными данными, что приводит к необходимости создания двух баз: одна — с личной информацией, а вторая — с псевдонимизированными данными.
Более широкая модель основана на защите доступа к базе данных путем шифрования самого хранилища с ключами доступа для обслуживающего персонала. Однако даже такие модели «управления доступом» могут быть обойдены с помощью информационных технологий или людьми, работающими внутри системы [18].
В каждой стране есть надзорный орган, который следит за соблюдением интересов пациентов и регулирует рынок медицинских услуг. В России это Росздравнадзор, в США — Управление по контролю за качеством пищевых продуктов, медикаментов и косметических средств (Food and Drug Administration). В России защита конфиденциальности существенно ограничивает доступ к медицинским сведениям. Владельцем своих биомедицинских данных является пациент. Доступ к информации и ее обработка возможны только с разрешения человека, подписавшего информированное согласие на эти действия. В информированном согласии указывается организация, которой дается разрешение, и цели сбора и обработки данных.
В настоящее время использование больших баз данных сопряжено с дилеммой, обусловленной, с одной стороны, законодательной защитой прав пациентов, а с другой — снижением аналитических возможностей использования информации [19]. Решением данной дилеммы могли бы стать деперсонифицированность данных и возможность их использования без согласия пациента. Законодательная база России в настоящее время допускает использование даже деперсонифицированных данных только внутри лечебного учреждения, которому пациент делегировал разрешение, в соответствии с указанными целями в информированном согласии. В перспективе это требует изменения законодательства для возможности использования деперсонифицированных данных без согласия пациента, что предполагает переход на правообладание деперсонифицированными данными государству. Необходимо создание государственной структуры, ответственной за хранение данных, и регулирующей ее использование.
Исследование вторичных медицинских данных обычно проводится только в том случае, если получено согласие пациента или данные полностью анонимны. В настоящее время информированное согласие, как правило, дается единожды, при госпитализации, включении в клиническое исследование и др. Это ограничивает использование баз данных для ретроспективной оценки или в других исследовательских целях. Существующая в ряде стран практика «Динамического согласия» подразумевает временное обновление согласия на использование данных, когда пациенты могут дать повторное согласие на использование данных, в том числе отличное от первоначального. Это могло бы содействовать сотрудничеству с пациентом, а также расширило бы возможность пациентов контролировать использование своих данных. Практика «Широкого согласия» подразумевает использование данных более чем в одном клиническом исследовании, при условии, что проекты связаны с определенной областью или направлением исследований [8].
ЗАКЛЮЧЕНИЕ
Анализ больших данных позволяет выявлять закономерности влияния различных факторов на биосистемы, расширяет возможности клинических исследований, медицинского образования, клинической практики, улучшает идентификацию и профилактику заболеваний, оценку эффективности лечения, прогнозирования. Анализ больших данных в области здравоохранения, с одной стороны, открывает огромный потенциал для научных исследований, а с другой — повышает риски доступности личных данных пациентов [20].
Этика использования больших баз должна основываться на решении следующих задач:
- усиление мер контроля за хранением и использованием информации;
- уважение частной жизни отдельных лиц и групп людей со схожими профилями;
- информированное согласие лиц на передачу данных, а также надлежащая практика в отношении способов их получения;
- ответственность медицинских работников, исследователей, менеджеров и компьютерных специалистов за их профессиональную деятельность при работе с большими базами.