Източници на големи данни в медицината

by Кевин Хванг, MD, МРН; Прегледано от д-р Ричард Н. Фогорос

Опростеното дефиниране на големи данни в медицината е "съвкупността от данни, свързани със здравното обслужване и благосъстоянието на пациентите" (Raghupathi 2014). Но какво точно са тези видове данни и откъде идват?

По-долу е даден общ преглед на видовете и източниците на големи данни, които представляват интерес за доставчиците на здравни услуги, изследователите, платците, политиците и индустрията.

Тези категории не се изключват взаимно, защото същите данни могат да произхождат от различни източници.

Този списък не е изчерпателен, защото практическото приложение на големи анализи на данни със сигурност ще продължи да се разширява.

Клинични информационни системи

Това са традиционни източници на клинични данни, които доставчиците на здравни услуги са свикнали да гледат.

Електронните здравни досиета (ЕЗД) събират, съхраняват и показват информация като демографски данни, история в миналото, активни медицински проблеми, имунизации, алергии, лекарства, жизнени показатели, резултати от лабораторни и радиологични тестове, патологични доклади, доставчици и административни и финансови документи
Електронните медицински записи (EMR) не са идентични с ЕЗД и обикновено се отнасят за данни, съхранявани от определен лекар.
Обменът на здравна информация служи като център между различни системи за клинична информация

Регистрите на пациентите, поддържани от здравни организации на техните собствени пациенти, често са свързани с ЕЗД. Други регистри проследяват имунизации, рак, травми и други проблеми, свързани с общественото здраве, в по-широк географски мащаб.

Портите за пациенти позволяват на пациентите да получат лична здравна информация, съхранявана в ЕЗД на здравната организация. Някои портали за пациенти също така позволяват на потребителите да изискват попълване на рецепта и да обменят сигурни електронни съобщения със здравния екип.

Клиничните складове за данни обобщават данните на ниво пациент от множество клинични информационни системи, като EHR и други източници, изброени по-горе

Изисква данни от платци

Публичните платци (напр. Medicare) и частните платци имат големи хранилища с данни за вземанията на техните бенефициенти. Някои здравни застрахователи вече предлагат и стимули за споделяне на вашите здравни данни.

Изследователски изследвания

Изследователските бази данни съдържат информация за участниците в проучването, експерименталните лечения и клиничните резултати. Големите проучвания обикновено се финансират от фармацевтични компании или правителствени агенции. Прилагането на персонализирано лекарство трябва да съответства на отделните пациенти с ефективно лечение, основано на модели в данните от клиничните изпитвания.

Този подход се простира извън прилагането на основани на доказателства медицински принципи, с които доставчикът на здравни грижи определя дали пациентът споделя широки характеристики (например възраст, пол, раса, клиничен статус) с участниците в изпитването. С големи анализи на данните е възможно да се избере лечение, основано на много по-подробна информация, като например генетичния профил на рака на пациента (виж по-долу).

Системите за подпомагане на клиничните решения (CDSS) също се развиват бързо и сега представляват голяма част от изкуствения интелект (AI) в медицината.

Те използват данни от пациенти, за да подпомагат клиницистите при вземането на решения и често се комбинират с ЕЗД.

Генетични бази данни

Съхраняването на човешката генетична информация продължава да се натрупва с бързи темпове. Тъй като проектът за човешкия геном е завършен през 2003 г., цената на човешката ДНК последователност е била намалена с милион пъти. Проектът "Персонален геном" (PGP), стартиран през 2005 г. от Харвардското медицинско училище, се стреми към последователност и популяризиране на пълните геноми на 100 000 доброволци от цял свят. Самият PGP е отличен пример за голям проект за данни, благодарение на пълния обем и разнообразието от данни.

Личният геном съдържа около 100 гигабайта данни. В допълнение към секвенциониращите геноми, PGP също събира данни от EHRs, проучвания и микробиометрични профили.

Редица компании предлагат директна генетична секвенция за здравето, личните черти и фармакогенетиката на търговска основа.

Тази лична информация може да бъде подложена на големи анализи на данни. Например 23 ине спря да предлага генетични доклади, свързани със здравето, на нови клиенти от 22 ноември 2013 г., за да се съобрази с Американската администрация по храните и лекарствата. Въпреки това, през 2015 г. компанията отново започна да предлага някои здравни компоненти на техния генетичен тест за слюнка отново, този път с одобрението на FDA.

Обществени записи

Правителството поддържа подробни записи за събития, свързани със здравето, като имиграция, брак, раждане и смърт. Преброяването на САЩ е събрало огромно количество информация на всеки 10 години от 1790 г. Статистическият уебсайт за статистиката имаше 370 милиарда клетки от 2013 г., с приблизително 11 милиарда повече годишно.

Уеб търсения

Информацията за търсене в мрежата, събрана от Google и други доставчици на уеб търсене, може да предостави информация в реално време, свързана със здравето на населението. Стойността на големи данни от моделите за търсене в мрежата обаче може да се подобри, като се съчетаят с традиционните източници на данни за здравето.

Социална медия

Facebook, Twitter и други социални медийни платформи генерират богато разнообразие от данни денонощно, давайки представа за местоположението, здравословното поведение, емоциите и социалните взаимодействия на потребителите. Прилагането на големи данни от социалните медии за общественото здраве е посочено като цифрово откриване на заболявания или дигитална епидемиология. Twitter, например, е използван за анализ на грипните епидемии сред населението.

Проектът за световно благоденствие, който започна в университета в Пенсилвания, е още един пример за изучаване на социалните медии, за да се разбере по-добре опита и здравето на хората. Проектът обединява психолози, статистици и компютърни специалисти, които анализират езика, използван при взаимодействие онлайн, например, когато пишат актуализации на състоянието на Facebook и Twitter. Учените наблюдават как езикът на потребителите се отнася до тяхното здраве и щастие. Авансите в обработката на естествения език и машинното обучение подпомагат усилията си. Неотдавнашна публикация от Университета на Пенсилвания разглежда начините за предсказване на психични заболявания чрез анализ на социалните медии. Изглежда, че симптомите на депресия и други психично-здравни състояния могат да бъдат открити чрез изучаване на нашето използване на Интернет. Учените се надяват, че в бъдеще тези методи ще могат по-добре да идентифицират и помагат на рисковите индивиди.

Интернет на нещата (IoT)

Огромни количества информация, свързана със здравеопазването, също се събират и съхраняват на мобилни и домашни устройства .

Смартфони : Хиляди приложения на mHealth улавят информация за физическата активност на потребителя, хранителния прием, съня, емоциите и други параметри. Настройките за местни мобилни телефони (напр. GPS, електронна поща, текстови съобщения) също могат да дадат улики за здравословното състояние на дадено лице.
Поносими монитори и устройства: Педометрите, акселерометрите, часовниците, часовниците и чиповете, вградени под кожата, също събират информация, свързана със здравето, и могат също да ги изпращат в облака.
Устройствата за телемедицина позволяват на доставчиците на здравни услуги да наблюдават параметрите на пациентите като кръвно налягане, сърдечен ритъм, дихателна честота, оксигенация, температура, ЕКГ и теглото.

Финансови транзакции

Паричните транзакции с кредитни карти на пациентите са включени в прогнозните модели, използвани от системата Carolinas HealthCare, за идентифициране на пациенти, които са с висок риск от реанимация в болницата. Доставчикът на здравни услуги, базиран в Шарлот, използва големи данни, за да разделя пациентите на различни групи, например въз основа на заболяване и географско местоположение.

Етични и поверителни последици

Трябва да се подчертае, че в някои случаи може да има важни етични последици и последици за неприкосновеността на личния живот при събирането и достъпа до данни в здравеопазването. Новите източници на големи данни могат да подобрят разбирането ни за въздействията върху здравето на хората и населението, но все пак различните рискове трябва да бъдат внимателно обмислени и наблюдавани. Също така е известно, че данните, считани за анонимни, могат да бъдат идентифицирани отново. Например професор Латания Суини от Лабораторията за защита на личните данни на Харвард прегледа 1 130 доброволци, участващи в проекта "Личен геном". Тя и екипът й са могли да посочат правилно 42% от участниците въз основа на информацията, която са споделили (пощенски код, дата на раждане, пол). Това знание може да повиши осведомеността ни за потенциалните рискове и да ни помогне да вземем по-добри решения за обмен на данни.

> Източници:

> Конуей М, О'Конър Д. Социални медии, големи данни и психично здраве: настоящи постижения и етични последици. Текущо мнение в психологията 2016; 9: 77-82.

> Фернандес Л., О'Конър М, Уивър В. Големи данни, по-големи резултати. Списание на Американската асоциация за управление на здравната информация 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern М, Ungar L, Eichstaedt J. Откриване на депресия и психични заболявания в социалните медии: интегриращ преглед . Текущо мнение в поведенческите науки 2017; 18: 43-49.

> Лазер Д, Кенеди Р, Крал Г, Веспиняни А. Притчата за Грипът на Google: капани в голям анализ на данните . Наука 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Големи анализи на данни в здравеопазването: обещание и потенциал. Здравна информационна наука и системи 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Идентифициране на участниците в проекта по личен геном по име . Харвардския университет. Лаборатория за защита на данните. Бяла книга 1021-1. 24 април 2013 г.