Sumber Data Besar dalam Perubatan

by Kevin Hwang, MD, MPH; Diulas oleh Richard N. Fogoros, MD

Takrif ringkas mengenai data besar dalam perubatan adalah "keseluruhan data yang berkaitan dengan penjagaan kesihatan pesakit dan kesejahteraan" (Raghupathi 2014). Tetapi apa sebenarnya jenis data ini, dan dari mana asalnya?

Berikut adalah gambaran luas mengenai jenis dan sumber data besar yang menarik untuk penyedia penjagaan kesihatan, penyelidik, pembayar, penggubal dasar, dan industri.

Kategori ini tidak saling eksklusif, kerana data yang sama dapat berasal dari berbagai sumber.

Juga senarai ini tidak lengkap, kerana aplikasi praktikal analisis data besar pasti akan terus berkembang.

Sistem Maklumat Klinikal

Ini adalah sumber tradisional data klinikal yang pembekal penjagaan kesihatan biasa untuk melihat.

Rekod kesihatan elektronik (EHR) mengumpul, menyimpan dan memaparkan maklumat seperti demografi, sejarah perubatan yang lalu, masalah perubatan yang aktif, imunisasi, alahan, ubat-ubatan, tanda-tanda vital, hasil ujian makmal dan radiologi, laporan patologi, nota kemajuan yang dicipta oleh penjagaan kesihatan pembekal, dan dokumen pentadbiran dan kewangan
Rekod perubatan elektronik (EMRs) tidak sama dengan EHR dan biasanya berkaitan dengan data yang disimpan dengan doktor tertentu.
Pertukaran maklumat kesihatan berfungsi sebagai hab antara sistem maklumat klinikal yang berbeza

Pendaftaran pesakit, yang diselenggarakan oleh organisasi penjagaan kesihatan pada pesakit mereka sendiri, sering dikaitkan dengan EHR. Pendaftaran lain melacak imunisasi, kanser, trauma, dan isu kesihatan awam yang lain pada skala geografi yang lebih luas.

Portal pesakit membolehkan pesakit mengakses maklumat kesihatan peribadi yang disimpan dalam EHR organisasi penjagaan kesihatan. Sesetengah portal pesakit juga membenarkan pengguna untuk meminta isi semula reskripsi dan bertukar mesej elektronik yang selamat dengan pasukan penjagaan kesihatan.

Gudang data klinikal mengumpulkan data tahap pesakit dari pelbagai sistem maklumat klinikal, seperti EHR dan sumber lain yang disenaraikan di atas

Tuntutan Data Daripada Pembayar

Pembayar awam (contohnya Medicare) dan pembayar swasta mempunyai repositori besar data tuntutan ke atas benefisiari mereka. Beberapa syarikat insurans kesihatan kini menawarkan insentif untuk berkongsi data kesihatan anda.

Kajian Penyelidikan

Pangkalan data penyelidikan mengandungi maklumat mengenai peserta kajian, rawatan eksperimen, dan hasil klinikal. Kajian-kajian besar biasanya ditaja oleh syarikat-syarikat farmaseutikal atau agensi-agensi kerajaan. Aplikasi ubat yang diperibadikan adalah untuk memadankan pesakit individu dengan rawatan yang berkesan, berdasarkan corak dalam data percubaan klinikal.

Pendekatan ini bergerak melampaui menerapkan prinsip perubatan berasaskan bukti, di mana seorang pembekal penjagaan kesihatan menentukan sama ada pesakit berkongsi ciri-ciri yang luas (contohnya umur, jantina, bangsa, status klinikal) dengan peserta percubaan. Dengan analitik data yang besar, adalah mungkin untuk memilih rawatan berdasarkan maklumat yang lebih berbutir, seperti profil genetik kanser pesakit (lihat di bawah).

Sistem sokongan keputusan klinikal (CDSS) juga telah berkembang pesat dan kini mewakili sebahagian besar kecerdasan buatan (AI) dalam perubatan.

Mereka menggunakan data pesakit untuk membantu doktor membuat keputusan mereka dan sering digabungkan dengan EHR.

Pangkalan Data Genetik

Repositori maklumat genetik manusia terus berkumpul pada kadar yang pesat. Sejak Projek Genom Manusia selesai pada tahun 2003, kos penjujukan DNA manusia telah dikurangkan sebanyak sejuta kali ganda. Projek Genom Peribadi (PGP), yang dilancarkan pada tahun 2005 oleh Sekolah Perubatan Harvard, bertujuan untuk menyusun dan mempublikasikan genom lengkap 100,000 sukarelawan dari seluruh dunia. PGP itu sendiri merupakan contoh utama projek data besar disebabkan oleh jumlah dan pelbagai data.

Satu genom peribadi mengandungi kira-kira 100 gigabait data. Sebagai tambahan kepada penjujukan genom, PGP juga mengumpul data dari EHRs, survei, dan profil microbiome.

Sejumlah syarikat menawarkan penjujukan genetik langsung kepada pengguna untuk kesihatan, ciri-ciri peribadi, dan farmakogenik secara komersil.

Maklumat peribadi ini boleh ditundukkan kepada analisis data besar. Sebagai contoh, 23andMe berhenti menawarkan laporan genetik berkaitan kesihatan kepada pelanggan baru pada 22 November 2013, untuk mematuhi Pentadbiran Makanan dan Ubat-ubatan AS. Walau bagaimanapun, pada tahun 2015, syarikat itu mula menawarkan komponen kesihatan tertentu bagi ujian air liur genetik mereka, kali ini dengan kelulusan FDA.

Rekod Awam

Kerajaan menyimpan catatan terperinci mengenai peristiwa-peristiwa yang berkaitan dengan kesihatan, seperti imigresen, perkahwinan, kelahiran, dan kematian. Banci Amerika Syarikat telah mengumpulkan sejumlah besar maklumat setiap 10 tahun sejak 1790. Laman web statistik Banci mempunyai 370 bilion sel pada tahun 2013, dengan kira-kira 11 bilion lebih banyak ditambah setiap tahun.

Carian Web

Maklumat carian web yang dikumpulkan oleh Google dan penyedia carian web lain boleh memberikan wawasan masa nyata yang berkaitan dengan kesihatan penduduk. Walau bagaimanapun, nilai data besar dari corak carian web mungkin diperbaiki dengan menggabungkannya dengan sumber data kesihatan tradisional.

Media Sosial

Facebook, Twitter dan platform media sosial lain menjana pelbagai data yang banyak di sekeliling jam, memberikan pandangan ke lokasi, tingkah laku kesihatan, emosi, dan interaksi sosial pengguna. Penggunaan data sosial media besar untuk kesihatan awam telah dirujuk sebagai pengesanan penyakit digital atau epidemiologi digital. Twitter, sebagai contoh, telah digunakan untuk menganalisis wabak influenza di kalangan penduduk umum.

Projek Kesejahteraan Dunia yang bermula di University of Pennsylvania adalah satu lagi contoh untuk mengkaji media sosial untuk memahami pengalaman dan kesihatan orang yang lebih baik. Projek ini menyatukan ahli psikologi, ahli statistik dan saintis komputer yang menganalisis bahasa yang digunakan semasa berinteraksi dalam talian, contohnya, ketika menulis kemas kini status di Facebook dan Twitter. Para saintis mengamati bagaimana bahasa pengguna berkaitan dengan kesihatan dan kebahagiaan mereka. Kemajuan dalam pemprosesan bahasa semulajadi dan pembelajaran mesin membantu dengan usaha mereka. Penerbitan baru-baru ini dari University of Pennsylvania memandang cara meramal penyakit mental dengan menganalisis media sosial. Nampaknya gejala kemurungan dan keadaan kesihatan mental yang lain dapat dikesan dengan mengkaji penggunaan Internet kami. Para saintis berharap pada masa depan kaedah ini dapat mengenal pasti dan membantu individu yang berisiko.

Internet Perkara (IoT)

Tudung besar maklumat berkaitan kesihatan juga dikumpulkan dan disimpan di peranti mudah alih dan rumah .

Telefon pintar : Beribu-ribu aplikasi mHealth menangkap maklumat mengenai aktiviti fizikal pengguna, pengambilan nutrisi, pola tidur, emosi, dan parameter lain. Aplikasi telefon bimbit asli (misalnya GPS, e-mel, menghantar teks) juga boleh memberi petunjuk mengenai status kesihatan individu.
Monitor dan peranti boleh pakai: Pedometer, pecutan, gelas, jam tangan, dan cip yang tertanam di bawah kulit juga mengumpulkan maklumat berkaitan kesihatan dan juga boleh menghantarnya ke awan.
Peranti telemedicine membenarkan pembekal penjagaan kesihatan untuk memantau parameter pesakit seperti tekanan darah, kadar denyutan jantung, kadar pernafasan, oksigenasi, suhu, pelepasan ECG, dan berat badan.

Urus Niaga Kewangan

Urus niaga kad kredit pesakit dimasukkan ke dalam model ramalan yang digunakan oleh Carolinas HealthCare System untuk mengenal pasti pesakit yang berisiko tinggi untuk dimasukkan semula ke hospital. Penyedia penjagaan kesihatan berasaskan Charlotte menggunakan data besar untuk membahagikan pesakit kepada pelbagai kumpulan, contohnya, berdasarkan penyakit dan lokasi geografi.

Implikasi Etika dan Privasi

Perlu diingatkan bahawa, dalam beberapa kes, mungkin terdapat implikasi etika dan privasi yang penting ketika mengumpulkan dan mengakses data dalam penjagaan kesihatan. Sumber-sumber data besar baru dapat meningkatkan pemahaman kita tentang apa yang mempengaruhi individu dan kesihatan penduduk, bagaimanapun, risiko yang berbeza perlu dipertimbangkan dan dipantau dengan teliti. Kini kini telah diakui bahawa data yang sebelum ini dianggap tanpa nama, boleh dikenalpasti semula. Sebagai contoh, Profesor Latanya Sweeney dari Makmal Privasi Data Harvard telah mengkaji 1,130 sukarelawan yang terlibat dalam Projek Genom Peribadi. Beliau dan pasukannya dapat menyebut nama 42 peratus peserta dengan betul berdasarkan maklumat yang mereka kongsi (kod pos, tarikh lahir, jantina). Pengetahuan ini dapat meningkatkan kesadaran kita terhadap potensi risiko dan membantu kita membuat keputusan perkongsian data yang lebih baik.

> Sumber:

> Conway M, O'Connor D. Media sosial, data besar, dan kesihatan mental: kemajuan semasa dan implikasi etika. Pendapat Semasa dalam Psikologi 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Data besar, hasil yang lebih besar. Jurnal Persatuan Pengurusan Maklumat Kesihatan Amerika 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Mengesan kemurungan dan penyakit mental di media sosial: semakan integratif . Pendapat Semasa dalam Sains Kelakuan 2017; 18: 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. Perumpamaan Flu Google: Perangkap dalam Analisis Data Besar . Sains 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Analisis data besar dalam penjagaan kesihatan: janji dan potensi Sains dan Sistem Maklumat Kesihatan 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Mengenal pasti Peserta dalam Projek Genom Peribadi oleh Nama . Universiti Harvard. Makmal Privasi Data. Kertas Putih 1021-1. 24 April 2013.