Dalam kimia analisis atau biomedis, Plot Bland–Altman (atau plot perbedaan Bland–Altman) adalah metode pembuatan plot data yang digunakan untuk menganalisis kesepakatan antara dua asai yang berbeda. Metode ini dipopulerkan dalam statistika medis oleh Martin Bland dan Doug Altman.[1][2] Di bidang lain, metode ini juga disebut plot perbedaan rata-rata Tukey, yang dinamai menurut John Tukey.[3]
Konstruksi
Pertimbangkan sampel yang terdiri dari pengamatan (misalnya, objek dengan volume yang tidak diketahui). Kedua pengujian (misalnya, metode pengukuran volume yang berbeda) dilakukan pada setiap sampel, menghasilkan titik data. Setiap sampel kemudian direpresentasikan pada grafik dengan menetapkan rata-rata dari dua pengukuran sebagai nilai , dan perbedaan antara kedua nilai tersebut sebagai nilai .
Koordinat Cartesius dari sampel tertentu dengan nilai dan yang ditentukan oleh dua pengujian adalah:
Untuk membandingkan perbedaan antara dua set sampel secara independen dari nilai rata-ratanya, lebih tepat untuk melihat rasio pasangan pengukuran.[4] Transformasi log (basis 2) dari pengukuran sebelum analisis akan memungkinkan pendekatan standar untuk digunakan, jadi plot akan diberikan oleh persamaan berikut:
Versi plot ini digunakan dalam plot MA.
Interpretasi
Interpretasi plot Bland-Altman bergantung pada konstruksi plot dan data yang ada. Variasi pada plot standar telah diperkenalkan selama bertahun-tahun dan masing-masing harus diinterpretasikan sesuai dengan konteksnya.[5]
Konstruksi asli
Plot asli menampilkan plot sebaran perbedaan antara titik data individual. Perbedaan tersebut harus berupa sistem referensi baru dikurangi standar emas. Rata-rata perbedaan diplot secara horizontal dengan batas kesepakatan diplot sejajar dengan garis perbedaan rata-rata ini. Batas kesepakatan mewakili selang kepercayaan di mana sebagian besar perbedaan terletak antara sistem. Perbedaan rata-rata mewakili bias umum antara kedua sistem; Selisih rata-rata positif menunjukkan bahwa sistem referensi umumnya menghasilkan nilai yang lebih besar relatif terhadap standar emas, dan selisih rata-rata negatif menunjukkan bahwa sistem referensi umumnya menghasilkan nilai yang lebih rendah daripada sistem yang diverifikasi.[2] Selisih rata-rata yang mendekati 0 menunjukkan kesepakatan antara dua sistem, meskipun batas kesepakatan menggambarkan lebih banyak nuansa.
Batas kesepakatan
Karena batas kesepakatan secara default bergantung pada standar deviasi data, distribusi perbedaan harus mengikuti distribusi normal. Jika distribusi perbedaan tidak normal, batas kesepakatan yang tidak bergantung pada distribusi normal dapat digunakan sebagai gantinya. Makalah lanjutan Bland dan Altman tentang topik ini menjelaskan bahwa persentil perbedaan merupakan pengganti yang sesuai dalam kasus tersebut.[4]
Bagaimanapun, batas kesepakatan lebih akurat menggambarkan kesepakatan antara sistem dibandingkan hanya selisih rata-rata. Sistem referensi baru dikatakan sebagai pengganti yang tepat untuk sistem standar emas jika batas kesepakatan berada dalam ambang batas yang telah ditentukan. Ambang batas sangat bergantung pada besarnya data, sifat sistem, dan konteks penggunaannya.[6]
Batas kesepakatan 95% dapat menjadi perkiraan parameter populasi yang tidak dapat diandalkan, terutama untuk ukuran sampel kecil, sehingga ketika membandingkan metode atau menilai pengulangan, penting untuk menghitung interval kepercayaan untuk batas kesepakatan 95%. Hal ini dapat dilakukan dengan metode perkiraan Bland dan Altman[2] atau dengan metode yang lebih tepat.[7]
Perkiraan ukuran sampel dan kekuatan statistika
Menentukan ukuran sampel yang memadai merupakan pertimbangan utama dalam analisis Bland–Altman, karena hal ini memengaruhi presisi estimasi batas kesepakatan dan kekuatan statistika untuk mendeteksi perbedaan yang bermakna secara klinis antara metode pengukuran. Secara historis, panduan formal tentang cara melakukan perhitungan kekuatan statistika atau ukuran sampel untuk studi Bland–Altman masih terbatas. Rekomendasi awal oleh Martin Bland menyarankan estimasi ukuran sampel dari lebar interval kepercayaan yang diharapkan untuk batas kesepakatan, suatu pendekatan yang tidak secara eksplisit memperhitungkan kesalahan Tipe II dan dapat menghasilkan ukuran sampel yang tidak mencukupi untuk rancangan studi tipikal.[8]
Pendekatan yang lebih ketat kemudian diperkenalkan oleh Lu et al. (2016), yang mengusulkan kerangka kerja statistika untuk menilai kekuatan statistika dan menentukan ukuran sampel berdasarkan distribusi perbedaan pengukuran dan batas kesepakatan klinis yang telah ditentukan sebelumnya.[9] Metode mereka secara eksplisit menggabungkan kontrol kesalahan Tipe II dan memberikan perkiraan yang lebih akurat tentang ukuran sampel yang dibutuhkan untuk studi yang menargetkan kekuatan statistika tertentu, biasanya 80%. Studi simulasi dalam penelitian tersebut menunjukkan kinerja yang baik dari metode tersebut dalam kondisi praktis, namun para penulis tidak menyediakan perangkat lunak yang tersedia untuk umum untuk mengimplementasikan pendekatan tersebut.
Beberapa paket perangkat lunak sekarang menyertakan implementasi metodologi Lu et al. Perangkat lunak statistika komersial MedCalc menyediakan alat estimasi ukuran sampel dan daya untuk analisis Bland–Altman.[10] Selain itu, implementasi sumber terbuka tersedia dalam paket R blandPower, yang menyediakan fungsi untuk memperkirakan kurva daya, menentukan ukuran sampel yang dibutuhkan, dan memvisualisasikan lebar interval kepercayaan sebagai fungsi ukuran sampel. Paket blandPower dikembangkan untuk mempromosikan reproduksibilitas dan aksesibilitas perhitungan daya dan ukuran sampel untuk studi perbandingan metode menggunakan kerangka kerja Bland–Altman.
Variasi visualisasi
Jika perbedaan tumbuh secara proporsional terhadap besarnya data, maka data tersebut dikatakan memiliki "bias proporsional". Ada banyak metode untuk memvisualisasikan plot dan analisis selanjutnya untuk mengakomodasinya.[11]
Pertama, regresi linear dapat mengilustrasikan tren yang relevan. Jika distribusi perbedaan sama di semua titik di sekitar regresi, data dikatakan homoskedastik dan trennya adalah bias proporsional sederhana. Sebaliknya, jika data memiliki sebaran yang lebih luas pada berbagai besaran data, maka perbedaannya dikatakan heteroskedastik, yang memiliki implikasi lebih lanjut. Uji statistika seperti uji Breusch–Pagan atau uji White dapat memberikan indikator statistika heteroskedastisitas.
Plot Bland–Altman yang menunjukkan kemungkinan bias proporsional
Salah satu contoh tipikal plot dengan data heteroskedastik adalah plot yang variasi perbedaannya tumbuh proporsional terhadap besaran data, divisualisasikan sebagai bentuk "v" yang meluas.[11] Dalam kasus seperti itu, mungkin lebih tepat untuk memvisualisasikan proporsi titik data antar sistem daripada perbedaan mentah.[12] Demikian pula, plot perbedaan dapat divisualisasikan secara logaritmik.[11] Dalam kedua kasus tersebut, hubungan antara kedua sistem menggambarkan hubungan perkalian, bukan hubungan linier. Hal ini juga menunjukkan bahwa besarnya data berkorelasi dengan variasi akurasi sistem.
Penggunaan
Salah satu penggunaan utama plot Bland-Altman adalah untuk membandingkan dua pengukuran klinis yang menghasilkan keluaran sinambung.[13] Plot ini dapat digunakan untuk membandingkan sistem referensi, teknik, atau metode baru dengan standar emas yang terverifikasi, tetapi standar emas tidak berarti tanpa kesalahan.[4]
Agar plot dapat digunakan untuk memverifikasi sistem referensi, ambang batas biasanya telah ditentukan sebelumnya yang harus dilampaui oleh batas kesepakatan. Nilai ambang batas bergantung pada berbagai konteks di mana sistem dan data tersebut berada.[6]
Kemampuan untuk memverifikasi sistem referensi menjadikan plot ini memiliki penerapan dan keunggulan yang luas di banyak bidang. Selama bertahun-tahun, metode ini telah mendapatkan popularitas di bidang optometri, ilmu gizi, radiologi, ilmu lingkungan, bedah, kedokteran, kedokteran hewan, rekayasa, dan psikologi, untuk menyebutkan beberapa di antaranya.[6][14][15][16][17][18] Banyak rekomendasi dan artikel ilmiah juga telah diterbitkan dalam upaya untuk menyempurnakan teknik, konstruksi statistika yang mendasarinya, dan validitas plot.[19][20]
Lihat Analyze-it, MedCalc, NCSS, GraphPad Prism, R, StatsDirect, atau JASP untuk perangkat lunak yang menyediakan plot Bland–Altman.
Catatan
Metode serupa diusulkan pada tahun 1981 oleh Eksborg.[21] Metode ini didasarkan pada regresi Deming, metode yang diperkenalkan oleh Adcock pada tahun 1878.
Makalah Lancet karya Bland dan Altman [2] berada di urutan ke-29 dalam daftar 100 makalah yang paling banyak dikutip sepanjang masa dengan lebih dari 23.000 kutipan.[22]
Lihat juga
Plot MA
Plot Gardner–Altman
Referensi
↑Altman DG, Bland JM (1983). "Measurement in medicine: the analysis of method comparison studies". The Statistician. 32 (3): 307–317. doi:10.2307/2987937. JSTOR2987937.
↑Ludbrook, John (2010-01-19). "Confidence in Altman–Bland plots: A critical review of the method of differences". Clinical and Experimental Pharmacology and Physiology. 37 (2): 143–149. doi:10.1111/j.1440-1681.2009.05288.x. ISSN0305-1870. PMID19719745.
123Ludbrook, John (2010-01-19). "Confidence in Altman–Bland plots: A critical review of the method of differences". Clinical and Experimental Pharmacology and Physiology. 37 (2): 143–149. doi:10.1111/j.1440-1681.2009.05288.x. ISSN0305-1870. PMID19719745.
↑Carkeet, Andrew (January 2020). "A Review of the Use of Confidence Intervals for Bland-Altman Limits of Agreement in Optometry and Vision Science". Optometry and Vision Science. 97 (1): 3–8. doi:10.1097/opx.0000000000001465. ISSN1538-9235. PMID31895271.
↑Nieuwenhuijsen, Mark (June 2015). "A71 Variability in and agreement between modelled and personal continuously measured black carbon levels using novel smartphone and sensor technologies". Journal of Transport & Health. 2 (2): S42. Bibcode:2015JTHea...2S..42N. doi:10.1016/j.jth.2015.04.559. ISSN2214-1405.
↑Haghayegh, Shahab; Kang, Hyeon-Ah; Khoshnevis, Sepideh; Smolensky, Michael H.; Diller, Kenneth R. (2020). "A comprehensive guideline for Bland–Altman and intra class correlation calculations to properly compare two methods of measurement and interpret findings". Physiological Measurement. 41 (5). Bibcode:2020PhyM...41e5012H. doi:10.1088/1361-6579/ab86d6. PMID32252039.