Plot Bland–Altman

Dalam kimia analisis atau biomedis, Plot Bland–Altman (atau plot perbedaan Bland–Altman) adalah metode pembuatan plot data yang digunakan untuk menganalisis kesepakatan antara dua asai yang berbeda. Metode ini dipopulerkan dalam statistika medis oleh Martin Bland dan Doug Altman.^[1]^[2] Di bidang lain, metode ini juga disebut plot perbedaan rata-rata Tukey, yang dinamai menurut John Tukey.^[3]

Konstruksi

Pertimbangkan sampel yang terdiri dari $n$ pengamatan (misalnya, objek dengan volume yang tidak diketahui). Kedua pengujian (misalnya, metode pengukuran volume yang berbeda) dilakukan pada setiap sampel, menghasilkan $2n$ titik data. Setiap sampel $n$ kemudian direpresentasikan pada grafik dengan menetapkan rata-rata dari dua pengukuran sebagai nilai $x$ , dan perbedaan antara kedua nilai tersebut sebagai nilai $y$ .

Koordinat Cartesius dari sampel $S$ tertentu dengan nilai $S_{1}$ dan $S_{2}$ yang ditentukan oleh dua pengujian adalah:

S(x,y)=\left({\frac {S_{1}+S_{2}}{2}},S_{1}-S_{2}\right).

Untuk membandingkan perbedaan antara dua set sampel secara independen dari nilai rata-ratanya, lebih tepat untuk melihat rasio pasangan pengukuran.^[4] Transformasi log (basis 2) dari pengukuran sebelum analisis akan memungkinkan pendekatan standar untuk digunakan, jadi plot akan diberikan oleh persamaan berikut:

S(x,y)=\left({\frac {\log _{2}S_{1}+\log _{2}S_{2}}{2}},\log _{2}S_{1}-\log _{2}S_{2}\right).

Versi plot ini digunakan dalam plot MA.

Interpretasi

Interpretasi plot Bland-Altman bergantung pada konstruksi plot dan data yang ada. Variasi pada plot standar telah diperkenalkan selama bertahun-tahun dan masing-masing harus diinterpretasikan sesuai dengan konteksnya.^[5]

Konstruksi asli

Plot asli menampilkan plot sebaran perbedaan antara titik data individual. Perbedaan tersebut harus berupa sistem referensi baru dikurangi standar emas. Rata-rata perbedaan diplot secara horizontal dengan batas kesepakatan diplot sejajar dengan garis perbedaan rata-rata ini. Batas kesepakatan mewakili selang kepercayaan di mana sebagian besar perbedaan terletak antara sistem. Perbedaan rata-rata mewakili bias umum antara kedua sistem; Selisih rata-rata positif menunjukkan bahwa sistem referensi umumnya menghasilkan nilai yang lebih besar relatif terhadap standar emas, dan selisih rata-rata negatif menunjukkan bahwa sistem referensi umumnya menghasilkan nilai yang lebih rendah daripada sistem yang diverifikasi.^[2] Selisih rata-rata yang mendekati 0 menunjukkan kesepakatan antara dua sistem, meskipun batas kesepakatan menggambarkan lebih banyak nuansa.

Batas kesepakatan

Karena batas kesepakatan secara default bergantung pada standar deviasi data, distribusi perbedaan harus mengikuti distribusi normal. Jika distribusi perbedaan tidak normal, batas kesepakatan yang tidak bergantung pada distribusi normal dapat digunakan sebagai gantinya. Makalah lanjutan Bland dan Altman tentang topik ini menjelaskan bahwa persentil perbedaan merupakan pengganti yang sesuai dalam kasus tersebut.^[4]

Bagaimanapun, batas kesepakatan lebih akurat menggambarkan kesepakatan antara sistem dibandingkan hanya selisih rata-rata. Sistem referensi baru dikatakan sebagai pengganti yang tepat untuk sistem standar emas jika batas kesepakatan berada dalam ambang batas yang telah ditentukan. Ambang batas sangat bergantung pada besarnya data, sifat sistem, dan konteks penggunaannya.^[6]

Batas kesepakatan 95% dapat menjadi perkiraan parameter populasi yang tidak dapat diandalkan, terutama untuk ukuran sampel kecil, sehingga ketika membandingkan metode atau menilai pengulangan, penting untuk menghitung interval kepercayaan untuk batas kesepakatan 95%. Hal ini dapat dilakukan dengan metode perkiraan Bland dan Altman^[2] atau dengan metode yang lebih tepat.^[7]

Perkiraan ukuran sampel dan kekuatan statistika

Menentukan ukuran sampel yang memadai merupakan pertimbangan utama dalam analisis Bland–Altman, karena hal ini memengaruhi presisi estimasi batas kesepakatan dan kekuatan statistika untuk mendeteksi perbedaan yang bermakna secara klinis antara metode pengukuran. Secara historis, panduan formal tentang cara melakukan perhitungan kekuatan statistika atau ukuran sampel untuk studi Bland–Altman masih terbatas. Rekomendasi awal oleh Martin Bland menyarankan estimasi ukuran sampel dari lebar interval kepercayaan yang diharapkan untuk batas kesepakatan, suatu pendekatan yang tidak secara eksplisit memperhitungkan kesalahan Tipe II dan dapat menghasilkan ukuran sampel yang tidak mencukupi untuk rancangan studi tipikal.^[8]

Pendekatan yang lebih ketat kemudian diperkenalkan oleh Lu et al. (2016), yang mengusulkan kerangka kerja statistika untuk menilai kekuatan statistika dan menentukan ukuran sampel berdasarkan distribusi perbedaan pengukuran dan batas kesepakatan klinis yang telah ditentukan sebelumnya.^[9] Metode mereka secara eksplisit menggabungkan kontrol kesalahan Tipe II dan memberikan perkiraan yang lebih akurat tentang ukuran sampel yang dibutuhkan untuk studi yang menargetkan kekuatan statistika tertentu, biasanya 80%. Studi simulasi dalam penelitian tersebut menunjukkan kinerja yang baik dari metode tersebut dalam kondisi praktis, namun para penulis tidak menyediakan perangkat lunak yang tersedia untuk umum untuk mengimplementasikan pendekatan tersebut.

Beberapa paket perangkat lunak sekarang menyertakan implementasi metodologi Lu et al. Perangkat lunak statistika komersial MedCalc menyediakan alat estimasi ukuran sampel dan daya untuk analisis Bland–Altman.^[10] Selain itu, implementasi sumber terbuka tersedia dalam paket R blandPower, yang menyediakan fungsi untuk memperkirakan kurva daya, menentukan ukuran sampel yang dibutuhkan, dan memvisualisasikan lebar interval kepercayaan sebagai fungsi ukuran sampel. Paket blandPower dikembangkan untuk mempromosikan reproduksibilitas dan aksesibilitas perhitungan daya dan ukuran sampel untuk studi perbandingan metode menggunakan kerangka kerja Bland–Altman.

Variasi visualisasi

Jika perbedaan tumbuh secara proporsional terhadap besarnya data, maka data tersebut dikatakan memiliki "bias proporsional". Ada banyak metode untuk memvisualisasikan plot dan analisis selanjutnya untuk mengakomodasinya.^[11]

Pertama, regresi linear dapat mengilustrasikan tren yang relevan. Jika distribusi perbedaan sama di semua titik di sekitar regresi, data dikatakan homoskedastik dan trennya adalah bias proporsional sederhana. Sebaliknya, jika data memiliki sebaran yang lebih luas pada berbagai besaran data, maka perbedaannya dikatakan heteroskedastik, yang memiliki implikasi lebih lanjut. Uji statistika seperti uji Breusch–Pagan atau uji White dapat memberikan indikator statistika heteroskedastisitas.

Salah satu contoh tipikal plot dengan data heteroskedastik adalah plot yang variasi perbedaannya tumbuh proporsional terhadap besaran data, divisualisasikan sebagai bentuk "v" yang meluas.^[11] Dalam kasus seperti itu, mungkin lebih tepat untuk memvisualisasikan proporsi titik data antar sistem daripada perbedaan mentah.^[12] Demikian pula, plot perbedaan dapat divisualisasikan secara logaritmik.^[11] Dalam kedua kasus tersebut, hubungan antara kedua sistem menggambarkan hubungan perkalian, bukan hubungan linier. Hal ini juga menunjukkan bahwa besarnya data berkorelasi dengan variasi akurasi sistem.

Penggunaan

Salah satu penggunaan utama plot Bland-Altman adalah untuk membandingkan dua pengukuran klinis yang menghasilkan keluaran sinambung.^[13] Plot ini dapat digunakan untuk membandingkan sistem referensi, teknik, atau metode baru dengan standar emas yang terverifikasi, tetapi standar emas tidak berarti tanpa kesalahan.^[4]

Agar plot dapat digunakan untuk memverifikasi sistem referensi, ambang batas biasanya telah ditentukan sebelumnya yang harus dilampaui oleh batas kesepakatan. Nilai ambang batas bergantung pada berbagai konteks di mana sistem dan data tersebut berada.^[6]

Kemampuan untuk memverifikasi sistem referensi menjadikan plot ini memiliki penerapan dan keunggulan yang luas di banyak bidang. Selama bertahun-tahun, metode ini telah mendapatkan popularitas di bidang optometri, ilmu gizi, radiologi, ilmu lingkungan, bedah, kedokteran, kedokteran hewan, rekayasa, dan psikologi, untuk menyebutkan beberapa di antaranya.^[6]^[14]^[15]^[16]^[17]^[18] Banyak rekomendasi dan artikel ilmiah juga telah diterbitkan dalam upaya untuk menyempurnakan teknik, konstruksi statistika yang mendasarinya, dan validitas plot.^[19]^[20]

Lihat Analyze-it, MedCalc, NCSS, GraphPad Prism, R, StatsDirect, atau JASP untuk perangkat lunak yang menyediakan plot Bland–Altman.

Catatan

Metode serupa diusulkan pada tahun 1981 oleh Eksborg.^[21] Metode ini didasarkan pada regresi Deming, metode yang diperkenalkan oleh Adcock pada tahun 1878.

Makalah Lancet karya Bland dan Altman ^[2] berada di urutan ke-29 dalam daftar 100 makalah yang paling banyak dikutip sepanjang masa dengan lebih dari 23.000 kutipan.^[22]

Lihat juga

Plot MA
Plot Gardner–Altman

Referensi

↑ Altman DG, Bland JM (1983). "Measurement in medicine: the analysis of method comparison studies". The Statistician. 32 (3): 307–317. doi:10.2307/2987937. JSTOR 2987937.
1 2 3 4 Bland JM, Altman DG (1986). "Statistical methods for assessing agreement between two methods of clinical measurement" (PDF). Lancet. 327 (8476): 307–10. CiteSeerX 10.1.1.587.8931. doi:10.1016/S0140-6736(86)90837-8. PMID 2868172. S2CID 2844897.
↑ Cleveland WS (1993). Visualizing data. Murray Hill, N.J.: At & T Bell Laboratories. hlm. 22–23. ISBN 978-0-9634884-0-4. OCLC 29456028.
1 2 3 Bland JM, Altman DG (1999). "Measuring agreement in method comparison studies". Statistical Methods in Medical Research. 8 (2): 135–60. doi:10.1177/096228029900800204. PMID 10501650. S2CID 9851097.
↑ Ludbrook, John (2010-01-19). "Confidence in Altman–Bland plots: A critical review of the method of differences". Clinical and Experimental Pharmacology and Physiology. 37 (2): 143–149. doi:10.1111/j.1440-1681.2009.05288.x. ISSN 0305-1870. PMID 19719745.
1 2 3 Zaki, Rafdzah; Bulgiba, Awang; Ismail, Roshidi; Ismail, Noor Azina (2012-05-25). "Statistical Methods Used to Test for Agreement of Medical Instruments Measuring Continuous Variables in Method Comparison Studies: A Systematic Review". PLOS ONE. 7 (5) e37908. Bibcode:2012PLoSO...737908Z. doi:10.1371/journal.pone.0037908. ISSN 1932-6203. PMID 22662248.
↑ Carkeet A (2015). "Exact parametric confidence intervals for Bland–Altman Limits of Agreement" (PDF). Optometry and Vision Science. 92 (3): e71 – e80. doi:10.1097/OPX.0000000000000513. PMID 25650900. S2CID 11643889.
↑ "Sample size for a study of agreement between two methods of measurement". www-users.york.ac.uk. Diakses tanggal 2025-10-07.
↑ Lu, Meng-Jie; Zhong, Wei-Hua; Liu, Yu-Xiu; Miao, Hua-Zhang; Li, Yong-Chang; Ji, Mu-Huo (2016-11-01). "Sample Size for Assessing Agreement between Two Methods of Measurement by Bland−Altman Method". The International Journal of Biostatistics (dalam bahasa Inggris). 12 (2). doi:10.1515/ijb-2015-0039. ISSN 1557-4679.
↑ Schoonjans, Frank. "MedCalc statistical software - free trial available". MedCalc (dalam bahasa Inggris). Diakses tanggal 2025-10-07.
1 2 3 Ludbrook, John (2010-01-19). "Confidence in Altman–Bland plots: A critical review of the method of differences". Clinical and Experimental Pharmacology and Physiology. 37 (2): 143–149. doi:10.1111/j.1440-1681.2009.05288.x. ISSN 0305-1870. PMID 19719745.
↑ Giavarina, Davide (2015). "Understanding Bland Altman analysis". Biochemia Medica. 25 (2): 141–151. doi:10.11613/bm.2015.015. ISSN 1846-7482. PMC 4470095. PMID 26110027.
↑ Hanneman SK (2008). "Design, analysis, and interpretation of method-comparison studies". AACN Advanced Critical Care. 19 (2): 223–234. doi:10.1097/01.AACN.0000318125.41512.a3. PMC 2944826. PMID 18560291.
↑ Carkeet, Andrew (January 2020). "A Review of the Use of Confidence Intervals for Bland-Altman Limits of Agreement in Optometry and Vision Science". Optometry and Vision Science. 97 (1): 3–8. doi:10.1097/opx.0000000000001465. ISSN 1538-9235. PMID 31895271.
↑ Moore, A Russell (2023-08-24). "A review of <scp>Bland–Altman</scp> difference plot analysis in the veterinary clinical pathology laboratory". Veterinary Clinical Pathology. 53 (S1): 75–85. doi:10.1111/vcp.13293. ISSN 0275-6382. PMID 37620637.
↑ Sato, Ryo; Sawaya, Yohei; Ishizaka, Masahiro; Yin, Lu; Shiba, Takahiro; Hirose, Tamaki; Urano, Tomohiko (31 January 2024). "Neck circumference is a highly reliable anthropometric measure in older adults requiring long-term care". PeerJ. 12 e16816. doi:10.7717/peerj.16816. ISSN 2167-8359. PMC 10838066. PMID 38313007.
↑ Nieuwenhuijsen, Mark (June 2015). "A71 Variability in and agreement between modelled and personal continuously measured black carbon levels using novel smartphone and sensor technologies". Journal of Transport & Health. 2 (2): S42. Bibcode:2015JTHea...2S..42N. doi:10.1016/j.jth.2015.04.559. ISSN 2214-1405.
↑ Haghayegh, Shahab; Kang, Hyeon-Ah; Khoshnevis, Sepideh; Smolensky, Michael H.; Diller, Kenneth R. (2020). "A comprehensive guideline for Bland–Altman and intra class correlation calculations to properly compare two methods of measurement and interpret findings". Physiological Measurement. 41 (5). Bibcode:2020PhyM...41e5012H. doi:10.1088/1361-6579/ab86d6. PMID 32252039.
↑ Olofsen, Erik; Dahan, Albert; Borsboom, Gerard; Drummond, Gordon (2015-02-01). "Improvements in the application and reporting of advanced Bland–Altman methods of comparison". Journal of Clinical Monitoring and Computing (dalam bahasa Inggris). 29 (1): 127–139. doi:10.1007/s10877-014-9577-3. ISSN 1573-2614. PMID 24806333.
↑ Oke, Gerke (May 2020). "Reporting Standards for a Bland–Altman Agreement Analysis: A Review of Methodological Reviews". Diagnostics (dalam bahasa Inggris). 10 (5). doi:10.3390/diagno (tidak aktif 1 July 2025). ISSN 2075-4418. Diarsipkan dari asli tanggal 2025-03-20. Pemeliharaan CS1: DOI nonaktif per Juli 2025 (link)
↑ Eksborg S (1981) Evaluation of method-comparison data. Clin Chem 27:1311–1312
↑ Van Noorden R, Maher B, Nuzzo R (2014). "The top 100 papers". Nature. 514 (7524): 550–553. Bibcode:2014Natur.514..550V. doi:10.1038/514550a. ISSN 0028-0836. PMID 25355343.