Posted on Februari 2, 2010 by Junaidi Show
Langkah awal dalam menganalisis data adalah mempelajari karakteristik dari data tersebut. Untuk itu, kita perlu mengetahui misalnya pemusatan dan penyebaran data dari nilai tengahnya, nilai ekstrim atau outliernya, dan beberapa pengukuran lainnya.
Dalam boxplot juga ditunjukkan, jika ada, nilai outlier dari observasi.
Suatu nilai dikatakan outlier jika: Selanjutnya, suatu nilai dikatakan ekstrim jika lebih besar dari Q3 + (3 x IQR) atau lebih kecil dari Q1 – (3 x IQR) Sebagaimana yang dikemukakan sebelumnya, selain untuk melihat derajat penyebaran data (yang dapat dilihat dari tinggi/lebar box), boxplot juga dapat digunakan untuk menilai kesimetrisan data. Jika data simetris, garis median akan berada di tengah box dan whisker pada bagian atas dan bagian bawah akan memiliki panjang yang sama. Jika data tidak
simetris (condong), median tidak akan berada di tengah box dan salah satu dari whisker lebih panjang dari yang lainnya. Filed under: Tip-Trik(1) | Tagged: Tip-Trik(1) | Dari Wikipedia bahasa Indonesia, ensiklopedia bebas Dalam statistika deskriptif, diagram kotak garis atau boxplot adalah metode grafis untuk menggambarkan kumpulan data numerik berdasarkan nilai kuartilnya.[1] Diagram kotak garis bersifat nonparametrik, artinya diagram ini menampilkan variasi sampel populasi statistik tanpa membuat asumsi apa pun tentang distribusi statistik yang mendasarinya. Jarak antara bagian-bagian kotak yang berbeda menunjukkan derajat dispersi (sebaran), kemiringan, dan pencilan dari data tersebut. Diagram kotak garis dapat digambarkan secara horizontal maupun vertikal. Elemen diagram kotak garis[sunting | sunting sumber]Gambar 2. Diagram kotak garis dengan garis yang memanjang dari nilai minimum hingga nilai maksimum Gambar 3. Diagram kotak garis yang sama dengan garis IQR maksimum 1,5 Diagram kotak garis merupakan salah satu cara sederhana untuk menampilkan kumpulan data berdasarkan ringkasan lima angka dari data tersebut. Ringkasan lima angka yang dimaksud yakni: Minimum : nilai terendah dari kumpulan data, tidak termasuk pencilan. Maksimum : nilai terbesar dari kumpulan data, tidak termasuk pencilan. Median (Q2 / persentil ke-50): nilai tengah kumpulan data. Kuartil pertama (Q1 / persentil ke-25): juga dikenal sebagai kuartil bawah qn(0.25), adalah median dari bagian bawah kumpulan data. Kuartil ketiga (Q3 / persentil ke-75): juga dikenal sebagai kuartil qn(0.75), adalah median dari bagian atas kumpulan data.[2] Elemen penting lain dalam pembuatan diagram kotak garis adalah jangkauan interkuartil (Interquartile range, IQR). Jangkauan interkuartil adalah jarak antara kuartil atas dan bawah, dinotasikan sebagai: Diagram kotak garis terdiri atas dua bagian, yakni sebuah kotak dan satu pasang garis (seperti pada Gambar 2). Titik terendah dalam diagram merupakan nilai minimum dari dataset, sementara titik tertingginya merupakan nilai maksimum dari dataset. Sebuah kotak digambar dari Q1 ke Q3 kemudian garis horizontal digambar di tengahnya untuk menunjukkan median. kumpulan data yang sama juga dapat direpresentasikan sebagai diagram kotak garis seperti yang ditunjukkan pada Gambar 3. Pertama, lakukan pengukuran sejauh 1,5 kali IQR dari kuartil atas. Kemudian sebuah garis ditarik dari kuartil atas menuju nilai terbesar dalam dataset yang berada dalam jarak 1,5 kali IQR. Hal yang sama juga dilakukan pada bagian bawah. Sebuah garis ditarik dari kuartil bawah menuju nilai terkecil dalam dataset yang berada dalam jarak 1,5 kali IQR, diukur dari bawah kuartil bawah. Semua titik lainnya dianggap sebagai pencilan.[3] Meskipun demikian, garis dalam diagram ini dapat mewakili beberapa kemungkinan nilai lainnya, seperti:
Data apapun yang tidak termasuk dalam garis harus diplot sebagai pencilan dengan simbol titik, lingkaran kecil, atau bintang, meskipun terkadang hal ini tidak dilakukan. Selain itu, beberapa diagram kotak turut menyertakan simbol tambahan untuk menunjukkan nilai rata-rata data.[4][5] Variasi[sunting | sunting sumber]Diagram ini telah memiliki banyak variasi sejak dipopulerkan oleh matematikawan John W. Tukey pada tahun 1969. Dua varian paling umum adalah diagram kotak lebar variabel dan plot kotak berlekuk (lihat Gambar 4). Plot kotak lebar variabel menggambarkan ukuran setiap grup yang datanya sedang diplot dengan membuat lebar kotak proporsional dengan ukuran grup. Konvensi yang populer adalah membuat lebar kotak proporsional dengan akar kuadrat dari ukuran grup.[6] Contoh[sunting | sunting sumber]Contoh diagram kotak garis tanpa pencilan[sunting | sunting sumber]Gambar 5. Diagram kotak garis yang menggambarkan contoh di sebelah kiri tanpa pencilan. Temperatur udara di suatu tempat diukur tiap jam dalam satuan Fahrenheit. Temperatur yang terukur kemudian disajikan dalam urutan data: 50, 50, 55, 58, 63, 66, 66, 67, 67, 68, 69, 70, 70, 70, 70, 72, 73, 75, 75, 76, 76, 78, 79, 81. Sebuah diagram kotak garis kemudian dibuat menggunakan patokan nilai minimum, maksimum, median, kuartil pertama, dan kuartil ketiga dari data temperatur tersebut. Pada kasus ini, temperatur minimum hari itu adalah 50 °F, maksimum 81 °F, dan median temperatur 70 °F. Kuartil pertama / kuartil bawah data adalah 66 °F, yang mana merupakan nilai tengah antara 50 °F (nilai minimum) dan 70 °F (median). Nilai kuartil ketiga / kuartil atas data temperatur adalah 75 °F, yang mana merupakan nilai tengah antara 70 °F (median) dan 81 °F (maksimum). Jangkauan interkuartil, atau IQR, kemudian dapat dihitung: Oleh karena itu, didapatkan bahwa 1.5 IQR di atas kuartil ketiga adalah: Sementara 1.5IQR di bawah kuartil pertama adalah: Garis bagian atas dari diagram kotak garis memanjang dari kuartil ketiga hingga nilai data terbesar yang lebih kecil dari 1.5IQR di atas kuartil ketiga. Pada persoalan ini, 1,5IQR di atas kuartil ketiga adalah 88,5 °F dan nilai maksimum yang berada dalam rentang tersebut adalah 81 °F. Oleh karena itu, garis bagian atas digambar dari kuartil ketiga hingga 81 °F. Serupa dengan garis bagian atas, garis bagian bawah dari diagram kotak garis memanjang dari kuartil pertama hingga nilai data terkecil yang lebih besar dari 1.5IQR di bawah kuartil pertama. Pada persoalan ini, 1,5IQR di bawah kuartil pertama adalah 52,5 °F dan nilai minimum yang memenuhi adalah 55 °F. Dengan demikian, garis bagian bawah digambar dari kuartil pertama hingga 55 °F. Contoh dengan pencilan[sunting | sunting sumber]Gambar 6. Diagram kotak garis yang dihasilkan dari contoh di sebelah kiri dengan pencilan. Pada contoh ini, diberikan kumpulan data terurut: 52, 57, 57, 58, 63, 66, 66, 67, 67, 68, 69, 70, 70, 70, 70, 72, 73, 75, 75, 76, 76, 78, 79, 89. Nilai median, kuartil pertama, dan kuartil ketiga sama dengan contoh sebelumnya. Sementara itu, ditambahkan data tambahan pada awal dan akhir sehingga nilai minimum dan maksimumnya berubah menjadi 52 dan 89 berturut-turut. Pada persoalan ini, nilai maksimum kumpulan data adalah 89 °F, sementara 1.5IQR di atas kuartil ketiga adalah 88,5 °F. Karena nilai maksimum lebih besar daripada kuartil ketiga ditambah 1.5IQR, maka nilai maksimum merupakan pencilan. Oleh karena itu, garis bagian atas digambar hingga nilai terbesar yang lebih kecil dari 1,5IQR di atas kuartil ketiga, yaitu 79 °F. Hal yang serupa juga berlaku pada bagian bawah. Nilai minimum kumpulan data ini adalah 52 °F, sementara 1.5IQR di bawah kuartil pertama adalah 52.5 °F. Karena nilai minimum lebih kecil daripada 1.5IQR dikurangi kuartil pertama, maka minimum juga merupakan pencilan. Oleh karena itu, garis bawah digambar pada nilai terkecil yang lebih besar dari 1,5IQR di bawah kuartil pertama, yaitu 57 °F. Dalam kasus kumpulan data besar[sunting | sunting sumber]Persamaan umum untuk menghitung kuantil empiris[sunting | sunting sumber]Contoh data di atas merupakan kumpulan data dengan 24 titik data, artinya n = 24. Anda juga dapat menghitung median, kuartil pertama, dan kuartil ketiga secara matematis: Median : Kuartil pertama : Kuartil ketiga : Visualisasi[sunting | sunting sumber]Diagram kotak garis memungkinkan pemeriksaan grafis yang cepat dari satu atau lebih kumpulan data. Diagram kotak garis mungkin tampak lebih primitif daripada histogram atau perkiraan kerapatan kernel. Meskipun demikian, diagram ini membutuhkan lebih sedikit ruang sehingga sangat berguna untuk membandingkan distribusi antara beberapa kelompok atau kumpulan data (lihat Gambar 1 sebagai contoh). Pemilihan teknik jumlah dan lebar batang dapat sangat memengaruhi tampilan histogram, sementara pilihan lebar pita dapat sangat memengaruhi tampilan perkiraan kepadatan kernel. Salah satu cara untuk memahami diagram kotak garis adalah membandingkannya dengan fungsi kepadatan probabilitas (histogram teoritis) untuk distribusi normal N (0,σ2). Hal ini karena distribusi statistik lebih umum ditemukan daripada diagram kotak (Gambar 7). Angka 8. Diagram kotak garis yang menampilkan kemiringan Lihat pula[sunting | sunting sumber]
Referensi[sunting | sunting sumber]
Bacaan lebih lanjut[sunting | sunting sumber]
Pranala luar[sunting | sunting sumber]
Apa itu Box plot?Boxplot adalah salah satu visualisasi dalam statistik deskriptif untuk menggambarkan secara grafik dari data numerik. Dalam membaca grafik Boxplot terdapat lima ukuran statistik yang bisa digunakan sebagai acuan diantaranya: Nilai minimum atau nilai observasi terkecil.
Bagaimana cara membuat boxplot?Tahapan membuat Box Plot :
Buat kotak dengan ujung-ujung kuartil 1 dan kuartil 3. Buat garis pada kuartil 2, sehingga kotak terbagi menjadi 2. Buat garis dari ujung dengan nilai kecil hingga 1.5 kali jarak antar kuartil. Buat garis dari ujung dengan nilai besar hingga 1.5 kali jarak antar kuartil.
Apa keuntungan diagram boxplot?Boxplots dapat membantu kita dalam memahami karakteristik dari distribusi data. Selain untuk melihat derajat penyebaran data (yang dapat dilihat dari tinggi/panjang boxplot) juga dapat digunakan untuk menilai kesimetrisan sebaran data.
Apa itu outlier pada boxplot?Outlier/Pencilan artinya suatu angka yang memiliki nilai yang sangat berbeda jauh dengan nilai dari angka lainya pada data, angkanya bernilai 3/2 lebih besar dari quartil yang paling atas atau angkanya bernilai 3/2 lebih kecil dari quartil terendah.
|