STATISTIK DESKRIPTIF

Oleh:  M.A.Yulianto.*)

Statistik deskriptif adalah metode dari pengorganisasian, penjumlahan, dan penyajian data dalam sebuah cara yang nyaman dan informatif, termasuk teknik grafik, dan teknik penghitungan.  Pada sesi tulisan ini teknik grafik tidak akan dibahas, penyajian teknik ini akan dijelaskan pada sesi tulisan yang lain.  Statistik deskriptif dapat mendeskripsikan data yang sedang dianalisis, tetapi tidak boleh menarik kesimpulan apapun dari data.  Untuk pengambilan keputusan, kita perlukan cabang dari ilmu statistik lainnya yaitu statistik inferensia.  Statistik inferensia akan dijelaskan pada sesi tulisan yang lain

 

Ukuran-ukuran statistik deskriptif

Ukuran statistik deskriptif dapat digolongkan menjadi dua kelompok, yaitu ukuran nilai tengah dan ukuran deviasi.  Ukuran nilai tengah terdiri dari rata-rata (mean), median, dan modus.  Sedangkan ukuran deviasi terdiri dari varians, simpangan baku, koefisien variasi, dan nilai jarak (range).  Ukuran-ukuran statistik deskriptif tersebut akan dijelaskan penggunaannya baik untuk data tunggal maupun data berkelompok.

Ukuran nilai tengah

Rata-rata (Mean)

Rata-rata ditulis dengan menggunakan simbol  μ  (dibaca:”miu”) untuk menyatakan rata-rata populasi, dan(dibaca: x bar) untuk menyatakan rata-rata sampel.  Secara aljabar rata-rata dapat ditulis sebagai berikut:

         untuk rata-rata populasi

                                                      

                        dimana N adalah banyaknya populasi

            untuk rata-rata sampel

                                                     

                        dimana n adalah banyaknya sampel

contoh:

Dari 11 pohon pear menghasilkan buah dengan berat sbb (dlm Kg):

330      284      326      268      236      346      326      402      374      292      380

Hitunglah rata-rata produksi 11 pohon pear ?

Jadi rata-rata produksi dari 11 pohon pear adalah 324 Kg.

Rata-rata untuk data berkelompok.

Apabila data sudah disajikan dalam data berkelompok seperti dalam bentuk tabel frekuensi dimana observasi-observasi dikelompokan kedalam kelas-kelas yang disebut frekuensi, maka rumus rata-ratanya adalah sebagai berikut:

        

 Contoh:  Hitunglah rata-rata nilai statistik dari 50 mahasiswa pada Table 1 dibawah ini.

                                   

                      Jadi perkiraan rata-rata nilai statistik 50 mahasiswa adalah 65,7.

  

Median

Ukuran nilai tengah lainnya yang mungkin dapat merupakan pilihan selain rata-rata adalah median.  Jika data pada contoh produksi buah pear diurutkan dari nilai terkecil hingga ke nilai terbesar, maka nilai tengahnya adalah 326 kg  artinya lima pohon pear mempunyai produksi dibawahnya dan lima pohon pear mempunyai produksi diatasnya.  Nilai tengah inilah yang dikatakan median. Penentuan median bisa langsung didapat jika jumlah observasinya adalah ganjil, namun jika jumlah observasinya adalah genap maka akan didapat dua nilai tengah. Dalam situasi demikian, untuk mendapatkan mediannya yaitu dengan merata-ratakan dua nilai tengah yang didapat.  Prosedur untuk mendapatkan median yaitu harus mengurutkan data dari yang terkecil hingga yang terbesar terlebih dahulu sebelum mengambil nilai tengahnya.  Dengan kata lain median adalah data yang ke .

 Median untuk data berkelompok

Untuk data yang sudah dikelompokkan dan disajikan dalam tabel frekuensi, maka mediannya dapat dicari dengan rumus sebagai berikut:

 

Kelas median adalah kelas dimana terdapat nilai median di dalamnya. Untuk menentukan kelas median bagilah seluruh observasi dengan dua artinya 50 % dari seluruh observasi terletak sebelum median dan 50 % lainnya terletak sesudahnya.  Jika kita lihat tabel frekuensi (Tabel 1) maka mediannya merupakan observasi yang ke (50/2) yaitu yang ke 25.  Jumlah tiga frekuensi pertama (f1 + f2 + f3) yaitu  3 + 5 + 8 = 16.  Untuk mencapai 25 observasi diperlukan 9 observasi lagi.  9 observasi tersebut dapat dipenuhi dari frekuensi keempat (f4) karena jumlah observasi f4 ada sebanyak 14 observasi.  Jadi median terletak pada kelas keempat atau kelas (60 – 69) dengan kata lain kelas keempat adalah kelas median.

contoh:  Hitunglah nilai median dari data kelompok pada Tabel 1.

 solusi:

                       

 Jadi mediannya,

                      

Pertanyaan yang mungkin timbul adalah jika kita punya data aslinya, apakah nilai median yang sebenarnya adalah 66,33?  jawabannya belum tentu, karena cara ini adalah cara interpolasi dimana data aslinya memang tidak diketahui, yang ada adalah data sudah dalam bentuk tabel frekuensi atau sudah dikelompokkan.  Walaupun hasil interpolasi ini mungkin tidak tepat, namun cara ini memberikan hasil yang mendekati nilai median yang sebenarnya.

 Modus

Modus dari suatu kelompok observasi adalah nilai observasi yang mempunyai frekuensi pemunculan paling banyak atau dengan kata lain yaitu nilai yang paling banyak muncul.  Konsep dari modus ini berhubungan dengan kemunculan yang berulang-ulang dari suatu nilai observasi.

Contoh:           jika kita gunakan data produksi 11 pohon pear, maka modus produksinya adalah 326 kg.

 Dalam kegiatan sehari-hari, modus adalah ukuran nilai tengah yang paling jarang digunakan dibanding rata-rata atau median.  Modus mungkin lebih sering digunakan pada data yang mempunyai banyak variasi dalam ukurannya, itupun untuk jumlah data yang besar.  Sebagai contoh modus dari ukuran barang yang terjual sering digunakan untuk mengetahui barang yang paling disenangi konsumen.

 Suatu distribusi atau kelompok data mungkin tidak mempunyai modus atau mungkin mempunyai modus lebih dari satu.  Distribusi yang mempunyai satu modus disebut Unimodus, yang mempunyai dua modus disebut Bimodus dan yang mempunyai modus lebih dari dua disebut Multimodus.  contoh:  Tentukan modus dari data dibawah ini, jika ada tentukan nilainya.

a).        2,         3,         5,         7,         8.

b).        2,         5,         7,         9,         9,         9,         10,       10,       11,       12.

c).        2,         3,         4,         4,         4,         5,         5,         7,         7,         7,         9.

 solusi:

Data a) tidak mempunyai modus karena semua nilai mempunyai frekuensi yang sama.

Data b) mempunyai modus = 9, karena nilai observasi ini mempunyai frekuensi paling banyak.

Data c) mempunyai dua modus yaitu 4 dan 7,  dua nilai observasi tersebut mempunyai frekuensi palingbanyak dan sama banyak.

Modus untuk data berkelompok

Apabila data sudah dikelompokkan dan disajikan dalam tabel frekuensi, maka modusnya mempunyai rumus sebagai berikut:

      

Kelas modus adalah kelas dimana terdapat nilai modus di dalamnya.

 Contoh:           Hitunglah nilai modus dari data kelompok pada Tabel 1.

 solusi:              Kelas modus adalah kelompok (60 – 69), karena kelompok ini mempunyai frekuensi paling banyak.

                         

Ukuran dispersi

 Varians

Dengan ukuran nilai tengah saja kita tidak akan pernah cukup untuk memberikan ringkasan karakteristik dari sebuah set data.  Bagaimana sebaran observari dari nilai rata-ratanya? Apakah observasi mempunyai dispersi atau penyimpangan yang besar dari rata-ratanya?   Kita biasanya memerlukan ukuran lainnya yaitu suatu ukuran tentang dispersi atau variasi didalam data. Pada kenyataannya nilai-nilai observasi suatu populasi ada yang lebih besar dari rata-rata dan ada yang lebih kecil dari rata.  Informasi ini yang biasanya merupakan keterangan tambahan mengenai karakteristik dari satu set data yaitu informasi mengenai jumlah penyimpangan dalam data. Biasanya kita tertarik dengan penyimpangan nilai-nilai observasi dalam data terhadap rata-ratanya yaitu selisihnya. Rata-rata dari selisih kuadrat tersebut merupakan suatu ukuran penyimpangan yang biasa disebut dengan varians dari observasi.  Simbol varians pada ukuran populasi adalah  (dibaca: sigma kuadrat) dan pada ukuran sampel adalah s2.

Simpangan baku

Akar dari varians dinamakan standar deviasi atau simpangan baku. Standar deviasi merupakan ukuran simpangan yang sering digunakan dalam analisa.    Nilai standar deviasi pada dasarnya menggambarkan besaran sebaran suatu kelompok data terhadap rata-ratanya atau dengan kata lain gambaran keheterogenan suatu kelompok data. Formula standar deviasi adalah sebagai berikut:

                

Contoh:  jika kita gunakan data produksi 11 pohon pear, maka varians produksinya adalah:

  

Dari hasil perhitungan didapat varians produksi dari 11 pohon pear adalah sebesar 2.575,2 kg.  sehingga standar deviasi produksinya adalah sebesar 50,75 kg.

 katakan kita mempunyai data produksi (dalam kg) sebanyak 10 pohon pear dengan jenis yang berbeda dengan kelompok 11 pohon pear sebelumnya, yaitu:

230      475      366      268      136      330      326      402      215      492

kelompok ini mempunyai nilai rata-rata yang sama dengan kelompok 11 pohon pear sebelumnya yaitu sebasar 324 kg.  Apakah dua kelompok pohon pear tersebut mempunyai kemampuan produksi yang sama?  atau dengan kata lain kelompok pohon pear mana yang lebih konsisten dalam berproduksi?  Jika harus memilih jenis pohon pear mana yang lebih konsisten berproduksi, maka kita akan memilih pohon pear pada kelompok yang mempunyai nilai varians terkecil (kelompok yang lebih homogen).

Varians untuk data berkelompok

Formula varians untuk data berkelompok adalah sebagai berikut:

    

contoh:  kita gunakan data nilai statistik 50 mahasiswa.

 Koefisien variasi

Standar deviasi dapat mengukur keheterogenan atau variasi suatu kelompok data.  Namun jika kita ingin membandingkan dua kelompok data yang mempunyai ukuran yang berbeda, standar deviasi tidak dapat digunakan artinya standar deviasi yang lebih besar tidak selalu berarti kelompok data tersebut lebih heterogen  Untuk keperluan perbandingan dua kelompok data tanpa melihat ukuran satuannya, maka dapat digunakan suatu ukuran variasi yang dinamakan koefisien variasi (CV).  Rumus CV dituliskan sebagai berikut:

       

Jika CV1 > CV2 berarti kelompok data pertama lebih bervariasi atau lebih heterogen dari pada kelompok kedua.

 

Ukuran nilai jarak (Range)

Ukuran dispersi yang paling sederhana pada suatu data numerik mungkin dengan cara menghitung selisih nilai terbesar (nilai maksimum) dengan nilai terkecil (nilai minimum).  Cara ini dikenal dengan sebutan Range.

Range = Nilai maksimum – Nilai minimum.

 

Range produksi 11 pohon pear = 402 – 306  =  96

 Ukuran Range  untuk data berkelompok

Untuk data berkelompok, nilai range dihitung berdasarkan selisih antara nilai tengah kelas terakhir dengan nilai tengah pertama atau selisih batas atas kelas terakhir dengan batas bawah kelas pertama.

Range = Nilai tengah kelas terakhir – Nilai tengah kelas pertama.

atau

Range = Bonderi atas kelas terakhir – Bonderi bawah kelas pertama.

 dari data nilai statistik 50 mahasiswa pada tabel 1, nilai rangenya adalah:

 Range =  94,5 – 34,5  =  60  (cara ini cenderung menghilangkan nilai ekstrim).

atau

Range =  99,5 – 29,5  =  70.

 

Sampai bertemu pada sesi tulisan yang lain, selamat menikmati statistik.

Jika ada pertanyaan dapat di kirim ke alamat e-mail:  yuliantoyorki@yahoo.com

*)  Penulis adalah dosen di Sekolah Tinggi Ilmu Statistik, Jakarta.

5 thoughts on “STATISTIK DESKRIPTIF

  1. Pingback: Bab VI : Pengukuran Penyimpangan (Range, Deviasi, Varian) | My World

  2. Pingback: PENGUKURAN PENYIMPANGAN | My Blog, My Archieves

  3. Pingback: PENGUKURAN PENYIMPANGAN | What's your thinking is what is a word want to write

Leave a comment