BAB I
RUANG LINGKUP STATISTIK
1.1. Pengertian Statistik dan Statistika
Saat ini, banyak sekali keputusan dan kebijakan baik pemerintah, lembaga swasta maupun perorangan yang memerlukan statistik dan statitika. Bahkan dalam sebuah penelitian baik itu penelitian yang dilakukan oleh perorangan ataupun kelompok juga memerlukan statistik dan statistika. Ternyata betapa statistik dan statistika itu sangat kita butuhkan. Pertanyaan yang mungkin muncul sekarang adalah: Apa yang dimaksud dengan statistik dan statistika itu? Apa perbedaan kedua istilah itu? Kata statistika berakar dari kata Latin status yang berarti negara (bahasa Inggris: state).
Statistik adalah Kumpulan data, bilangan/non bilangan yang disusun dalam tabel dan atau diagram, yang melukiskan atau menggambarkan suatu persoalan.
Statistika adalah “Ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi dan mempresentasikan data”
Statistika dikelompokkan dalam dua kelompok yaitu statistika deskriptif dan statistika inferensia.
1.Statistika deskriptif adalah metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. Perlu kiranya dimengerti bahwa statistika deskriptif memberikan informasi hanya mengenai data yang dipunyai dan sama sekali tidak menarik kesimpulan yang lebih banyak dan lebih jauh dari data yang ada. Kegiatan memeriksa sifat-sifat penting dari data yang ada itu disebut analisis data secara pemerian (deskripsi). Karenanya bagian statistika demikian dinamakan Statistika Deskriptif atau Statistika Perian. Penyusunan tabel, diagram, modus, kuartil, simpangan baku termasuk dalam kategori statistika deskriptif. Kegiatan itu dilakukan melalui:
a.Pendekatan aritmetika, yaitu pendekatan melalui pemeriksaan rangkuman nilai atau ukuran-ukuran penting dari data.
Yang dimaksud rangkuman nilai di sini ialah penyederhanaan kumpulan nilai data yang diamati ke dalam bentuk nilai-nilai tertentu. Setiap rangkuman nilai ini disebut statistik. Jadi, statistik menerangkan sifat kumpulan data dalam bentuk nilai yang mudah dipahami, sedangkan statistika adalah suatu ilmu tentang sekumpulan konsep serta metode yang dapat digunakan untuk mengumpulkan, menyajikan dan menganalisis data serta menarik kesimpulan berdasar hasil analisis data tersebut.
b.Pendekatan geometrik, yaitu melalui penyajian data dalam bentuk gambar berupa grafik atau diagram.
Kedua pendekatan mengakibatkan pembedaan dalam penyajian datanya. Penyajian data pertama menekankan angka-angka dan yang kedua menekankan pada gambar.
2.Statistika inferensia adalah metode yang berhubungan dengan analisis sebagian data untuk kemudian sampai pada peramalan atau penarikan kesimpulan tentang seluruh gugus data induknya. Statistika inferensia berupa kajian tentang penarikan kesimpulan mengenai keseluruhan objek yang menjadi perhatian namun hanya atas dasar data sebagian objek inilah yang disebut Statistika Inferensial atau Statistika Induktif. Dengan demikian, Statistika Inferensial menyimpulkan makna statistik yang telah dihitung, dianalisis atau disajikan grafik atau diagramnya tersebut.
1.2. Perbedaan Statistika Deskriptif Dan Inferensia
Statistika deskriptif adalah metode yang berkaitan dengan
pengumpulan, peringkasan, penyajian data sehingga memberikan informasi
organisasi dan persentasi data.
Peringkasan data dalam bentuk :
Tabulasi data (Tabel)
Diagram Balok (Histogram)
Diagram Kue (Pie Chart).
Contoh Soal :
Gemar Bertanya — seorang mahasiswa STIE Gunadarma – melakukan wawancara
terhadap 10 orang pedagang kaki lima di pasar Depok. Mahasiswa tersebut
melaporkan (dalam penulisan ilmiahnya) bahwa besarnya pendapatan
rata-rata kesepuluh pedagang adalah Rp. 358.897,35/bulan
Statistika inferensia adalah metode yang berkaitan dengan analisis data
untuk peramalan dan penarikan kesimpulan.
Peringkasan data dalam bentuk :
Metode Pendugaan Statistik
Pengujian Hipotesis
Regresi dan Korelasi
Contoh Soal :
Di Bursa Efek Jakarta, pembelian rata-rata saham UNTUNG Corp. dalam 6
bulan terakhir mengalami peningkatan sebesar 38.47 %. Berdasarkan
kenaikan tersebut, Saham Jaya – seorang pialang meramalkan pada akhir
tahun, harga saham Untung Corp. akan meningkat hingga 40 % dari harga
sekarang.
1.3. Fungsi, Kegunaan Dan Peranan Statistika
Statistika digunakan untuk menunjukkan tubuh pengetahuan (body of
knowledge) tentang cara-cara pengumpulan data, analisis dan penafsiran
data.
A. Fungsi statistika
· Statistik menggambarkan data dalam bentuk tertentu
· Statistik dapat menyederhanakan data yang kompleks menjadi data yang
mudah dimengerti
· Statistik merupakan teknik untuk membuat perbandingan
· Statistik dapat memperluas pengalaman individu
· Statistik dapat mengukur besaran dari suatu gejala
· Statistik dapat menentukan hubungan sebab akibat
B. Kegunaan Statistika
· Membantu penelitian dalam menggunakan sampel sehingga penelitian dapat
bekerja efisien dengan hasil yang sesuai dengan obyek yang ingin
diteliti
· Membantu penelitian untuk membaca data yang telah terkumpul sehingga
peneliti dapat mengambil keputusan yang tepat
· Membantu peneliti untuk melihat ada tidaknya perbedaan antara kelompok
yang satu dengan kelompok yang lainnya atas obyek yang diteliti
· Membantu peneliti untuk melihat ada tidaknya hubungan antara variabel
yang satu dengan variabel yang lainnya
· Membantu peneliti dalam menentukan prediksi untuk waktu yang akan
datang
· Membantu peneliti dalam melakukan interpretasi atas data yang
terkumpul (M.Subana dkk, 2000;14)
· Pemerintah menggunakan statistika untuk menilai hasil pembangunan masa
lalu dan merencanakan masa mendatang
· Pimpinan menggunakannya untuk pengangkatan pegawai baru, pembelian
peralatan baru, peningkatan kemampuan karyawan, perubahan sistem
kepegawaian, dsb.
· Para pendidik sering menggunakannya untuk melihat kedudukan siswa,
prestasi belajar, efektivitas metoda pembelajaran, atau media
pembelajaran.
· Para psikolog banyak menggunakan statistika untuk membaca hasil
pengamatan baik melalui tes maupun obserbasi lapangan.
C. Peranan Statistika
Di dalam penelitian, statistika berperan untuk:
· Memberikan informasi tentang karakteristik distribusi suatu populasi
tertentu, baik diskrit maupun kontinyu. Pengetahuan ini berguna dalam
menghayati perilaku populasi yang sedang diamati
· Menyediakan prosedur praktis dalam melakukan survey pengumpulan data
melalui metode pengumpulan data (teknik sampling). Pengetahuan ini
berguna untuk mendapatkan hasil pengukuran yang terpercaya
· Menyediakan prosedur praktis untuk menduga karakteristik suatu
populasi melalui pendekatan karakteristik sampel, baik melalui metode
penaksiran, metode pengujian hipotesis, metode analisis varians.
Pengetahuan ini berguna untuk mengetahui ukuran pemusatan dan ukuran
penyebaran serta perbedaan dan kesamaan populasi.
· Menyediakan prosedur praktis untuk meramal keadaan suatu obyek
tertentu di masa mendatang berdasarkan keadaan di masa lalu dan masa
sekarang. Melalui metode regresi dan metode deret waktu. Pengetahuan ini
berguna memperkecil resiko akibat ketidakpastian yang dihadapi di masa
mendatang.
· Menyediakan prosedur praktis untuk melakukan pengujian terhadap data
yang bersifat kualitatif melalui statistik non parametrik.
Sementara menurut Sugiyono (2003:12), statistika berperan untuk:
· Alat untuk menghitung besarnya anggota sampel yang diambil dari suatu
populasi, sehingga jumlah sampel yang dibutuhkan akan lebih dapat
dipertanggungjawabkan
· Alat untuk menguji validitas dan reliabilitas instrumen sebelum
instrumen tersebut digunakan dalam penelitian
· Sebagai teknik untuk menyajikan data, sehingga data lebih komunikatif,
misalnya melalui tabel, grafik, atau diagram
· Alat untuk menganalisis data seperti menguji hipotesis yang diajukan
dalam penelitian.
DAFTAR PUSTAKA
Bungin, Burhan. 2006. Metode Penelitian Kuantitatif Komunikasi, Ekonomi,
dan Kebijakan Publik serta Ilmu-ilmu Sosial Lainnya. Jakarta. Prenada
Media Group.
Hadi, S. 1995. Statistik 1, 2, 3, Yogyakarta. Andi Offset
Nazir, Mohamad. 1983. Metode Penelitian. Jakarta. Ghalia Indonesia.
Sudjana. 1992. Metoda Statistika (Edisi ke 5). Bandung: Tarsito
Sugiyono. 2003. Statistika untuk Penelitian, Bandung. Alfabeta
Susetyo, Budi. 2010. Statistika Untuk Analisis Data Penelitian. Bandung.
PT. Refika Aditama.
Walpole, R.E. 1992. Pengantar Statistika. Jakarta. PT Gramedia Pustaka
Utama.
1.4. Populasi dan Sampel
Pengertian populasi
Populasi atau universe adalah jumlah keseluruhan dari satuan-satuan atau
individu-individu yang karakteristiknya hendak diteliti. Dan
satuan-satuan tersebut dinamakan unit analisis, dan dapat berupa
orang-orang, institusi-institusi, benda-benda, dst. (Djawranto, 1994 :
420).
2. Pengertian Sampel
Sampel atau contoh adalah sebagian dari populasi yang karakteristiknya
hendak diteliti (Djarwanto, 1994:43). Sampel yang baik, yang
kesimpulannya dapat dikenakan pada populasi, adalah sampel yang bersifat
representatif atau yang dapat menggambarkan karakteristik populasi.
3. Kriteria Sampel
Ada dua kriteria sampel yaitu kriteria inklusi dan kriteria eksklusi.
Penentuan kriteria sampel diperlukan untuk mengurangi hasil peneliian
yang bias.
Kriteria inklusi adalah karakteristik umum subjek penelitian dari suatu
populasi target yang terjangkau yang akan diteliti (Nursalam, 2003: 96).
Sedangkan yang dimaksud dengan Kriteria eksklusi adalah
meng-hilangkan/mengeluarkan subjek yang memenuhi kriteria inklusi dari
penelitian karena sebab-sebab tertentu (Nursalam, 2003: 97).
Sebab-sebab yang dipertimbangkan dalam menentukan kriteria ekslusi
antara lain: a. subjek mematalkan kesediannya untuk menjadi responden
penelitian, dan b. subjek berhalangan hadir atau tidak di tempat ketika
pengumpulan data dilakukan.
4. Teknik pengambilan sampel
a. Pengertian teknik pengambilan sampel
Teknik pengambilan sampel atau teknik sampling adalah teknik pengambilan
sampel dari populasi. Sampel yang merupakan sebagaian dari populasi
tsb. kemudian diteliti dan hasil penelitian (kesimpulan) kemudian
dikenakan pada populasi (generalisasi). Hubungan populasi, sample,
teknik sampling, dan generasi dapat digambarkan sebagai berikut:
b. Manfaat sampling
1) Menghemat beaya penelitian.
2) Menghemat waktu untuk penelitian.
3) Dapat menghasilkan data yang lebih akurat.
4) Memperluas ruang lingkup penlitian.
c. Syarat-syarat teknik sampling
Teknik sampling boleh dilakukan bila populasi bersifat homogen atau
memiliki karakteristik yang sama atau setidak-tidaknya hampir sama. Bila
keadaan populasi bersifat heterogen, sampel yang dihasilkannya dapat
bersifat tidak representatif atau tidak dapat menggambarkan
karakteristik populasi.
d Jenis-jenis teknik sampling
1) Teknik sampling secara probabilitas
Teknik sampling probabilitas atau random sampling merupakan teknik
sampling yang dilakukan dengan memberikan peluang atau kesempatan kepada
seluruh anggota populasi untuk menjadi sampel. Dengan demikian sampel
yang diperoleh diharapkan merupakan sampel yang representatif.
Teknik sampling semacam ini dapat dilakukan dengan cara-cara sebagai
berikut.
a) Teknik sampling secara rambang sederhana.
Cara paling populer yang dipakai dalam proses penarikan sampel rambang
sederhana adalah dengan undian.
b) Teknik sampling secara sistematis (systematic sampling).
Prosedur ini berupa penarikan sample dengan cara mengambil setiap kasus
(nomor urut) yang kesekian dari daftar populasi.
c) Teknik sampling secara rambang proportional.
Jika populasi terdiri dari subpopulasi-subpopulasi maka sample
penelitian diambil dari setiap subpopulasi. Adapun cara peng-ambilan-
nya dapat dilakukan secara undian maupun sistematis.
d) Teknik sampling secara rambang bertingkat.
Bila subpoplulasi-subpopulasi sifatnya bertingkat, cara peng-ambilan
sampel sama seperti pada teknik sampling secara proportional.
e) Teknik sampling secara kluster (cluster sampling)
Ada kalanya peneliti tidak tahu persis karakteristik populasi yang ingin
dijadikan subjek penelitian karena populasi tersebar di wilayah yang
amat luas. Untuk itu peneliti hanya dapat menentukan sampel wilayah,
berupa kelompok klaster yang ditentukan secara bertahap. Teknik
pengambilan sample semacam ini disebut cluster sampling atau multi-stage
sampling.
2) Teknik sampling secara nonprobabilitas.
Teknik sampling nonprobabilitas adalah teknik pengambilan sample yang
ditemukan atau ditentukan sendiri oleh peneliti atau menurut
pertimbangan pakar.
Beberapa jenis atau cara penarikan sampel secara nonprobabilitas adalah
sebagai berikut.
a) Puposive sampling atau judgmental sampling
Penarikan sampel secara puposif merupakan cara penarikan sample yang
dilakukan memiih subjek berdasarkan kriteria spesifik yang dietapkan
peneliti.
b) Snow-ball sampling (penarikan sample secara bola salju).
Penarikan sample pola ini dilakukan dengan menentukan sample pertama.
Sampel berikutnya ditentukan berdasarkan informasi dari sample pertama,
sample ketiga ditentukan berdasarkan informasi dari sample kedua, dan
seterusnya sehingga jumlah sample semakin besar, seolah-olah terjadi
efek bola salju.
c) Quota sampling (penarikan sample secara jatah).
Teknik sampling ini dilakukan dengan atas dasar jumlah atau jatah yang
telah ditentukan. Biasanya yang dijadikan sample penelitian adalah
subjek yang mudah ditemui sehingga memudahkan pula proses pengumpulan
data.
d) Accidental sampling atau convenience sampling
Dalam penelitian bisa saja terjadi diperolehnya sampel yang tidak
direncanakan terlebih dahulu, melainkan secara kebetulan, yaitu unit
atau subjek tersedia bagi peneliti saat pengumpulan data dilakukan.
Proses diperolehnya sampel semacam ini disebut sebagai penarikan sampel
secara kebetulan.
4. Penentuan Jumlah Sampel
Bila jumlah populasi dipandang terlalu besar, dengan maksud meng-hemat
waktu, biaya, dan tenaga, penelitili tidak meneliti seluruh anggota
populasi. Bila peneliti bermaksud meneliti sebagian dari populasi saja
(sampel), pertanyaan yang selalu muncul adalah berapa jumlah sampel yang
memenuhi syarat. Ada hukum statistika dalam menentukan jumlah sampel,
yaitu semakin besar jumlah sampel semakin menggambarkan keadaan populasi
(Sukardi, 2004 : 55).
Selain berdasarkan ketentuan di atas perlu pula penentuan jumlah sampel
dikaji dari karakteristik populasi. Bila populasi bersifat homogen maka
tidak dituntut sampel yang jumlahnya besar. Misalnya saja dalam
pemeriksaan golongan darah.
Walaupun pemakaian jumlah sampel yang besar sangat dianjurkan, dengan
pertimbangan adanya berbagai keterbatasan pada peneliti, sehingga
peneliti berusaha mengambil sampel minimal dengan syarat dan aturan
statistika tetap terpenuhi sebagaimana dianjurkan oleh Isaac dan Michael
(Sukardi, 2004 : 55). Dengan menggunakan rumus tertentu (lihat Sukardi,
2004 : 55-56), Isaac dan Michael memberikan hasil akhir jumlah sampel
terhadap jumlah populasi antara 10 – 100.000.
1.6. Penyajian Data Statistik
A. Tujuan Penyajian Data
Tujuan penyajian data adalah:
Memberi gambaran yang sistematis tentang peristiwa-peristiwa yang
merupakan hasil penelitian atau observasi,
Data lebih cepat ditangkap dan dimengerti,
Memudahkan dalam membuat analisis data, dan
Membuat proses pengambilan keputusan dan kesimpulan lebih tepat,
cepat, dan akurat.
Cara penyajian data ada dua macam, yaitu :
Tabel, yaitu kumpulan angka-angka yang disusun menurut
kategori-kategori. Misalnya berat badan menurut jenis kelamin, jumlah
pegawai menurut pendidikan, jumlah penjualan menurut jenis barang dan
daerah penjualan, dll.
Grafik, yaitu gambar-gambar yang menunjukkan secara visual data berupa
angka atau simbol-simbol yang biasanya dibuat berdasarkan data dari
tabel yang telah dibuat.
B. Tabel
Ada berbagai bentuk tabel yang dikenal, yaitu :
Tabel satu arah (one way table)
Yaitu tabel yang memuat keterangan mengenai satu hal atau satu
karakteristik saja. Misalnya data indeks prestasi dari 10 mahasiswa
Tabel indeks prestasi dari 10 mahasiswa
Subyek Indeks prestasi
A 2,5
B 2,8
C 2,9
D 3
E 3,1
F 3,5
G 3,2
H 3,4
I 3,2
J 3,3
Tabel dua arah (two way table)
Yaitu tabel yang menunjukkan hubungan dua hal atau dua karakteristik
yang berbeda. Misalnya data indeks prestasi mahasiswa yang dipengaruhi
oleh partisipasi didalam kelas
Tabel indeks prestasi mahasiswa yang dipengaruhi oleh partisipasi
didalam kelas
subyek Indeks prestasi partisipasi didalam kelas
A 2,5 1
B 2,8 2
C 2 1
D 3 3
E 3,1 3
F 3,5 4
G 3,2 3
H 3,4 3
I 2,6 2
J 2,1 1
Tabel tiga arah (three way table)
Yaitu tabel yang menunjukkan hubungan tiga hal atau tiga karakteristik
yang berbeda. Misalnya data indeks prestasi dan partisipasi didalam
kelas yang dipengaruhi oleh status social.
Tabel data indeks prestasi dan partisipasi didalam kelas yang
dipengaruhi oleh status sosial
subyek Indeks prestasi partisipasi didalam kelas Status sosial
A 2,5 1 1
B 2,8 2 3
C 2 1 2
D 3 3 3
E 3,1 3 1
F 3,5 4 2
G 3,2 3 3
H 3,4 3 1
I 2,6 2 2
J 2,1 1 3
C. Grafik
Grafik data disebut juga diagram data, adalah penyajian data dalam
bentuk gambar-gambar. Grafik data biasanya berasal dari tabel dan grafik
biasanya dibuat bersama-sama, yaitu tabel dilengkapi dengan grafik.
Grafik data sebenarnya merupakan penyajian data secara visual dari data
bersangkutan. Dengan grafik dapat memberikan informasi dengan cepat yang
dikandung dari sekelompok data dalam bentuk yang ringkas. Diagram
biasanya lebih menarik dibandingkan penyajian data dengan menggunakan
tabel. Hal ini bisa dimungkinkan karena dengan diagram kita bisa
ditambahkan manipulasi warna. Grafik data dibedakan atas beberapa jenis,
yaitu :
1. Grafik garis (line chart)
Adalah grafik berupa garis, diperoleh dari beberapa ruas garis yang
menghubungkan titik-titik pada bidang bilangan. Pada grafik garis
digunakan dua garis yang saling berpotongan. Pada garis horizontal
(sumbu-X) ditempatkan bilangan-bilangan yang sifatnya tetap, seperti
tahun dan ukuran-ukuran. Pada garis tegak (sumbu-Y) ditempatkan
bilangan-bilangan yang sifatnya berubah-ubah, seperti harga, biaya
jumlah, dan Ada berbagai bentuk grafik, antara lain :
Grafik garis tunggal (single line chart), Yaitu grafik yang terdiri dari
satu garis untuk menggambarkan perkembangan (trend) dari suatu
karakteristik.
Grafik garis berganda (multiple line chart) Yaitu grafik yang terdiri
dari beberapa garis untuk menggambarkan beberapa hal/kejadian sekaligus.
Indeks prestasi mahasiswa yang dipengaruhi oleh partisipasi didalam
kelas
2. Grafik Batangan (Bar chart)
Adalah grafik data berbentuk persegi panjang yang lebarnya sama dan
dilengkapi dengan skala atau ukuran sesuai dengan data yang
bersangkutan. Setiap batang tidak boleh saling menempel atau melekat
antara satu dengan lainnya dan jarak antara setiap batang yang
berdekatan harus sama.
Ada berbagai bentuk, yaitu :
Grafik batangan tunggal (single bar chart), Yaitu grafik yang terdiri
dari satu batangan untuk menggambarkan perkembangan (trend) dari suatu
karakteristik.
Grafik batangan berganda (multiple bar chart), Yaitu grafik yang terdiri
dari beberapa garis untuk menggambarkan beberapa hal/kejadian
sekaligus.
Indeks prestasi mahasiswa yang dipengaruhi oleh partisipasi didalam
kelas
3. Grafik Lingkaran (Pie chart)
Yaitu grafik yang menggambarkan perbandingan nilai-nilai dari suatu
karakteristik. Grafik data berupa lingkaran yang telah dibagi menjadi
juring-juring sesuai dengan data tersebut. Bagian-bagian dari
keseluruhan data tersebut dinyatakan dalam persen.
Indeks prestasi Frekuensi
Tinggi (3-4) 5
Sedang (2.5-2.9) 3
Kurang (1.5-2.4) 2
tinggi x 100 % = 50
sedang x 100 % = 30%
kurang x 100 % = 20%
Sumber:
http://susys.staff.gunadarma.ac.id/Downloads/files/226/PENDAHU.pdf
Sumber Statistika pend
BAB II
DISTRIBUSI FREKUENSI
2.1. Penyusunan Data Secara Sistematis
Data yang telah kita kumpulkan perlu disusun secara sistematis supaya
dapat dianalisis. Susunan dari suatu data disebut distribusi data. Ada
beberapa cara menyusun data, yaitu:
1) Distribusi frekuensi kuantitatif, yaitu penyusunan data menurut
besarnya (kuantitasnya).
2) Distribusi frekuensi kualitatif (kategori), yaitu penyusunan data
menurut kualitasnya (kategori).
3) Runtun waktu (time series), yaitu penyusunan data menurut waktu
terjadinya.
4) Distribusi spasial, yaitu penyusunan data menurut tempat
geografisnya.
Penyusunan distribusi frekuensi
Apabila data yang ada banyak sekali jumlahnya, maka untuk memudahkan
dalam analisa data perlu dibuat distribusi frekuensi atau tabel
frekuensi.
Berikut ini akan disajikan bagaimana cara menyusun distribusi
kuantitatif, yaitu:
1)Tentukan banyak dan lebar interval kelas. Hal ini tergantung pada
banyak dan besarnya harga-harga yang akan disusun dalam distribusi itu.
Banyak interval kelas yang efisien biasanya antara 5 dan 15. Pada tahun
1925, H.A Sturges mengajukan sebuah rumus guna menentukan banyak
interval kelas, yaitu : k = 1+3,322 log n. Sedangkan lebar interval
kelas ditentukan dengan membagi jangkauan (yaitu selisih antara harga
terbesar dan terkecil) dengan banyak interval kelas yang digunakan.
2)Interval-interval kelas tersebut diletakkan dalam suatu kolom,
diurutkan dari interval kelas terendah pada kolom paling atas dan
seterusnya.
3)Data diperiksa dan dimasukkan ke dalam interval kelas yang sesuai.
Banyak data yang masuk dalam suatu interval kelas dinamakan frekuensi
interval kelas tersebut.
Contoh:
Di bawah ini disajikan data tinggi badan (cm) dari 50 orang dewasa:
176 167 180 165 168 171 177 176 170 175
169 171 171 176 166 179 181 174 167 172
170 169 175 178 171 168 178 183 174 166
181 172 177 182 167 179 183 185 185 173
179 180 184 170 174 175 176 175 182 172
Data terbesar : 185
Data terkecil : 165
Jangkauan = (data terbesar) – (data terkecil)
= 185 – 165 = 20
Apabila diambil banyaknya interval kelas:
Dari keadaan di atas kita pilih banyaknya interval kelas 7 dengan lebar
kelas 3. Pada interval kelas serta interval lainnya dapat diperoleh
dengan menambahkan lebar kelas 0,5 pada masing-masing limit kelas atas
dan limit kelas bawah. Dengan demikian dapat disusun dalam tabel sebagai
berikut:
Tabel 2.1 Distribusi Frekuensi Tinggi Badan
Interval Kelas Batas Kelas Frekuensi
165 – 167 164,5 – 167,5 6
167 – 170 166,5 – 170,5 7
170 – 173 169,5 – 173,5 8
173 – 176 172,5 – 176,5 11
176 – 179 175,5 – 179,5 7
179 – 182 178,5 – 182,5 6
182 – 185 181,5 – 185,5 5
Jumlah 50
Jika kita ingin mengetahui berapa banyak orang yang tinggi badannya
lebih dari harga tertentu ataupun kurang dari harga tertentu, maka
distribusi frekuensi diubah menjadi distribusi frekuensi kumulatif.
Dengan data pada contoh di atas kita susun distribusi frekuensi
kumulatif “kurang dari” dan distribusi frekuensi kumulatif “lebih dari”,
sebagai berikut:
Tabel 2.2(a) Distribusi frekuensi kumulatif “kurang dari”
Tinggi badan Banyak orang
Kurang dari 164,5 0
Kurang dari 167,5 6
Kurang dari 170,5 13
Kurang dari 173,5 21
Kurang dari 176,5 32
Kurang dari 179,5 39
Kurang dari 182,5 45
Kurang dari 185,5 50
2.2. Distribusi Frekuensi
Hasil pengukuran yang kita peroleh disebut dengan data mentah. Besarnya
hasil pengukuran yang kita peroleh biasanya bervariasi. Apabila kita
perhatikan data mentah tersebut, sangatlah sulit bagi kita untuk menarik
kesimpulan yang berarti. Untuk memperoleh gambaran yang baik mengenai
data tersebut, data mentah tersebut perlu di olah terlebih dahulu.
Pada saat kita dihadapkan pada sekumpulan data yang banyak, seringkali
membantu untuk mengatur dan merangkum data tersebut dengan membuat tabel
yang berisi daftar nilai data yang mungkin berbeda (baik secara
individu atau berdasarkan pengelompokkan) bersama dengan frekuensi yang
sesuai, yang mewakili berapa kali nilai-nilai tersebut terjadi. Daftar
sebaran nilai data tersebut dinamakan dengan Daftar Frekuensi atau
Sebaran Frekuensi (Distribusi Frekuensi).
Dengan demikian, distribusi frekuensi adalah daftar nilai data (bisa
nilai individual atau nilai data yang sudah dikelompokkan ke dalam
selang interval tertentu) yang disertai dengan nilai frekuensi yang
sesuai.
Pengelompokkan data ke dalam beberapa kelas dimaksudkan agar ciri-ciri
penting data tersebut dapat segera terlihat. Daftar frekuensi ini akan
memberikan gambaran yang khas tentang bagaimana keragaman data. Sifat
keragaman data sangat penting untuk diketahui, karena dalam
pengujian-pengujian statistik selanjutnya kita harus selalu
memperhatikan sifat dari keragaman data. Tanpa memperhatikan sifat
keragaman data, penarikan suatu kesimpulan pada umumnya tidaklah sah.
Sebagai contoh, perhatikan contoh data pada Tabel 1. Tabel tersebut
adalah daftar nilai ujian Matakuliah Statistik dari 80 Mahasiswa
(Sudjana, 19xx).
Tabel 1. Daftar Nilai Ujian Matakuliah Statistik
79 49 48 74 81 98 87 80
80 84 90 70 91 93 82 78
70 71 92 38 56 81 74 73
68 72 85 51 65 93 83 86
90 35 83 73 74 43 86 88
92 93 76 71 90 72 67 75
80 91 61 72 97 91 88 81
70 74 99 95 80 59 71 77
63 60 83 82 60 67 89 63
76 63 88 70 66 88 79 75
Sangatlah sulit untuk menarik suatu kesimpulan dari daftar data
tersebut. Secara sepintas, kita belum bisa menentukan berapa nilai ujian
terkecil atau terbesar. Demikian pula, kita belum bisa mengetahui
dengan tepat, berapa nilai ujian yang paling banyak atau berapa banyak
mahasiswa yang mendapatkan nilai tertentu. Dengan demikian, kita harus
mengolah data tersebut terlebih dulu agar dapat memberikan gambaran atau
keterangan yang lebih baik.
Bandingkan dengan tabel yang sudah disusun dalam bentuk daftar frekuensi
(Tabel 2a dan Tabel 2b). Tabel 2amerupakan daftar frekuensi dari data
tunggal dan Tabel 2b merupakan daftar frekuensi yang disusun dari data
yang sudah di kelompokkan pada kelas yang sesuai dengan selangnya. Kita
bisa memperoleh beberapa informasi atau karakteristik dari data nilai
ujian mahasiswa.
Tabel 2a.
No Nilai Ujian Frekuensi
xi fi
1 35 1
2 36 0
3 37 0
4 38 1
: : :
16 70 4
17 71 3
: : 1
42 98 1
43 99 1
Total 80
Pada Tabel 2a, kita bisa mengetahui bahwa ada 80 mahasiswa yang
mengikuti ujian, nilai ujian terkecil adalah 35 dan tertinggi adalah 99.
Nilai 70 merupakan nilai yang paling banyak diperoleh oleh mahasiswa,
yaitu ada 4 orang, atau kita juga bisa mengatakan ada 4 mahasiswa yang
memperoleh nilai 70, tidak ada satu pun mahasiswa yang mendapatkan nilai
36, atau hanya satu orang mahasiswa yang mendapatkan nilai 35.
Tabel 2b.
Kelas ke- Nilai Ujian Frekuensi fi
1 31 – 40 2
2 41 – 50 3
3 51 – 60 5
4 61 – 70 13
5 71 – 80 24
6 81 – 90 21
7 91 – 100 12
Jumlah 80
Tabel 2b merupakan daftar frekuensi dari data yang sudah dikelompokkan.
Daftar ini merupakan daftar frekuensi yang sering digunakan. Kita sering
kali mengelompokkan data contoh ke dalam selang-selang tertentu agar
memperoleh gambaran yang lebih baik mengenai karakteristik dari data.
Dari daftar tersebut, kita bisa mengetahui bahwa mahasiswa yang
mengikuti ujian ada 80, selang kelas nilai yang paling banyak diperoleh
oleh mahasiswa adalah sekitar 71 sampai 80, yaitu ada 24 orang, dan
seterusnya. Hanya saja perlu diingat bahwa dengan cara ini kita bisa
kehilangan identitas dari data aslinya. Sebagai contoh, kita bisa
mengetahui bahwa ada 2 orang yang mendapatkan nilai antara 31 sampai 40.
Meskipun demikian, kita tidak akan tahu dengan persis, berapa nilai
sebenarnya dari 2 orang mahasiswa tersebut, apakah 31 apakah 32 atau 36
dst.
Ada beberapa istilah yang harus dipahami terlebih dahulu dalam menyusun
daftar frekuensi.
Tabel 3.
Kelas ke- Selang Nilai Ujian Batas Kelas Nilai Kelas(xi) Frekuensi(fi)
1 31 – 40 30.5 – 40.5 35.5 2
2 41 – 50 40.5 – 50.5 45.5 3
3 51 – 60 50.5 – 60.5 55.5 5
4 61 – 70 60.5 – 70.5 65.5 13
5 71 – 80 70.5 – 80.5 75.5 24
6 81 – 90 80.5 – 90.5 85.5 21
7 91 – 100 90.5 – 100.5 95.5 12
Jumlah 80
Range : Selisih antara nilai tertinggi dan terendah. Pada contoh ujian
di atas, Range = 99 – 35 = 64
Batas bawah kelas: Nilai terkecil yang berada pada setiap kelas.
(Contoh: Pada Tabel 3 di atas, batas bawah kelasnya adalah 31, 41, 51,
61, …, 91)
Batas atas kelas: Nilai terbesar yang berada pada setiap kelas. (Contoh:
Pada Tabel 3 di atas, batas bawah kelasnya adalah 40, 50, 60, …, 100)
Batas kelas (Class boundary): Nilai yang digunakan untuk memisahkan
antar kelas, tapi tanpa adanya jarak antara batas atas kelas dengan
batas bawah kelas berikutnya. Contoh: Pada kelas ke-1, batas kelas
terkecilnya yaitu 30.5 dan terbesar 40.5. Pada kelas ke-2, batas
kelasnya yaitu 40.5 dan 50.5. Nilai pada batas atas kelas ke-1 (40.5)
sama dengan dan merupakan nilai batas bawah bagi kelas ke-2 (40.5).
Batas kelas selalu dinyatakan dengan jumlah digit satu desimal lebih
banyak daripada data pengamatan asalnya. Hal ini dilakukan untuk
menjamin tidak ada nilai pengamatan yang jatuh tepat pada batas
kelasnya, sehingga menghindarkan keraguan pada kelas mana data tersebut
harus ditempatkan. Contoh: bila batas kelas di buat seperti ini:
Kelas ke-1 : 30 – 40
Kelas ke-2 : 40 – 50 : dst.
Apabila ada nilai ujian dengan angka 40, apakah harus ditempatkan pada
kelas-1 ataukah kelas ke-2?
Panjang/lebar kelas (selang kelas): Selisih antara dua nilai batas bawah
kelas yang berurutan atau selisih antara dua nilai batas atas kelas
yang berurutan atau selisih antara nilai terbesar dan terkecil batas
kelas bagi kelas yang bersangkutan. Biasanya lebar kelas tersebut
memiliki lebar yang sama.
Contoh:
lebar kelas = 41 – 31 = 10 (selisih antara 2 batas bawah kelas yang
berurutan) atau
lebar kelas = 50 – 40 = 10 (selisih antara 2 batas atas kelas yang
berurutan) atau
lebar kelas = 40.5 – 30.5 = 10. (selisih antara nilai terbesar dan
terkecil batas kelas pada kelas ke-1)
Nilai tengah kelas: Nilai kelas merupakan nilai tengah dari kelas yang
bersangkutan yang diperoleh dengan formula berikut: ½ (batas atas
kelas+batas bawah kelas). Nilai ini yang dijadikan pewakil dari selang
kelas tertentu untuk perhitungan analisis statistik selanjutnya. Contoh:
Nilai kelas ke-1 adalah ½(31+40) = 35.5
Banyak kelas: Sudah jelas! Pada tabel ada 7 kelas.
Frekuensi kelas: Banyaknya kejadian (nilai) yang muncul pada selang
kelas tertentu.
Contoh, pada kelas ke-1, frekuensinya = 2.
Nilai frekuensi = 2 karena pada selang antara 30.5 – 40.5, hanya ada 2
angka yang muncul, yaitu nilai ujian 31 dan 38.
Teknik pembuatan Tabel Distribusi Frekuensi (TDF)
Distribusi frekuensi dibuat dengan alasan berikut:
kumpulan data yang besar dapat diringkas kita dapat memperoleh beberapa
gambaran mengenai karakteristik data, dan merupakan dasar dalam
pembuatan grafik penting (seperti histogram).
Banyak software (teknologi komputasi ) yang bisa digunakan untuk membuat
tabel distribusi frekuensi secara otomatis. Meskipun demikian, di sini
tetap akan diuraikan mengenai prosedur dasar dalam membuat tabel
distribusi frekuensi.
Langkah-langkah dalam menyusun tabel distribusi frekuensi:
Urutkan data, biasanya diurutkan dari nilai yang paling kecil
Tujuannya agar range data diketahui dan mempermudah penghitungan
frekuensi tiap kelas!
Tentukan range (rentang atau jangkauan)
Range = nilai maksimum – nilai minimum
Tentukan banyak kelas yang diinginkan. Jangan terlalu banyak/sedikit,
berkisar antara 5 dan 20, tergantung dari banyak dan sebaran datanya.
Aturan Sturges:
Banyak kelas = 1 + 3.3 log n, dimana n = banyaknya data
Tentukan panjang/lebar kelas interval (p)
Panjang kelas (p) = [rentang]/[banyak kelas]
Tentukan nilai ujung bawah kelas interval pertama
Pada saat menyusun TDF, pastikan bahwa kelas tidak tumpang tindih
sehingga setiap nilai-nilai pengamatan harus masuk tepat ke dalam satu
kelas. Pastikan juga bahwa tidak akan ada data pengamatan yang
tertinggal (tidak dapat dimasukkan ke dalam kelas tertentu). Cobalah
untuk menggunakan lebar yang sama untuk semua kelas, meskipun
kadang-kadang tidak mungkin untuk menghindari interval terbuka, seperti ”
≥ 91 ” (91 atau lebih). Mungkin juga ada kelas tertentu dengan
frekuensi nol.
Contoh:
Kita gunakan prosedur di atas untuk menyusun tabel distribusi frekuensi
nilai ujian mahasiswa (Tabel 1).
Berikut adalah nilai ujian yang sudah diurutkan:
35 38 43 48 49 51 56 59 60 60
61 63 63 63 65 66 67 67 68 70
70 70 70 71 71 71 72 72 72 73
73 74 74 74 74 75 75 76 76 77
78 79 79 80 80 80 80 81 81 81
82 82 83 83 83 84 85 86 86 87
88 88 88 88 89 90 90 90 91 91
91 92 92 93 93 93 95 97 98 99
2. Range:
[nilai tertinggi – nilai terendah] = 99 – 35 = 64
3. Banyak Kelas:
Tentukan banyak kelas yang diinginkan.
Apabila kita lihat nilai Range = 64, mungkin banyak kelas
sekitar 6 atau 7.
Sebagai latihan, kita gunakan aturan Sturges.
banyak kelas = 1 + 3.3 x log(n)
= 1 + 3.3 x log(80)
= 7.28 ≈ 7
4. Panjang Kelas:
Panjang Kelas = [range]/[banyak kelas]
= 64/7
= 9.14 ≈ 10
(untuk memudahkan dalam penyusunan TDF)
5. Tentukan nilai batas bawah kelas pada kelas pertama.
Nilai ujian terkecil = 35
Penentuan nilai batas bawah kelas bebas saja,
asalkan nilai terkecil masih masuk ke dalam kelas tersebut.
Misalkan: apabila nilai batas bawah yang kita pilih adalah 26,
maka interval kelas pertama: 26 – 35, nilai 35 tepat jatuh
di batas atas kelas ke-1. Namun apabila kita pilih
nilai batas bawah kelas 20 atau 25, jelas nilai terkecil, 35,
tidak akan masuk ke dalam kelas tersebut.
Namun untuk kemudahan dalam penyusunan dan pembacaan TDF,
tentunya juga untuk keindahan, he2.. lebih baik kita memilih
batas bawah 30 atau 31. Ok, saya tertarik dengan angka 31,
sehingga batas bawahnya adalah 31.
Dari prosedur di atas, kita dapat info sebagai berikut:
Banyak kelas : 7
Panjang kelas : 10
Batas bawah kelas : 31
Selanjutnya kita susun TDF:
Form TDF:
------------------------------------------------------------
Kelas ke- | Nilai Ujian | Batas Kelas | Turus | Frekuensi
------------------------------------------------------------
1 31 -
2 41 -
3 51 -
: : -
6 81 -
7 91 -
------------------------------------------------------------
Jumlah
------------------------------------------------------------
Tabel berikut merupakan tabel yang sudah dilengkapi
Kelas ke- Nilai Ujian Batas Kelas Frekuensi fi)
1 31 – 40 30.5 – 40.5 2
2 41 – 50 40.5 – 50.5 3
3 51 – 60 50.5 – 60.5 5
4 61 – 70 60.5 – 70.5 13
5 71 – 80 70.5 – 80.5 24
6 81 – 90 80.5 – 90.5 21
7 91 – 100 90.5 – 100.5 12
Jumlah 80
atau dalam bentuk yang lebih ringkas:
Kelas ke- Nilai Ujian Frekuensi(fi)
1 31 – 40 2
2 41 – 50 3
3 51 – 60 5
4 61 – 70 13
5 71 – 80 24
6 81 – 90 21
7 91 – 100 12
Jumlah 80
Distribusi Frekuensi Relatif dan Kumulatif
Variasi penting dari distribusi frekuensi dasar adalah dengan
menggunakan nilai frekuensi relatifnya, yang disusun dengan membagi
frekuensi setiap kelas dengan total dari semua frekuensi (banyaknya
data). Sebuah distribusi frekuensi relatif mencakup batas-batas kelas
yang sama seperti TDF, tetapi frekuensi yang digunakan bukan frekuensi
aktual melainkan frekuensi relatif. Frekuensi relatif kadang-kadang
dinyatakan sebagai persen.
Frekuensi relatif = \dfrac{{{f_i}}}{{\sum {f_i}}} \times 100\% =
\dfrac{{{f_i}}}{n} \times 100\%
Contoh: frekuensi relatif kelas ke-1:
fi = 2; n = 80
Frekuensi relatif = 2/80 x 100% = 2.5%
Kelas ke- Nilai Ujian Frekuensi relatif (%)
1 31 – 40 2.50
2 41 – 50 3.75
3 51 – 60 6.25
4 61 – 70 16.25
5 71 – 80 30.00
6 81 – 90 26.25
7 91 – 100 15.00
Jumlah 100.00
Distribusi Frekuensi kumulatif
Variasi lain dari distribusi frekuensi standar adalah frekuensi
kumulatif. Frekuensi kumulatif untuk suatu kelas adalah nilai frekuensi
untuk kelas tersebut ditambah dengan jumlah frekuensi semua kelas
sebelumnya.
Perhatikan bahwa kolom frekuensi selain label headernya diganti dengan
frekuensi kumulatif kurang dari, batas-batas kelas diganti dengan
“kurang dari” ekspresi yang menggambarkan kisaran nilai-nilai baru.
Nilai Ujian Frekuensi kumulatif kurang dari
kurang dari 30.5 0
kurang dari 40.5 2
kurang dari 50.5 5
kurang dari 60.5 10
kurang dari 70.5 23
kurang dari 80.5 47
kurang dari 90.5 68
kurang dari 100.5 80
atau kadang disusun dalam bentuk seperti ini:
Nilai Ujian Frekuensi kumulatif kurang dari
kurang dari 41 2
kurang dari 51 5
kurang dari 61 10
kurang dari 71 23
kurang dari 81 47
kurang dari 91 68
kurang dari 101 80
Variasi lain adalah Frekuensi kumulatif lebih dari. Prinsipnya hampir
sama dengan prosedur di atas.
Histogram
Histogram adalah merupakan bagian dari grafik batang di mana skala
horisontal mewakili nilai-nilai data kelas dan skala vertikal mewakili
nilai frekuensinya. Tinggi batang sesuai dengan nilai frekuensinya, dan
batang satu dengan lainnya saling berdempetan, tidak ada jarak/ gap
diantara batang. Kita dapat membuat histogram setelah tabel distribusi
frekuensi data pengamatan dibuat.
Poligon Frekuensi:
Poligon Frekuensi menggunakan segmen garis yang terhubung ke titik yang
terletak tepat di atas nilai-nilai titik tengah kelas. Ketinggian dari
titik-titik sesuai dengan frekuensi kelas, dan segmen garis diperluas ke
kanan dan kiri sehingga grafik dimulai dan berakhir pada sumbu
horisontal.
Ogive
Ogive adalah grafik garis yang menggambarkan frekuensi kumulatif,
seperti daftar distribusi frekuensi kumulatif. Perhatikan bahwa
batas-batas kelas dihubungkan oleh segmen garis yang dimulai dari batas
bawah kelas pertama dan berakhir pada batas atas dari kelas terakhir.
Ogive berguna untuk menentukan jumlah nilai di bawah nilai tertentu.
Sebagai contoh, pada gambar berikut menunjukkan bahwa 68 mahasiswa
mendapatkan nilai kurang dari 90.5.
2.3. Bagian-Bagian Dari Distribusi Frekuensi
2.4. Bagian-Bagian Dari Distribusi Frekuensi