Küme örneklemesi

Küme örneklemesi, istatistik bilimi içinde örneklem kullanılarak betimsel veya çıkarımsal sonuç istenirse, olasılıksal örnekleme kurallarına uyan bir örneklem veri toplama yöntemidir. Genel olarak bu yöntemin uygulanması anakütle içinde veri elamanları "kümeler" halinde ise uygundur. Bir küme içindeki elemanlar belirli karakter özelliklerine göre (çoğunlukla coğrafî alana göre) birbirine "yakınlık" göstermekte ve diğer anakütle içindeki kümelerden daha "uzak" olmaktadır. "Yakınlık" veya "uzaklık" genel olarak veri toplama para veya zaman maliyetine göre tanımlanır.

Yöntem

Küme örnekleme genellikle örnekleme zaman ve para maliyetlerini düşük tutmak için kullanılmaktadır. Anakütle çerçevesi elamanlarının birbirine yakın kümeler oluşturduğu hallerde ve her bir küme genel olarak diğer kümelere çok benzerlerse, bu tipi örnekleme kullanılması uygun olabilir. Bu kümeler mekan içinde (örneğin şehrin değişik mahallelileri veya Amerika'daki gibi değişik şehir blokları) veya zaman içinde (belirli zaman dönemleri) olabilir.

Örneğin: Veri elde edilmesi gereken anakütle çerçevesi belli bir üniversite öğrencileri olsun. O üniversitenin bölümleri şehrin içinde ve hatta yakın şehirlerde ayrı yerleşkelerde (yani birbirinden ayrı mekanlarda) bulunabilir. (Eski belirli kampusu olmayan Ankara Üniversitesi veya İstanbul Üniversitesi güzel örnekler). Bu halde üniversiteyi tek bir çerçeve olarak kabul etmek ve değişik mekanlarda bulunan yerleşkelerin varlığını ele almadan örnekleme yapmak, ekstra para ve zaman masrafı yaratacaktır. Daha az maliyetli bir yaklaşım her yerleşkeyi bir "küme" olarak kabul etmekle mümkün olacaktır. Bu halde her bir ayrı yerleşke küme olarak kabul edilip, ayrı yerleşkeler ayrı kümeler olarak incelemeye taban olabilirler.

Küme örneklemesi iki aşamada yapılır:

  • Birinci aşamada çok iyi belirlenmiş kümeler tespit edilir. Her iyi belirlenmiş kümeye bir "küme kodu" numarası verilir. Bütün kod numaraları içinden basit rastgele örnekleme ile küçük sayıda "kümeler örneklemi" seçilir.

Örneğin, bir üniversite 15 tane ayrı yerleşke var olduğu kabul edilsin. Her öğrencinin bulunan yerleşkelerden sadece birine ait olduğu iyice tespit edilsin; yani bir öğrenci birden fazla yerleşkeye dahil olmasın. Bu zaman, önce her bir yerleşkeye küme-kodu verilir (Ele alınan halde, bu küme kodu 01 02.... 15 olabilir). Bunlar arasından "basit rastgele örnekleme" ile, diyelim, 5i seçilir. Bunlar "kümeler örneklemi" yani örneklemenin ikinci aşamasına girecek kümelerdir.

  • İkinci aşamada her bir örnekleme giren küme içinde bulunan bütün küme anakütle elemanları üzerinde gözlem yapılır. Yani her "örneklem küme" için tam sayım yapılır.

Örneğin, ilk aşamada seçilmiş olan 5 yerleşkede bulunan öğrenci elemanlarının tümüne gözlem uygulanır.

Eleştiri

Doğal olarak, tüm anakütle çerçevesi seçilmediği için zaman ve para maliyetleri tam sayımdan düşük olur. Dikkat edilirse bu çeşit örneklemede rastgele seçilme kümelerle ilgilidir. Bu seçim yapıldıktan sonra, seçilen kümeler içinde bulunan birbirine yakın elemanlar gözlendiği için de maliyetler (özellikle basit rastgele örneklemeye kıyasla) daha düşük olması çok mümkündür. Basit rastgele örneklemeye kıyasla küme örneklemesinin bir diğer avantajı, tüm anakütle elemanlarının her birinin kodlanmasının gerekmediğidir; bu tam-kodlama büyük maliyet gerektirir ve bazen de imkânsızdır. Buna karşılık küme örneklemesinde sadece birinci aşamada seçilmiş olan kümeler elemanları tespit edilip kodlanır.

Ancak küme örneklemesi, her bir kümenin diğer kümelere benzediğine ve sadece kendine has karakteri olan bir veya birkaç kümenin bulunmadığı varsayımına dayanır. Gerçekte bu varsayım her zaman ancak yaklaşık olarak doğru olacak ve bazı belirlenen kümeler kendine has karakter arz edecektir. Bu nedenle küme örneklemesinin yayılımı ayni anakütle için alınabilecek basit rastgele örneklemeden daha fazla olacaktır ve örneklemeden sonra elde edilecek kestirimler veya yapılan sınamalar daha az tutarlı olacak ve daha fazla yanlı olma olasılığı taşıyacaklardır.

Ayrıca bakınız

  • Örnekleme
  • g
  • t
  • d
İstatistik
Betimsel istatistik
Sürekli veriler
Merkezî konum
Ortalama (Aritmetik, Geometrik, Harmonik) • Medyan • Mod
Yayılma
Açıklık • Standart sapma • Varyasyon katsayısı • Çeyrekler açıklığı • Kesirlilikler (kantil) (Dörttebirlik,Ondabirlik, Yüzdebirlik)
Dağılım şekli
Varyans • Çarpıklık • Basıklık • Moment (matematik)
İstatistiksel tablolar
Sıklık dağılımı  • Çoklu sayılı özetleme tabloları  • İlişki tablosu  • Çoklu-yönlü sınıflandırma tabloları
İstatistiksel grafikler
Dairesel grafik • Çubuk grafiği • Kutu grafiği • Dal-yaprak grafikleri •Kontrol diyagramı • Histogram • Sıklık çizelgesi • Q-Q grafiği • Serpilme diyagramı
Veri toplama
Örnek tasarımı
Deneysel tasarım
Anakütle • İstatistiksel deneysel tasarım tipleri  • Deneysel hata  • Yineleme • Bloklama • Duyarlılık ve belirleme
Örneklem kavramları
Örneklem büyüklüğü • Sınama gücü  • Etki büyüklüğü • Örnekleme dağılımı •Standart hata
Çıkarımsal istatistik
ve
İstatistiksel kestirim ve testler
Çıkarımsal analiz tipleri
Kestirim  • Parametrik çıkarımsal analiz  •Parametrik olmayan çıkarımsal analiz  • Bayesci çıkarımsal analiz  • Meta-analiz
Çıkarımsal kestirim
Genel kestirim kavramları
Momentler yöntemi • Enbüyük olabilirlik • Enbüyük artçıl  • Bayes-tipi kestirimci • Minimum uzaklık • Maksimum aralık verme
Tekdeğişkenli kestirim
Kestirim  • Güven aralığı  • İnanılır aralık
Hipotez testi
İstatistiksel test ana kavramları
Sıfır hipotez  • I.Tür ve II.Tür hata  • Anlamlılık seviyesi  •p-değeri
Basit tek-değişkenli ve iki-değişkenli
parametrik hipotez testi
μ için testi •

π için test • μ12 için test • π12 için test  •

σ12 için test
Tek-değişkenli ve iki-değişkenli
parametrik olmayan test analizi
Medyan testi  • Ki-kare testi • Pearson ki-kare testi •Phi katsayısı  • Wald testi • Mann-Whitney U testi • Wilcoxon'in işaretli sıralama testi
Korelasyon
ve
Regresyon analizi
Korelasyon
Doğrusal regresyon
Regresyon analizi  • Doğrusal model • Genel doğrusal model • Genelleştirilmiş doğrusal model
Doğrusal olmayan regresyon
Parametrik olmayan • Yarıparametrik • Logistik
Varyans analizi
Tek-yönlü varyans analizi • Kovaryans analizi • Bloklu tek-yönlü varyans analizi • Etki karışımı değişkeni
Çokdeğişkenli istatistik
Çokdeğişkenli regresyon • temel bileşenler · Faktör analizi  •Kanonik korelesyon  • Uygunluk analizi  • Kümeleme analizi
Zaman serileri analizi
Yapısal model tanımlanması
Zaman serisi yapisal model ögeleri  • Zaman serisi ögeleri saptanması  • Zaman grafiği • Korrelogram
Zaman serileri kestirim teknik ve modelleri
Dekompozisyon • Trend uygulama kestirimi  • Üssel düzgünleştirme  • ARIMA modelleri  • Box–Jenkins  • Spektral yoğunluk kestirimi
Kestirim değerlendirmesi
Zaman seri kestirim değerlendirmesi
Sağkalım analizi
Sağkalım fonksiyonu • Kaplan–Meier • Log-sıra testi • Başarısızlık oranı • orantılı tehlikeler modeli
Kategori • Outline • Endeks