Yoğunluk Dağılım Fonksiyonu
Yoğunluk Dağılım Fonksiyonu
Çeşitli örneklemlerden elde edilebilecek ortalama x dağılımını sorguladığımız gibi, varyansların dağılımının ne olabileceğini de sorabiliriz. Bazı verilere en küçük kareler uyumunun ortalama karesel hatasının bir ölçüsü olarak χ2 parametresini tanıttık. Mevcut kullanımı göz önünde bulundurarak bu sembolü seçtik.
Burada σ2j, tek bir gözlemin varyansıdır. χ2 miktarı o halde normalize edilmiş bir kare hatasıdır. Nitekim tek bir gözlemin varyansının tüm gözlemler için sabit olduğu durumda yazabiliriz.
Burada, serbestlik derecesi sayısı (yani, ifadede bulunan bağımsız momentlerin sayısıyla azaltılan örneklem büyüklüğü N) sonuçta açıkça görünmez. χ2 doğası gereği pozitif olduğundan, dağılım fonksiyonunun simetrik olması beklenemez. χ2 için verilen olasılık yoğunluk dağılım fonksiyonunu karşılaştırır.
F-Yoğunluk Dağılımı İşlevi
Şimdiye kadar, örnekleme süreci tarafından üretilen momentlerin hepsinin aynı boyuttaki (yani aynı N değerine sahip) örneklerden üretildiği durumları ele aldık. Örnek boyutunun belirli bir varyans değeri elde etme olasılığını nasıl etkileyebileceğini sorabiliriz.
Örneğin, χ2 dağılım fonksiyonu, belirli bir N değeri için varyans değerlerinin nasıl dağılacağını açıklar. N’yi değiştirirsek, bu dağılım fonksiyonunun göreceli olarak değişmesini nasıl bekleyebiliriz? İki varyansın oranının olasılık yoğunluk dağılımının doğasını araştıralım veya daha spesifik olarak F’yi tanımlayalım.
Beklenebileceği gibi, F istatistiği, ek bir parametrenin dahil olması dışında, bir χ2 gibi davranır. Bununla birlikte, N1 ve N2’nin her ikisi de büyüdükçe, F-dağılım fonksiyonu normal eğriden ayırt edilemez hale gelir.
N1 ve N2, ana popülasyonun iki farklı örneklemesi için örneklem büyüklükleri olarak sunulurken, bunlar gerçekten de bağımsız bilgi parçalarının sayısını (yani, bazı anları veren veya alan serbestlik derecesi sayısı) belirlemeye giriyor.
Gördüğümüz gibi, istatistiksel analiz g(x,ai) biçiminde daha karmaşık bir fonksiyon içeriyorsa, serbestlik derecesi sayısı ai’nin değerlerinin sayısına bağlı olacaktır.
Böylece, F istatistiği, ai’nin değerlerinin sayısındaki bir değişiklikten kaynaklanan varyansların dağılımını sağlamak için kullanılabilir, böylece serbestlik derecesi sayısı ve N örneklem büyüklüğündeki bir değişiklik değişir.
t, χ2 ve F yoğunluk dağılım fonksiyonlarının tümü normal dağılım fonksiyonuna N → ∞ olarak yaklaştığından, normal eğri üç eğrinin özel bir durumu olarak düşünülebilir. Daha az belirgin olan ise, t- ve χ2 yoğunluk dağılım fonksiyonlarının, F yoğunluk dağılımının özel durumları olduğudur.
Böylece, F muhtemelen yoğunluk dağılım fonksiyonunun, t ve χ2 için yoğunluk dağılım fonksiyonları ve dolayısıyla normal yoğunluk dağılım fonksiyonunun kendisi için genel üretici olduğunu görüyoruz.
Olasılık yoğunluk fonksiyonu ve olasılık dağılım fonksiyonu
Olasılık yoğunluk fonksiyonu formülü
Olasılık yoğunluk fonksiyonu ve Olasılık dağılım fonksiyonu farkı
Olasılık yoğunluk fonksiyonu Örnek
Olasılık yoğunluk fonksiyonu nedir
Olasılık yoğunluk fonksiyonu beklenen değer
Olasılık yoğunluk fonksiyonu özellikleri
Olasılık yoğunluk fonksiyonu hesaplama
Önem Düzeyi ve İstatistiksel Testler
İstatistiksel analizin çoğu, bir numunenin özelliklerinin ana popülasyonun özelliklerini ne ölçüde yansıttığını belirlemekle ilgilidir. Bu, belirli sonucun ana popülasyonun karşılık gelen özelliğinden ε miktarı kadar farklı olma olasılığı elde edilerek yeniden ifade edilebilir.
Bu olasılıklar, uygun olasılık yoğunluk dağılım fonksiyonunu uygun aralıkta entegre ederek elde edilebilir. Bu şekilde formüle edilen problemler istatistiksel bir test oluşturur. Bu tür testler genellikle “bu istatistik ana popülasyonun değerinden farklı değildir” gibi hipotezleri test eder.
Böyle bir hipotez, örnek ile ana popülasyon için değer arasında hiçbir fark olmadığını varsaydığı için genellikle sıfır hipotezi olarak adlandırılır. Bu hipotezi, ifadenin doğru olma olasılığını veya muhtemelen ifadenin yanlış olma olasılığını belirleyerek test ediyoruz. İstatistiksel olarak, kimse bir hipotezi asla “ispatlayamaz” veya “çürütemez”.
Belirli bir ifadenin (genellikle bir sıfır hipotezi) doğru veya yanlış olma olasılığı belirlenir. Bir hipotez belirli bir p olasılıkla desteklenir veya reddedilirse, ifadenin genellikle olasılığın 100 ile çarpımına karşılık gelen yüzde düzeyinde anlamlı olduğu söylenir. açıklanan olayın tesadüfen meydana gelme olasılığı .05’tir.
Bazı ana popülasyondan alınan N öğelik bir örneklemeden elde edilen belirli bir x ortalama değerinin gerçekte ebeveyn popülasyonun ortalamasını ne ölçüde temsil ettiğini belirlemek istediğimizi varsayalım.
Bunu yapmak için, x’in gerçekten de x p ile “aynı” olduğu ifadesine izin verdiğini kabul edeceğimiz bazı toleranslar oluşturmalıyız. Bunu, önce ne sıklıkla yanılmaya istekli olduğumuza karar vererek yapabiliriz. Yani, ifadenin yanlış olma olasılığı nedir? Argümanın hatırına, bu değeri %5 olarak alalım.
Şimdi, t dağılımının yalnızca örneklem büyüklüğü N’ye bağlı olduğunu zaten belirledik, böylece bu dağılım fonksiyonunu, beklenen değerden 5 olasılıkla farklı olmasına izin verecek olan t aralığı üzerinde entegre ederek % t5’i bulabiliriz. %.
t’nin değeri N’ye ve sonuçta ortaya çıkan δ değerlerine bağlı olacaktır ve bunlar %5 seviyesinin güven sınırları olarak bilinir. Çeşitli N değerleri için farklı güven düzeyleri için t tabloları sağlayan çok sayıda kitap vardır (örn. Croxton ve diğerleri1). Örneğin, N 5 ise, %5 düzeyine karşılık gelen t değeri 2,571’dir. Böylece, x’in xp’den 2,571σx’ten daha fazla farklı olma ihtimalinin yalnızca %5 olduğunu söyleyebiliriz.
Örnek sayısının xp’ye çıkması durumunda aynı güven limitleri 1,96 σx’e düşer. İkinci sonucu, eğrinin toplam alanının %5’ini çevreleyene kadar normal eğrinin “kuyruklarını” entegre ederek elde edebiliriz. Bu nedenle, küçük ila orta büyüklükteki örneklem boyutlarıyla uğraşırken uygun yoğunluk dağılım fonksiyonunu kullanmak önemlidir. İntegraller, küçük örneklem boyutları için uygun olan güven sınırını belirler.
Bu testi, ortalamanın doğası hakkında ek hipotezleri incelemek için de kullanabiliriz. Aşağıdaki iki hipotezi ele alalım:
A. Ölçülen ortalama, ana popülasyonun ortalamasından daha büyüktür (yani x > x p ) ve
B. Ölçülen ortalama, ana popülasyonun ortalamasından daha azdır (yani x < x p ).
Bu hipotezler sıfır hipotezine benzerken, ince bir şekilde farklılık gösterirler. Her durumda, hipotezi karşılama olasılığı, ortalamanın sadece bir tarafında t’nin frekans dağılımını içerir. Dolayısıyla, (8.2.4) denkleminde bulunan ve meydana gelme olasılığını belirlemede t dağılımının her iki “kuyruğuna” izin veren iki faktörü yoktur. Bu nedenle, p-yüzdelik dilimdeki güven sınırları belirlenir.
Kişi, bir hipotezin doğru olduğunu asla “kanıtlayamayacağını”, yalnızca onun mutlaka yanlış olmadığını anladığını unutmamaya dikkat etmelidir. Verilerin p-yüzde düzeyinde hipotezle tutarlı olduğu söylenebilir.
Örnek boyutu büyüdükçe ve t yoğunluk dağılım fonksiyonu normal eğriye yaklaştıkça, denklemlerdeki integraller değiştirilebilir.
Olasılık yoğunluk fonksiyonu beklenen değer Olasılık yoğunluk fonksiyonu formülü Olasılık yoğunluk fonksiyonu hesaplama Olasılık yoğunluk fonksiyonu nedir Olasılık yoğunluk fonksiyonu Örnek Olasılık yoğunluk fonksiyonu özellikleri Olasılık yoğunluk fonksiyonu ve olasılık dağılım fonksiyonu Olasılık yoğunluk fonksiyonu ve Olasılık dağılım fonksiyonu farkı