Eksik Değerlerin Belirlenmesi – Tez Hazırlatma – Tez Yaptırma – Tez Yaptırma Fiyatları – Tez Örnekleri – Ücretli Tez Yazdırma – Tez Yaptırma Ücreti
Eksik Değerlerin Belirlenmesi ve Kodlanması
Kaçınılmaz olarak, tüm veritabanları ve çoğu değişken bazı eksik değerlere sahip olacaktır. Bu, ya çalışma katılımcılarının belirli sorulara yanıt vermemesinin, kaçırılan gözlemlerin ya da veri tabanından reddedilen hatalı verilerin bir sonucudur. Araştırmacılar ve veri analistleri, sonuçları potansiyel olarak çarpıtabileceklerinden, genellikle eksik veri içeren belirli vakaları dahil etmek istemezler.
Bu nedenle, çoğu istatistiksel paket (örneğin, SPSS, SAS), belirli değişkenlerin eksik olduğu düşünülen durumları yok sayma seçeneği sunacak veya boş değerleri otomatik olarak eksik olarak değerlendirecektir. Bu programlar ayrıca tipik olarak araştırmacının eksik verileri temsil etmek için belirli değerleri belirlemesine izin verir. Eksik veri değerlerini atamak için kullanılan birçok tekniğin küçük bir örneği tartışılmaktadır.
Hesaplama Toplamları ve Yeni Değişkenler
Bazı durumlarda araştırmacı, diğer değişkenlerden alınan değerlere dayalı olarak yeni değişkenler yaratmak isteyebilir. Örneğin, bir araştırmacının, her ay iki farklı tedavideki hastaların tedavilerine toplam kaç kez katıldığına ilişkin verilere sahip olduğunu varsayalım.
Araştırmacı, her biri tedavinin ilk ayında her hafta katıldığı oturum sayısını temsil eden toplam dört değişkene sahip olacaktır. Bunlara q1, q2, q3 ve q4 diyelim. Araştırmacı, farklı tedavilere göre aylık katılımı analiz etmek isterse, yeni bir değişken hesaplaması gerekir. Bu, aşağıdaki dönüşümle yapılabilir.
Değişkenleri dönüştürmenin bir başka nedeni de, değişkenin normal olarak dağılmamış olabilmesidir. Bu, veri analizinin sonuçlarını önemli ölçüde değiştirebilir. Bu gibi durumlarda, belirli veri dönüşümleri, dağılımı normalleştirmeye ve sonuçların doğruluğunu iyileştirmeye hizmet edebilir.
Ters Ölçek Öğeleri
Birçok araç ve ölçü, katılımcıların “yanıt seti” olarak adlandırılan şeye düşme olasılığını azaltmak için ters ölçeklere sahip maddeler kullanır. Bir katılımcı, her sorgunun veya ifadenin içeriğinden bağımsız olarak, bir test veya değerlendirme ölçüsündeki sorulara veya ifadelere kalıplı bir şekilde yanıt vermeye başladığında bir yanıt seti oluşur.
Örneğin, bir kişi tüm test maddelerine yanlış cevap verebilir veya 1’den 5’e kadar yanıt isteyen tüm maddeler için 1 verebilir. Ters ölçek maddelerinin nasıl çalıştığına bir örnek: Diyelim ki bir ankete katılanlar bir dizi ifade ile 1’den 5’e kadar katılma düzeylerini belirtmeleri istenmektedir.
Bu ankette 1 kesinlikle katılmıyorum, 5 ise kesinlikle katılıyorum anlamına gelmektedir. Ancak araştırmacı, anketteki bazı maddelerin ölçeğini tersine çevirmeye karar verebilir, böylece 1 tamamen katılıyorum ve 5 tamamen katılmıyorum anlamına gelir.
Bu, katılımcıların bir yanıt setine düşme olasılığını azaltabilir. Veriler analiz edilmeden önce, tüm yanıtların aynı yöne düşmesi için tüm tersine çevrilmiş öğelerin yeniden kodlanması önemlidir.
Eksik veri tamamlama yöntemleri
Kayıp veri analizi
Eksik veri doldurma
R da eksik veri
Pandas veri temizleme
Kayıp analizi
Veri madenciliği kayıp veri
Multiple imputation nedir
Veri Dönüşümleri
Çoğu istatistiksel prosedür, analiz edilen değişkenlerin normal olarak dağıldığını varsayar. Normal dağılmayan değişkenleri analiz etmek, ciddi şekilde fazla tahmine veya eksik tahmine yol açabilir. Bu nedenle, araştırmacılar verilerini analiz etmeden önce değişken dağılımlarını dikkatlice incelemelidir. Bu genellikle sadece frekans dağılımlarına bakılarak yapılsa da, değişkenlerin normal olarak dağılıp dağılmadığını belirlemenin birçok, daha nesnel yöntemi vardır.
Tipik olarak bunlar, dağılımın genel simetri eksikliğini ölçen her bir değişkenin çarpıklığının incelenmesini ve orta noktanın solunda ve sağında aynı görünüp görünmediğini; ve verilerin normal dağılıma göre doruk veya düz olup olmadığını ölçen basıklığı vardır.
Ne yazık ki, sosyal bilimlerdeki ve belirli örneklem grupları içindeki pek çok değişken normal olarak dağılmamıştır. Bu nedenle, araştırmacılar belirli değişkenlerin normalliğini potansiyel olarak iyileştirmek için çoğu zaman birkaç dönüşümden birine güvenirler. En sık kullanılan dönüşümler, karekök dönüşümü, log dönüşümü ve ters dönüşümlerdir.
Karekök dönüşümü: Basitçe tanımlanan bu tür bir dönüşüm, belirli bir değişken içindeki her bir değerin karekökünü almayı içerir. Bir uyarı, negatif bir sayının karekökünü alamayacağınızdır. Neyse ki, bu, karekökü hesaplamadan önce her öğeye 1 gibi bir sabit ekleyerek kolayca düzeltilebilir.
Günlük dönüşümü: Çok çeşitli günlük dönüşümleri vardır. Bununla birlikte, genel olarak, bir logaritma, orijinal sayıyı elde etmek için bir taban sayının yükseltilmesi gereken güçtür (üs olarak da bilinir). Karekök dönüşümünde olduğu gibi, bir değişken 1’den küçük değerler içeriyorsa, dağılımın minimum değerini taşımak için bir sabit eklenmelidir.
Ters dönüşüm: Bu tür bir dönüşüm, her bir değerin tersini 1’e bölerek almayı içerir. Örneğin, 3’ün tersi 1/3 olarak hesaplanır. Esasen, bu prosedür çok küçük değerleri çok büyük ve çok büyük değerleri çok küçük yapar ve bir değişkenin puanlarının sırasını tersine çevirme etkisine sahiptir. Bu nedenle, bu dönüştürme prosedürünü kullanan araştırmacılar, analizlerini takiben puanları yanlış yorumlamamaya dikkat etmelidir.
Değişkenleri Yeniden Kodlama
Bazı değişkenler, kategoriler halinde yeniden kodlanırlarsa daha kolay analiz edilebilirler. Örneğin, bir araştırmacı gelir tahminlerini veya yaşları belirli aralıklara daraltmak isteyebilir. Bu, sürekli bir değişkeni kategorik bir değişkene dönüştürmenin bir örneğidir.
Sürekli değişkenleri kategorize etmek nihayetinde özgünlüklerini azaltabilse de, bazı durumlarda veri analizini ve yorumunu basitleştirmek garanti edilebilir. Diğer durumlarda, kategorik değişkenleri daha az kategoride birleştirerek yeniden kategorize etmek veya yeniden kodlamak gerekebilir.
Bu genellikle, değişkenlerin çok sayıda kategorisine sahip olduğu ve belirli kategorilerin seyrek doldurulduğu ve bu da belirli istatistiksel analizlerin varsayımlarını ihlal edebileceği durumlarda geçerlidir. Bu sorunu çözmek için araştırmacılar belirli kategorileri birleştirmeyi veya daraltmayı seçebilirler.
Veriler tarandıktan, girildikten, temizlendikten ve dönüştürüldükten sonra analiz edilmeye hazır olmalıdır. Elbette, analizler sırasında verilerin yeniden kodlanması veya dönüştürülmesi gerekebilir.
Aslında, daha önce tartışılan dönüşümlerin çoğuna olan ihtiyaç, analizler başlayana kadar tespit edilemeyecektir. Yine de, önce verileri dikkatli bir şekilde hazırlamak için zaman ayırmak, veri analizini daha verimli hale getirmeli ve çalışmanın bulgularının genel geçerliliğini iyileştirmelidir.
Eksik veri doldurma Eksik veri tamamlama yöntemleri Kayıp analizi Kayıp veri analizi Multiple imputation nedir Pandas veri temizleme R da eksik veri Veri madenciliği kayıp veri