Veri Analizi

Veri analizi planı, verilerinizin nasıl temizleneceğini, dönüştürüleceğini ve analiz edileceğini açıklamayı ifade eder. Tüm bilimsel araştırmalar tekrarlanabilir niteliktedir ve tekrarlanabilir olması için okuyucunuza verilerinizi nasıl yönettiğinizi ve analizleri nasıl yaptığınızı gösteren yol haritasını vermeniz gerekir. Aşağıdaki alanların her biri bir veri analiz planına eklenebilir.

Veri Analizi Planı
Veri analizi planı, verilerinizin nasıl temizleneceğini, dönüştürüleceğini ve analiz edileceğini açıklamayı ifade eder. Tüm bilimsel araştırmalar tekrarlanabilir niteliktedir ve tekrarlanabilir olması için okuyucunuza verilerinizi nasıl yönettiğinizi ve analizleri nasıl yaptığınızı gösteren yol haritasını vermeniz gerekir. Aşağıdaki alanların her biri bir veri analiz planına eklenebilir.

Verilerin Temizlenmesi Verilerin
temizliği, tek değişkenli ve çok değişkenli aykırı değerlerin kaldırılması, eksik verilerle ilgilenme ve normalliğin değerlendirilmesidir.

Tek değişkenli aykırı değerler
Değişkenlerin tek değişkenli aykırı değerler için değerlendirileceğini belirtin. Tek değişkenli aykırı değişken, ortalamanın ± 3.29’dan büyük bir standart sapmasına sahip bir gözlem anlamına gelir. Bu, bir değişkenin puanlarının standartlaştırılmasıyla (yani değişkenin puanlarının sıfır ortalaması ve 1’in standart sapması olduğu) ve ± 3.29’dan daha büyük bir gözlem arayarak kolayca gerçekleştirilebilir.
Çok değişkenli ayraçlar Çok
değişkenli analizler yaparken, değişken gruplarının çok değişkenli ayraçlar için değerlendirileceğini belirtin. Çok değişkenli aykırı değerler, iki veya daha fazla değişken kombinasyonundaki aykırı değerlere karşılık gelir. Çok değişkenli aykırı değerleri değerlendirmek için, bağımlı değişken olarak gözlem kimliği numarasıyla, değişkenler yordayıcı olarak değerlendirilip, Mahalanobis’in mesafesini değerlendirerek bir regresyon yapabilirsiniz. Ardından, bir gözlemin p = .001 düzeyinde ki-kare değeri için bir gözlemin Mahalanobis’in serbestlik derecelerine göre uzaklık puanını inceleyin (yani, değişkenlerin sayısı serbestlik derecelerine eşit olacaktır).
Eksik veriler Eksik verilerin
nasıl işleneceğini açıklayın. Eksik veriler değişken üzerinde bir gözlem bulunmamasıdır. Birkaç çözüm var: gözlemi eksik veriler, ortalama ikame ve çoklu emirlerle ( Intellectus İstatistikleri kullanarak ) bırakın .

Normallik
Çoğu parametrik istatistik (örneğin, ANOVA’lar) Normallik varsayımına sahiptir. Normallik, puanların dağılımının şeklini ifade eder (örneğin, normal bir çan eğrisinin şekli). Bir normallik değerlendirmek için bir araştırmacı, bir değişkenin çarpıklığını ve kurtozisini inceleyebilir veya 1 örnekli KS testi yapabilir. KS testi, verilerin dağılımının normal bir eğriden önemli ölçüde farklı olup olmadığını bildirecektir.
Veriler normal olarak dağıtılmadığında, verinin dönüşümü uygun olabilir. Bazı yaygın dönüşümler karekök, logaritmik ve terstir.

Her Araştırma Sorusunun İncelenmesi İçin Özel İstatistiksel Testlerin Tanımlanması

İstatistiksel analizlerin seçimi iki şeye dayanır: hipotezin istatistiksel dilde belirtilme şekli ve değişkenlerin ölçüm düzeyi.

Hipotez
Araştırmacının hipotezi belirtme şekli, veri analizi testinin seçiminde fark yaratır. İşte üç boş hipotez örneği:
(Örnek 1) Değişken A, Değişken B ile ilgili değildir,
Örnek 1, korelasyon veya ki-kare dili ile ifade edilme eğilimindedir,
(Örnek 2) Değişken A, Değişken B’yi öngörmez,
Örnek 2, regresyon dilinde belirtilmiştir,
(Örnek 3) A değişkeninde B değişkeninin hiçbir farkı yoktur.
Örnek 3, ANOVA veya Mann-Whitney dilinde belirtilmiştir.
Birisi kesin veri analizi testini nasıl seçer? Farklılıkların, tahminin veya ilişkinin tanımlanmasına ek olarak, test seçimindeki diğer husus değişkenlerin her birinin ölçüm seviyesidir.

Doğru Veri Analizini Seçmek İçin Değişkenlerin Ölçüm Seviyesi
Yukarıdaki hipotezlerde, değişkenlerin ölçüm seviyesi doğru veri analizinin seçiminde anahtar bir faktördür.
Örnek 1’de, eğer değişkenlerin her ikisi de kategorikse, doğru analiz ki-kare testi olurken, her iki değişken de aralık düzeyinde ise, Pearson korelasyonu muhtemelen ilişkileri incelemek için doğru analiz olur.
Örnek 2’de, regresyon uygun bir testtir (yani bir değişkenin başka bir değişken üzerindeki etkisinin incelenmesi). Lineer regresyon, eğer bağımlı değişken aralık düzeyinde ise doğru analiz, bağımlı değişken iki kişilik ise lojistik regresyon ve bağımlı değişken üç veya daha fazla kategoriye sahipse multinominal lojistik regresyondur.
Örnek 3’te, eğer bağımlı değişken aralık ise, bir ANOVA uygundur, buna karşılık bir sıralı değişken değişken bir testin Mann-Whitney’i seçmesine yol açar.
Veri Analizini Hep Birlikte Koymak Veri
analiz planında, veri temizleme ve dönüştürme prosedürleri ele alınmalı, daha sonra yapılacak spesifik veri analiz testlerini tartışın. İstediğiniz şekilde hipotezleri belirttiğinizden emin olun – ilişkileri incelemek, tahmin etmek veya bir değişken üzerindeki farklılıkları başka bir değişkenle incelemek.