İstatistiksel testler, kabaca "parametrik testler" ve "parametrik
olmayan testler" olmak üzere ikiye ayrılabilir. Eldeki bir veri setine,
bu testlerden hangisinin uygun olduğunu belirlemek için normallik testi
yapılmalıdır. Eğer veriler normal dağılıma sahip ise parametrik testler,
veriler normal dağılıma sahip değil ise parametrik olmayan testler
uygun olacaktır. (Örnekte kullanılacak veri setini buradan indirebilirsiniz...)
Bu
veri setinde, bir şirketin 4 farklı dizaynının(design) satış
miktarları(sales) verlilmiştir. Bu 4 farklı grubun satış miktarlarının
normalliğini test etmek için öncelikle hipotezler kurulmalıdır.
1. dizayn için hipotezler;
H0: %95 güvenle veriler normal dağılımlıdır.
H1:%95 güvenle veriler normal dağılımlı değildir.
2. dizayn için hipotezler;
H0: %95 güvenle veriler normal dağılımlıdır.
H1:%95 güvenle veriler normal dağılımlı değildir.
3. dizayn için hipotezler;
H0: %95 güvenle veriler normal dağılımlıdır.
H1:%95 güvenle veriler normal dağılımlı değildir.
4. dizayn için hipotezler;
H0: %95 güvenle veriler normal dağılımlıdır.
H1:%95 güvenle veriler normal dağılımlı değildir.
" Analyze > Descriptive Statistics > Explore "
"Statistics" bölümünden testin güvenilirliği belirlenir. "Plots" bölünden ise normallik testi seçilir.
Bu seçimler yapıldıktan sonra sonuçlar aşağıdaki gibi olacaktır.
Görüldüğü
gibi burada iki farklı test vardır. Bunlardan biri
"Kolmogorov-Smirnov", diğeri ise "Shapiro-Wilk" testidir.
"Shapiro-Wilk" testi daha çok tercih edilir ve kullanılır. Burada
"Shapiro-Wilk" testinin "Sig." değerleri 0.05' den büyük olduğu için tüm
gruplar için H0 hipotezleri kabul edilir. Yani tüm gruplar için "%95 güvenle veriler normal dağılımlıdır." denilebilir.
(Kolmogorov-Smirnov testinin sonuçları, veri sayısının az olduğu durumlarda dikkate alınabilir.)
Elinize sağlık faydalı bir yazı olmuş. Yalnız son cümlede bir hata var sanırım.
YanıtlaSilShapiro-wilk testi Kolmogorov-Smirnova göre daha güçlüdür. veri sayısının AZ olduğu durumlarda Kolmogorov-Smirnov testi DEĞİL Shapiro- Wilk testi dikkate alınır.
Teşekkür ederim.
SilAslında bir hata yok. Küçük bir yanlış anlaşılma ve vurgu sorunu var sanırım. Sizinde söylediğiniz gibi Saphiro-Wilk testi daha güçlü ve daha çok tercih edilen bir testtir. Veri sayısının az yada çok olduğu bütün durumlarda öncelikli olarak tercih edilir. Benim anlatmak istediğim kolmogorov-smirnov testinin sadece veri sayısının az olduğu durumlarda tutarlı sonuçlar vereceğidir.
kolmogorov smirnov testi veri sayısı bazı kaynaklarda 30 bazılarında 50'nin altında olduğunda kullanılmaz diye okudum yazdıklarınızla çelişiyor gibi.veri sayısının az değil 30 dan 50 den çok olduğunda kullanılabilir olması gerekmiyor mu?
SilAcaba kolmogorow-Simirnow testinde 3. design e karşılık gelen boş kalan kısmı nasıl yorumlamak gerekir? Normal dağılım mı değil mi?
YanıtlaSilSpss'in neden o değeri hesaplamadığını bende bilmiyorum. Dikkatimi çekmemişti daha önce. Ancak normallik testi yaparken Shapiro-Wilk testini göz önünde bulundurmak daha sağlıklı olacaktır.
SilÖğretmen bakışlarının cinsiyete göre dağılımı nasıldır şeklindeki bir soru için hangi testi kullanırız ?
YanıtlaSilMerhaba.
SilHistogram tablosu yaparak dağılımın ne şekilde olduğunu görebilirsiniz.
Düzeltme : Histogram grafiği*(tablo değil :D)
SilHocamız basit doğrusal regresyon analizinde " Analyze > Descriptive Statistics > Explore " SPSS' e böyle giriş yapmış. Fakat tablo yorumunda çoklu regresyon analizi tabloları var acaba nerede yanlış yapıyorum ? Yardım edebilir misiniz?
YanıtlaSilHocam şöyle bir cümle yazmışsınız ;
YanıtlaSil"Burada "Shapiro-Wilk" testinin "Sig." değerleri 0.05' den büyük olduğu için tüm gruplar için H0 hipotezleri kabul edilir."
Eğer grupların yarısında sig.değeri 0.05 den küçük olsaydı nasıl yorumlardık. Teşekkürler.
eğer sig. değeri 0.05 den küçük olsaydı veriler normal dağılım göstermiyor denir ve veriler üzerinde nonparametrik testlerin uygulanması daha uygun olur.
SilBir kısım istatistikçi normalliğe bakmak için Kolmogorov sonucunu " Analyze > Descriptive Statistics > Explore " yolu ile elde ederken, diğer bir kesim gurup ise "Analyze / NonParametric Test / One Sample K-S" yolu ile elde etmektedir. Ben iki yöntemide bir gurup verime uyguladığımda aynı sonucu vermekte iken diğer gurup verime uyguladığımda iki yöntemden de farklı sonucu elde ettim. Bunun nedeni ne olabilir? Hangi yöntemi uygulamak doğru olur? teşekkürler.
YanıtlaSilBurada bildiğim kadarıyla veri sayısı önemli, eğer veri sayınız 30 ve üzerinde ise kolmogorov simirnofa bakılır, eğer veri sayınız 30 dan küçükse diğer seçeneklere bakılır.
Sil3 yıl sonra cevap yazmak :)
Silbende 1 yıl sonra yazdım ama sorduğunuz sorunun tam cevabını alabildiniz mi benim de merak ettiğim bir konu.
Silteşekkürler..
YAŞ GURUBU Kolmogorov-Smirnova Shapiro-Wilk
YanıtlaSilStatistic df Sig. Statistic df Sig.
Genel Puanları Toplamı
25 ve altı ,085 25 ,200 ,978 25 ,845
26-30 arası ,075 52 ,200 ,984 52 ,713
31-35 arası ,150 11 ,200 ,979 11 ,960
36-40 arası ,234 5 ,200 ,948 5 ,722
41-46 arası ,260 2 . ?
47 ve üstü ,260 2 . ?
volkan hocam bu tabloda (41-46) ve (47 ve üstü) grubundaki shapiro-wilk değerleri ni nasıl yorumluyacağız?
soru işaretlerini ben koydum :)
Merahaba,
SilTabloyu kopyala/yapıştır yapmışsınız saırım. Yazdıklarınız çok karışık görünüyor. Çok bişey anlayamadım. Ama eğer bir sonuç tablonuz varsa oradaki "sig." değerlerine dikkat etmelisiniz. 0.05' den küçük olan gruplar normal dağılım göstermiyordur.
volkan hocam merhaba,
Silcevabın içinde çok teşekkür ederim.
sorumu açık yazmaya çalışayım. senin ekrandaki design/sales örneğindeki gibi yaş grubu-genel puan toplamı karşılaştırmalı normallik testi yaptığımda, verileri çektiğimde (41-46) ve (47 ve üstü) gruplarının shapiro ya denk gelen kısımlarındaki sig. değerlerini hesaplamıyor. oralar boş çıkıyor. o zaman o kısımları nasıl yorumlamamız gerekir?
şuan tez yazıyorum bilgilerin benim için çok önemli. ayrıca o sig. değerleri 0.05 den küçük olunca kruskal-wallis mi yapmamız gerekir?
Merhaba,
SilO iki grubun veri sayısı normallik testi için yeterli olmayabilir. Grupları birleştirerek yeniden deneyebilirsiniz.(40 üstü gibi). Bir grubun normal dağılım göstermsi için kabaca ortalamanın etrafında çan şeklinde bir dağılım göstermesi gerekir. Eğer veri sayısı az ise böyle bir şekil oluşmayabilir. Bahsettiğim şekile wikipedia' dan bakabiilrsiniz.
Sig. değeri 0.05 den küçük çıktığı zaman ilgili grup normal dağılım göstermiyor demektir. Dolayısıyla non-parametrik testleri uygulamak gerekir. Kruskall wallis de bunlardan birisidir.
Umarım yardımcı olabilmişimdir.
Kolay gelsin.
Merhabalar. Benim bit sorun olucak. İstatistik dersi aliyorum ve hocam final odevi verdi. Bir universitede sigaran icenlerin orani %33tur yeni baslayanlarin yani 1.siniflarin bu orana orani nedir? (Universiteye baslamak sigara icme oranini artirir mi). Tahminimce varyans analizi ama tam emin degilim. yardimci olirsaniz cok sevinirim.
YanıtlaSilVolkan Bey iki grubun verilerini karşılaştıracaksak bir grup Shapiro-Wilk'e göre normal dağılıyor diğer grup normal dağılmıyorsa parametrik mi non-parametrik mi testleri kullanacağız?
YanıtlaSilhocam gerçekten harikasının daha fazla içerik eklemenizi istiyoruz
YanıtlaSilTests of Normality
YanıtlaSilgruplar Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
absorbans 1 .183 16 .158 .925 16 .200
2 .171 16 .200* .914 16 .137
3 .159 16 .200* .919 16 .165
4 .181 16 .168 .872 16 .029
5 .182 16 .163 .885 16 .047
6 .266 16 .004 .814 16 .004
* This is a lower bound of the true significance.
a Lilliefors Significance Correction
Hocam bu durumda ne yapmam gerekiyor grupların yarısı normal dağılım gösteriyor diğer yarısı göstermiyor
Tests of Normality
YanıtlaSilgruplar Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
absorbans 1 .183 16 .158 .925 16 .200
2 .171 16 .200* .914 16 .137
3 .159 16 .200* .919 16 .165
4 .181 16 .168 .872 16 .029
5 .182 16 .163 .885 16 .047
6 .266 16 .004 .814 16 .004
* This is a lower bound of the true significance.
a Lilliefors Significance Correction
Hocam bu durumda ne yapmam gerekiyor grupların yarısı normal dağılım gösteriyor diğer yarısı göstermiyor
hocam Kolmogorov-Smirnova testi 0,05ten buyuk, shapıro wilk testı 0,05ten kucuk cıktı ama bız hangısıne bakarark normallık aramalıyız??şimdiden teşekkürler
YanıtlaSilHocam iki veri setinin korelasyon değerini inceleyecegim ama iki veri seti birlikte normal dağılımın göstermeli deniyor. Nasıl baicam iki veri setinin birlikte normal dağılım gösterdiğine??
YanıtlaSilHocam acil şimdiden tesekkur ederim
Silhocam verdiğiniz verilerle denedim ancak şöyle bir uyarı verdi nedense http://i.hizliresim.com/a57NWQ.jpg
YanıtlaSil(Kolmogorov-Smirnov testinin sonuçları, veri sayısının az olduğu durumlarda dikkate alınabilir.)
YanıtlaSildemişsiniz. Bunu bir kontrol edin isterseniz:)
Şeref Kalaycı; SPSS UYgulamalı Çok Değişkenli İstatistik Teknikleri, Asil Yayıncılık, Sayfa:10.
YanıtlaSiln 29 ve üzeri için K-S, 28 ve altı için S-W testi kullanılabilir. Örnek hacminiz 19 olduğu için burada SW kullanmanız doğru.
bilgiler için teşekkürler fakat şunu düzeltmek isterim tıpkı sizin düştüğünüz gibi 2.tip hataya düşmemeleri için arkadaşların. H0 kabul edildi yerine H0 REDDEDİLEMEZ DENMESİ gerekir.çünkü araştırmacı 2.tip hatayı önceden öngöremez yani gerçekte yanlış olan h0 hipotezinin kabul edilmesi (2.tip hata beta hatası) durumunda hesaplanması zor olan beta hatasınn olasılığından kaçınmak için h0 kabul edildi denilmez, H0 reddedilemez denir. a hatası 1. tip hata araştırmacı tarafından belirlenir ve hipotez testlerinde anlamlılık adını alır.(a=0,05 a=0,01 gibi) .
YanıtlaSilMerhaba, elimde 33 deney 31 kontrol gruplu 38 sorudan oluşan ön test son test şeklinde başarı testi veri dağılımı var. Bu verilerle ilgili bazı ist. yapılmam isteniyor. Fakat soruların verileri girilirken 1 doğru 0 yanlış şeklinde girilmiş. Şimdi dağılıma bakmam için her kişi için bir ön test son test puanı çıkarıp oradan mı bakmalıyım? Yoksa 0,1 şeklindeki verilerde dağılıma bakmam doğru olur mu?
YanıtlaSil"Shapiro-Wilk" testinin p değeri, bir grup için 0.05 ten küçük çıkarsa, bu durumda da veriler normal dağılım gösteriyor diyebiliyor muyuz? Ayrıca bu test değerini kullanmak için örneklem sayısının en az kaç olması gerekiyor?
YanıtlaSilDetaylı ve güzel bir anlatım, çok güzel olmuş emeğinize sağlık.
YanıtlaSiln sayısı 30'un altında ise örneğin 16 gibi ise normal dağılıma hiç bakmadan direkt non parametrik test yapma kararı mı verilir? yoksa normal dağılım gösterip göstermediğine bakıp teste karar verilir.
YanıtlaSilhocam 25 sorudan oluşan bir olcegim var.olcek her sorudan 1 puan alinmasi yonunde. doğru cevapsa 1 puan yanlis ise 0 puan ve bir kisinin alacagi puan en fazla 25. normallik testi yaptigimda her soruya verilen puana gore mi yoksa toplam puan uzerinden mi testi uygulamaliyim. bir de hocam shapiro wilk ve kolmogorov simirnova test sonuçları 0.00 degeri aliyor fakat baskinlik ve çarpıklık degerleri +-1 bucuk değer araliginda, hangisini hesaba katmam gerekiyor?
YanıtlaSilMerhaba hocam. Benim elimde 3 grup 4 değişken var. shapiro wilk yapınca grup 1 ve 3 parametrik, grup 2 non parametrik dağılım gösteriyor ben şimdi 3 grubun ilişkisine bakmak için ANOVA yoksa Kruker willis mi yaoacağım??
YanıtlaSilkolay gelsin. veri analizim için öncelikle normallik testi uyguluyorum p<0,05 oluyor yani normal dağılım göstermiyor. daha sonra verilerime uygun olan nonparametrik test olan mann-whitney u testini uyguladığımda ise p>0,05 çıkıyor bunun nedeni ne olabilir? teşekkürler.
YanıtlaSilNormallikte beklenen p degerinin 0.05ten küçük olması, Mann Whitney U testinde ise 0.05ten büyük olması. Yani herşey yolunda. Anlamlı bir ilişki var...
Silmerhabalar yazılarınız çok güzel...başarılarınızın devamını dilerim. SPSS te veri girerken hasta isimlerini sayısal olarak giriyorsak yani ad soyad yerine protokol numarası şeklinde; bu numeric değer nominal midir scale mi?teşekkürler
YanıtlaSilmerhaba, ben tezimde verilerin normal dağılımı için Kolmogorv smirnov testini kullanmıştım ancak tüm p değerleri .00 olarak çıktı. Hocam p değerinin asla .00 çıkmayacağını söylüyor. Aslı nedir? Teşekkürler :)
YanıtlaSilSpss programı virgülden sonraki 4 rakama kadar gösteriyor sana bu rakam o kadar küçük oldugu için sen istersen o son haneye herhangi istediğin bi rakamı yazabilirsin istatistiksel açıdan bi anlamlılık ifade etmicektir onbinde o yazdığın rakam kadar etkiliceğini düşünücek olursak.
Silverilerimiz normal dağılım göstermiyor ve biz normal dağılım gösteriyor olarak kabul eder ve işlem yaparsak sonuçlar da nasıl farklılıklar olabilir.
YanıtlaSilsignificance grupların bazısında anlamlı bazısında anlamsız çıkınca dağılımın nasıl olduğuna ne şekilde karar verebiliriz?
YanıtlaSilmerhaba, faktör analizinden önce yapılması gereken normal dağılım analizi nasıl oluyor?
YanıtlaSilmerhabalar ben bağımsız 2 örneklem t testi için hangi normallik testini yapmak gerekiyor. elimde 20 20 olmak üzere 2 veri var. hocamız bize spss de kolmogrov stata da swilk yapın demişti benimde kafam karıştı açıkçası.. hangi adımları takip etmem gerekiyor. acaba verileri ayrı olarak girip öyle mi test etmen gerekiyor yada uğraşman 40 veriyi alt alta girerek yanlarına cinsiyet olarak numaralandırılıp analyze -descriptive sctatics - explore danmı yapmalıyım lütfen yardımcı olumusunuz hangi aşamalarla hangi normallik testlerinin yapmam gerekiyor.
YanıtlaSilmerhaba, benim tez hocam normallik için çarpıklığı kullanmamı istedi çarpıklık değeri normal çıkmazsa Shapiro Wilk kullan dedi.
YanıtlaSilçarpıklık 4.72 (SE=1.12), shapiro wilk sonucu da p=0.11 burda da normal dağilmadığını göruyoruz. bu durumda benim yapabileceğim bir sey var mı yorumlarken tesekkurler..
Bu yorum yazar tarafından silindi.
YanıtlaSilAslına bakarsan normallik analizini yapmandaki amaç, sen araştırmanda birşeyler araştırıyosun ve bunun ışığında bazı hipotezler kuruyosun. Bu hipotezlerin doğruluğunu veya yanlışlığını test etmek için kullanıcağın istatistiksel analiz yöntemlerine bu testler sonucunda ulaşıyosun.
YanıtlaSilTavsiyem, faktör analizi yapılmalı , ölçek alt grupları isimlendirilmesi belirlenmeli , bu gruplara dahil olan sorularla Transform->Compute menüsünden dahil oldukları temsil eden isim altında tek bi değişkende temsil edilmelidir , bu bize daha sonra hipotez kurarken yardımcı olucak.
Edit* bu arada normallik testide çoğu zaman bu hipotezlerde kullanılcak olan bu yeni değişkenlere uygulanmakta.
Edit2* Transform—>Compute menüsünden 1. Faktöre dahil olmuş soruların aritmetik ortalamalarını aldırıyosunuz yani yeni değişken o soruların ortalaması oluyor
Silmerhabbalar,
YanıtlaSilnonparametrik faktör analizi spss ile mümkün müdür, yoksa farklı bir program gerekir mi? Teşekkür ederim
Merhabalar hocamız çarpık serileri ve negatif değerli verileri nasıl normalleştirebieceğimizi sordu fakat herhangi bir yanıt bulamıyorum. Yardımcı olur musunuz
YanıtlaSilMerhaba
YanıtlaSilKolmogorov-Smirnov ve Saphiro-Wilk analizlerinde 0.05 ten küçük çıktığında normal dağılım ölçütünü sağlamıyor. Acaba Skewness ve Kurtosis egrilerinde referans aralıkta yer alırsa normal dağılım varsayımını karşıladığını düşüne bilirmiyiz?
Skewness ve Kurtosis değerli için -2 ve 2'yi referans aralığı gösterebilmek için bir kaynak var mı?
YanıtlaSil+2.0 -2.0 için kaynak: George, D., & Mallery, M. (2010). SPSS for Windows Step by Step: A Simple Guide and Reference, 17.0 update (10a ed.) Boston: Pearson
SilMerhaba
YanıtlaSilBaşarılı bir blog. Yeni içerikleri bekliyoruz.
Teşekkürler,
Hocam esnaf lokantası gibi ismi var sitenin fakat, yaptığınız açıklamalar bizim prof.hocanınkinden daha anlaşılır. Saygılarımı sunuyorum.
YanıtlaSilbilgiler için teşekkürler hocam
YanıtlaSilHocam veri setinde ölçek toplam puanı ile bazı demogratif değişkenlerin değişimini hesaplayaacağız. normallik testini demografiklere göre mi yoksa ölçek toplam puanlarına göre mi yapmamız doğru olur.
YanıtlaSilmrhb kolay gelsin benim bir sorum olacaktı. 3 grubun olduğu bir spsste normallik testi yapılırken tüm evren için mi yapılır? yoksa normallik tesiti her grup için ayrı ayrı mı yapılır?
YanıtlaSilNormal dağılım için sign. Değeri 0.05'ten büyük olmasını bekliyoruz.. fakat olumlu hipotezi kabul ederken sign, değeri 0.05'ten küçük olması gerekiyor... Bu karşıtlık nereden kaynaklanıyor...
YanıtlaSilHipotezlerin kurulmasından kaynaklanıyor. Ho yokluk hipotezidir. Evrende dağılımların normal olduğunu, ortalama, varyans vb. arasında fark olmadığını iddia eder. H1 ise alternatif hipotezdir. Hipotezlerinizi düşünürseniz karışıklık yaşamazsınız. Testin sonunda amacınıza göre davranırsınız. Normal olmasını beklediğiniz bir dağılım normal değilse ona göre test uygularsınız.
Silhocam merhaba. normallik testi için toplam puan mı alınmalıdır yoksa ortalama puan mı ?
YanıtlaSilhocam merhaba öncelikle başarılarınızın devamını dilerim çok güzel açıklamışsınız. benim bir sorum var. yüksek lisans tezim deneysel ve örneklem grubum 30'un altında yaptığım normallik testinde bir değişkenin öntesti ile sontesti normal dağılımları farklı çıktı. bu durumda parametrik test mi yoksa nonparametrik test mi kullanmak gerekir. birde kaynak önerebilir misiniz?
YanıtlaSilHocam merhaba, bildiğim kadarıyla parametrik bir test kullanmak için Kural 1 = Her ikiside normal dağılacak birisi bile normal dağılmıyorsa nonparametrik kullanılır.
SilHocam benim çalışmamda da iki ölçeğin arasındaki ilişkiye bakacağım ve birisi normal dağılım diğeri değil. Parametrik mi non parametrik mi test yapacağım bilemedim
SilAçıklamalar için çok teşekkür ederim. 270 deneme için yaklaşık 322000 veriye sahip bir veri setim var. Bu verilerin histogramı normale yakın bir dağılım göstermesine rağmen, Kolmogorov-Smirnov testinde normal dağılım göstermediği ortaya çıkıyor. Veri sayısının bu denli çok olduğu durumlarda normallik testi uygulanmadan, parametrik testler uygulanabilir mi?
YanıtlaSilBir videoda normality testinin örneklem sayısından etkilendiğini ve büyük örneklemlerde mutlaka anlamlı çıktığını, bu nedenle yanıltıcı olduğunu; bunun yerine normalliğin değerlendirilmesinde skewnes ve kurtozis değerlerinin kriter alınması gerektiğini izlemiştim.
YanıtlaSilbence de
Silsig.018 yazdığında normal bir dağılım yok mu demek oluyor? acilll
YanıtlaSilMerhabalar benim veri setimde normallik testi yapınca p değeri her ikisinde de 0 çıkıyor sebebi ne olabilir acaba nerede hata yapıyorum
YanıtlaSilÇok sağ olun Hocam, faydalı oldu, Allah razı olsun
YanıtlaSilhocam merhaba store size kısmı neyi ölçüyor yardımcı olur msunuz
YanıtlaSil