Virgülle Ayrılmış Veri Setini(CSV) SPSS ile Açma



Virgülle ayrılmış veri(Comma Seperated Values - CSV) formatı veri analizi çalışmalarında en yaygın olarak kullanılan dosya tipidir. Bu kadar yaygın olmasının sebebi neredeyse mevcut bütün veri analizi programları tarafından desteklenmesidir. Ayrıca farklı programlar arasında da kolay veri aktarımını sağlar. Örneğin veri tabanlarından dışarı veri aktarma aşamasında(exporting) yada açık kaynak kodlu R, Weka, Orange gibi programlardan SPSS, Excel gibi daha yaygın programlara veri aktarımında kullanılabilir.. Bu bölümde bu dosya tipinin SPSS'e nasıl aktarılacağına bakacağız. Örnek dosyayı buradan indirebilirsiniz.


Bu tip dosya tipleri "Virgülle Ayrılmış Veri" olarak çağrılsa da aslında genellikle değişkenler noktalı virgülle(;) ile ayrılır. Bunun sebebi ondalıklı sayıların virgüllü kısmının programlar tarafından ayrı bir değişken olarak algılanmasını engellemektir.

SPSS' de bu tip dosyaları açarken "File > Open > Data" bölümünden yada doğrudan ilgili dosyayı SPSS'in data editörünün üstüne sürükleyerek SPSS'in text okuma sihirbazını çalıştırabilirsiniz.


Bundan sonra açılan pencerede SPSS bilgisayarınızdan ilgili dosyayı bulmanız gerekiyor. Aşağıdaki bölümde gösterilen dosya tiplerini değiştirmeyi unutmayın. Aksi takdirde SPSS sadece kendi dosyalarını(.sav uzantılı)
gösterecektir.

Dosya seçme işlemi başladıktan sonra "Text Import Wizard" çalışacaktır.

Bu ilk pencerede SPSS size bu dosya tipinin daha önce tanımlanmış bir dosya tipiyle uyuşup uyuşmadığını bize sorar. Bu örnekte tanımlı olmadığı için "No" yu seçip devam ediyoruz.

Bu pencerenin ilk kısmında verilerin belirli bir ayraçlamı yoksa bir hizaya göre mi ayrıldığını soruyor. Bu veri seti bir ayraçla(noktalı virgül) ayrıldığı için "Delimited" seçeneği seçilir. İkinci bölümde ise veri setinin en üst satırında veri isimlerinin olup olmadığını soruyor. Bu veri setinde veri isimleri en üst satırda olduğu için "Yes" i seçip ilerleyebilirsiniz.

Bir önceki pencerede veri isimleri en üst satırda olduğu için verilerin başladığı satır numarası kendiliğinden 2 olarak ayarlanıyor. Bu pencerede aynı zamanda örneklemede yapılabilir. Verilerin tamamını, ilk x tane veriyi yada rastgele olarak belirli bir yüzdesini seçebilirsiniz.


Bu bölümde ise verilerin ne tür bir ayraç ile ayrıldığı seçilir. Burada "Semicolon(noktalı virgül)" seçeneğini işaretlendiğinde verilerin bir düzene girdiği görülebilir.
Bu bölümde ise veri isimleri ve tipleri düzenlenebilir. Bu veri setinde bütün değişkenler nümerik olduğu için "Numeric" seçeneği seçilir.
Bu pencerenin üst bölümünde SPSS "bu dosya tipini ilerde kullanmak için kaydetmek ister misiniz?" diye soruyor. İsteğe göre kaydelilebilir. Ben kaydetmedim. "Finish" tuşuna basarak Text Import Wizard sonlandırılır. Veri seti aşağıdaki gibi olacaktır.
Bunun ardından ilgili analizler veri setine uygulanabilir.

6 yorum: