Bu Blogda Ara

Translate

7 Haziran 2026 Pazar

Veriden Bilgiye: Adım Adım İstatistik

İstatistiksel analiz seviyelendirmesi, araştırmanın amacına, toplanan verinin yapısına (ölçek türlerine) ve değişkenler arasındaki ilişki ağına göre basitten karmaşığa doğru bir hiyerarşi izlenerek yapılır. Akademik çalışmalarda ve veri analitiğinde bu seviyelendirme genellikle 4 temel basamak üzerinden ele alınır.

İstatistik Analizi Seviyelendirilmesi


Veri analizi planlarken ya da bir makalenin metodoloji kısmını kurgularken kullanabileceğiniz standart seviyelendirme yaklaşımı şu şekildedir:

1. Tanımlayıcı (Betimsel) İstatistikler (Descriptive Statistics)

Analizin en temel seviyesidir. Verinin mevcut durumunu özetlemek, "fotoğrafını çekmek" için kullanılır. Gruplar arasında bir karşılaştırma veya hipotez testi içermez.

  • Kategorik (Nitel) Veriler İçin: Frekans ($n$) ve yüzde ($\%$) dağılımları.

  • Sürekli (Nicel) Veriler İçin: * Veri normal dağılıyorsa: Ortalama (Mean) $\pm$ Standart Sapma (SD)

    • Veri normal dağılmıyorsa: Medyan (Ortanca) ve Çeyrekler Arası Aralık (IQR / Percentile)

  • Grafiksel Gösterimler: Bar grafikler, pasta grafikleri, histogramlar ve kutu grafikleri (boxplot).

2. Çıkarımsal ve Karşılaştırmalı İstatistikler (Inferential Statistics)

Bu seviyede örneklemden elde edilen verilerle evren hakkında tahminler yapılır ve gruplar arasında anlamlı bir fark olup olmadığı test edilir. Seçilecek testler verinin parametrik (normal dağılan) veya non-parametrik (normal dağılmayan) olma durumuna göre ikiye ayrılır:

A) İki Grubun Karşılaştırılması

  • Bağımsız Gruplar (Örn: Kadın-Erkek): Independent Samples t-test (Parametrik) veya Mann-Whitney U (Non-parametrik).

  • Bağımlı/Eşleştirilmiş Gruplar (Örn: Tedavi öncesi-sonrası): Paired Samples t-test (Parametrik) veya Wilcoxon Signed-Rank (Non-parametrik).

B) Üç veya Daha Fazla Grubun Karşılaştırılması

  • Bağımsız Gruplar: One-Way ANOVA (Parametrik) veya Kruskal-Wallis H (Non-parametrik).

  • Bağımlı/Tekrarlı Ölçümler: Repeated Measures ANOVA (Parametrik) veya Friedman Testi (Non-parametrik).

C) Kategorik Değişkenlerin Karşılaştırılması

  • Grup içi oranların veya bağımsız kategorik değişkenlerin ilişkisi için Ki-Kare ($\chi^2$) Testi (veya örneklem küçükse Fisher's Exact Test).

  • Aynı grubun tekrarlı kategorik ölçümleri için McNemar Testi.

3. İlişki ve Etki Analizleri (Correlation & Advanced Modeling)

Değişkenler arasındaki ilişkinin yönünü, gücünü veya bir değişkenin diğerini ne ölçüde tahmin ettiğini belirlemek için kullanılan ileri düzey bir yöntemdir.

  • Korelasyon Analizleri: İki sürekli değişken arasındaki ilişki için Pearson (Parametrik) veya Spearman (Non-parametrik) korelasyon katsayısı ($r$).

  • Regresyon Analizleri (Tahminleme modelleri):

    • Doğrusal (Lineer) Regresyon: Sürekli bir bağımlı değişkeni tahmin etmek için (Basit veya Çoklu/Multiple Linear Regression).

    • Lojistik Regresyon: Kategorik/İki uçlu (Örn: Hasta/Sağlıklı, Eksitus/Sağ) bir bağımlı değişkeni etkileyen risk faktörlerini belirlemek için (Binary/Multinomial Logistic Regression). Burada Odds Ratio (OR) ve $\%95$ Güven Aralığı (CI) raporlanır.

4. Tanısal ve Çok Değişkenli İleri Seviye Analizler

Verinin yapısına göre spesifik amaca hizmet eden, klinik veya pratik geçerliliği ölçen en üst seviye analizlerdir.

  • Sağkalım (Survival) Analizleri: Zamana bağlı olay analizi için Kaplan-Meier eğrileri ve risk faktörleri için Cox Proportional Hazards Regresyonu.

  • Tanısal Test Analizleri: Bir tanı yönteminin veya biyobelirtecin başarısını ölçmek için ROC Eğrisi (Receiver Operating Characteristic) analizi, Duyarlılık (Sensitivity), Özgüllük (Specificity) ve Eğri Altında Kalan Alan (AUC) hesaplamaları.

  • Boyut İndirgeme ve Yapı Geçerliliği: Ölçek çalışmalarında kullanılan Açımlayıcı/Doğrulayıcı Faktör Analizleri (EFA/CFA).

💡 Seviyelendirme Yaparken Altın Kural:

Bir çalışmada direkt Seviye 3 veya 4'teki analizlere (örneğin Çoklu Regresyon) geçilmez. Analiz planı her zaman Seviye 1 (Tanımlayıcı) ile başlar, ardından Seviye 2 (Univariate/Tek değişkenli karşılaştırmalar) ile anlamlı çıkan veya klinik önemi olan değişkenler seçilir ve son olarak Seviye 3 ve 4 (Multivariate/Çok değişkenli modeller) kurgulanarak nihai p-değerleri raporlanır.

Hiç yorum yok:

Yorum Gönder