Yazan : Şadi Evren ŞEKER

Bu yazının amacı, bilgisayar bilimlerinde, çeşitli konularda geçen normal dağılımı anlatmaktır. Literatürde, normal dağılım (normal distribution) veya Gauss dağılımı (Gauss distribution) olarak da geçen konu kabaca çan eğrisi olarak tanımlanabilir (bell curve).

Yukarıdaki şekil, normal dağılımın grafiğidir ve aşağıdaki formülle hesaplanır (Gauss fonksiyonu):

Yukarıdaki formül, aynı zamanda gauss dağılımının, olasılık yoğunluk fonksiyonu (probability dense function, pdf) olarak geçmektedir. Formülde kullanılan ve çan eğrisinin şeklini belirleyen en önemli değişken σ değeridir. Bu değer dağılımın üzerinde uygulandığı olasılıksal sürecin (stochastic process) veya topluluğun (population) standart sapmasıdır (standard deviation). Dikkat edilirse formülde kullanıldığı iki yerde de karesi alınmıştır. Bu anlamda değişme (varyans, variance) değeri olarak kabul edilebilir (E = σ 2 olduğunu hatırlayınız).

Ayrıca formülümüzde bulunan μ değeri, ortalama değerdir (mean) ve çan eğrisinin tepe noktasının hangi x değeri için olduğunu belirler. Örneğin yukarıdaki şekilde 3.6 noktasında tepe yapmıştır. Bu durumda μ=3.6 olmuş denilebilir.

Bütün dağılım fonksiyonlarının ortak özelliği olarak, çizilen eğrinin altında kalan alanın toplam değeri 1 olmalıdır (olasılıkların toplamının 1 olduğunu hatırlayınız).

Bu değerleri hesaplayan programı C++ dilinde yazmaya çalışalım:

Kodda basitçe anlatılan fonksiyon kodlanmıştır. Fonksiyonu kodlarken math.h kütüphanesinden faydalandık ve PI ve e sabitlerini kodda görüldüğü şekilde tanımladık. Hassas sonuçlar için bu değerler daha hassas hale getirilebilir.

Kodun çalışan hali aşağıdaki şekildedir:

Yukarıdaki kod üç değer almaktadır. Buna göre hesaplanması istenen x, dağılımın ortalama değeri ve standart sapması girilmelidir. Dağılımın nasıl bir yapıda olduğunu görebilmek için bir döngü halinde bazı değerleri hesaplatalım:

Yukarıdaki kodda, bir döngü içerisinde x=3.2 ile 4.0 arasındaki değerleri otomatik olarak hesaplatıyoruz. Kodun çıktısı aşağıdaki şekildedir:

Yukarıdaki sonuçlardan anlaşılacağı üzere değerler bir çan eğrisi şeklinde yükselip 3.6 değerinde tepe yaptıktan sonra tekrar alçalmaktadır. Bu durumu, yukarıdaki değerleri, aşağıdaki şekilde işaretleyerek göstermeye çalışalım:

Yukarıdaki şekilde kesikli olarak (discrete) elde edilen sonuç bir gauss dağılımıdır ve yazının başında verilen grafiğin kodlanarak ulaşılmış halidir. Grafiği daha iyi görebilmek için daha sık aralıklar verilerek deneme yapılabilir.

Ayrıca konunun bilgisayar bilimleri ile ilgili bir uygulaması için, resim işleme (image processing) konusunda kullanılan düzleştirme filitresi (gauss filter) başlıklı yazıyı okuyabilirsiniz.

Yorumlar

  1. Ata Vatan

    Merhaba,
    Bu hesaplama ile x'i yani örneğin öğrencinin aldığı notu bulabiliyoruz, peki öğrencinin başarı sırasını Nasıl hesaplayabiliriz ? Elimde sınıf ortalaması, standart sapması, öğrenci sayısı ve bir öğrencinin aldığı not var; buna göre o öğrenci üstten kaçıncı sırada olduğunu Nasıl bulabiliriz ?

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir


4 + = onbir