Yazan : Şadi Evren ŞEKER

n adet Rasgele değişkenlerden (random variables) oluşan bir vektörde (kolon matrisinde, column matrix) nxn büyüklüğünde her rastgele değişkenin diğer bütün rastgele değişkenlerle kovaryansını (covariance) veren matristir.

Kovaryans formülünden şayet Σij = cov(Xi,Xj) = E[ (Xi-μi ) (Xj- μj )] eşitliği yazılırsa aşağıdaki matris elde edilir:

Sayısal Örnek

Yorum kısmında gelen talep üzerine sayısal bir örnek ekliyorum. Örneğimiz bir sınıftaki öğrencilerin aldığı notlar üzerinden varyans, kovaryans ve kovaryans matrislerinin çıkarımı olsun. Bunun için örnek olarak aşağıdaki gibi bir sınıf listesi ve 3 farklı dersten alınan notlar girilmiş olsun:

Öğrenci Matematik Bilgisayar Fizik
Ali 90 60 90
Veli 90 90 30
Ahmet 60 60 60
Mehmet 60 60 90
Hüseyin 30 30 30

Öncelikle yukarıdaki tablo aşağıdaki şekilde bir matrise çevrilebilir.

covar1

Şimdi artık bu matrisi kullanarak sapma (deviation) hesaplamamız mümkündür. Bunun için aşağıdaki formülü kullanıyoruz:

a = A1A ( 1 / n )

Hesaplamak istediğimiz sapma matrisi a ise, buradaki A matrisi yukarıdaki gibi elde ettiğimiz değerleri içeren matris. 1 ise 1 değerine sahip matris. n ise matrisin satır sayısı veya basitçe başlangıçtaki öğrenci sayısı olarak düşünülebilir.

covar2

Ardından hesaplanan a’a matrisi yani matrisin transpozu (transpose) ile çarpılmış hali aşağıdaki şekilde hesaplanabilir:

covar3

Sonuç olarak varyans matrisi (variance matrix) aşağıdaki şekilde hesaplanacaktır:

V = a‘ a / n

Bu değer ise aşağıdaki iki adımda hesaplanarak aşağıdaki matrisle gösterilebilir:

covar4

 

covar5

Yukarıdaki matrisin bizim için anlamı, diyagonda (köşegende) duran değerlerin o dersten o derse olan varyansları ifade ediyor olmasıdır. Örneğin en yüksek varyans değerine sahip olan ders 720 ile fizik dersidir. Bunun anlamı fizik dersindeki notların hareketliliği ile (varyans) varyans değeri 360 olan bilgisayar dersindeki notların hareketliliği arasında iki misli fark olduğudur. Gerçekten de iki ders için de ortalama 60 iken, fizik dersinde ortalamadan 30 uzakta 4 kişi varken bilgisayar dersinde ortalamadan 30 uzakta 2 kişi vardır, yani ortalamadan sapma oranı çok daha yüksektir.

Matristeki diğer elemanlar ise kovaryans (covariance) olarak yorumlanabilir. Yani iki dersin birbirine göre ne kadar hareketli olduğunu göstermektedir. Örneğin bilgisayar ve fizik dersleri arasındaki kovaryans sıfır çıkmıştır. Bunun anlamı bir dersteki notlara bakılarak diğer ders ile ilgili bir tahmin yapılamayacağıdır. Bunun tersine matematik ve bilgisayar dersleri arasındaki kovaryans 360 ve matematik ve fizik dersleri arasındaki kovaryans ise 180 çıkmıştır. Bunun anlamı matematik ve bilgisayar dersleri arasındaki birlikte hareketin veya bu hareketten yapılacak çıkarımların matematik ve fizik dersi arasındaki birlikte harekete veya yapılacak çıkarımlara göre iki misli daha yüksek olmasıdır.

Gerçekten de matematik ve bilgisayar derslerinden aynı notu almış 4 kişi varken matematik ve fizik derslerinden aynı notu almış 3 kişi vardır (uyarı : bunu konu anlaşılsın diye yazdım ama kovaryans sadece aynı notu almış kişi sayısına bakmaz, aynı zamanda aralarındaki mesafeye ve yukarı aşağı yönlü olmasını da dikkate alır, örneğin matematik ve bilgisayar derslerinde aynı notu almayan tek kişinin notları arasında 30 puan fark olması ile 10 puan fark olması veya 90 puan fark olması durumunda kovaryans değeri farklı çıkacaktır).

Yorumlar

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir


+ dokuz = 17