Yazan : Şadi Evren ŞEKER

Tanimoto benzerlik fonksiyonu, 1960 yılında iki bitki resmi arasındaki benzerliğin bulunması amacıyla yapılan çalışmalar sırasında çıkmıştır. Resimlerin bitmap olarak tutulduğu bir ortamda, yani resimlerin 1 veya 0 olabilen bitler ile tutulduğu bir ortamda iki resim arasındaki benzerlik karşılaştırması sırasında, iki resimdeki aynı koordinattaki her bir bit mantıksal “ve” ve “veya” operatörleri ile işleme sokularak birbirine orantılanır.

A ve B isminde iki resmimiz olsun. Ai, A resminin i. bitini ve Bi, ise B resminin i. bitini gösteriyor olsun. Buna göre Tanimoto benzerliği aşağıdaki şekilde yazılabilir:
 T_s(X,Y) = frac{sum_i ( X_i land Y_i)}{sum_i ( X_i lor Y_i)}

Yukarıdaki bu benzerlik değeri, Jaccard benzerliğine benzer bir şekilde iki resimin kesişimi ve birleşimi olarak düşünülebilir. Buna göre iki resimde de 1 olan değerler ve iki resimde de 0 olan değerler aynen kalacak, birbirinden farklı olan değerler, denklemin pay kısmında 0’a dönerken payda kısmında 1 değerinde olacaktır. Sonuçta çıkan değer 0 ile 1 arasında bir değer olacak ve ancak iki resim birbirine bit bit eşitse benzerlik değeri 1 olarak bulunacaktır. Şayet resimlerin bütün bitleri birbirinden farklıysa (negatifi ise) o zaman da benzerlik değeri olarak 0 bulunacaktır. Diğer bir değişke Tanimoto benzerliği 0 ile 1 arasında bir değerdir ve yüksek değerler benzerliğin yüksekliğini gösterir.

Tanimoto mesafesi ise iki resimin birbirine olan uzaklığı olarak düşünüldüğü için ve uzaklık kavramı benzerliğin tersi olduğu için aşağıdaki şekilde ters alınmıştır:
T_d(X,Y) = -{log} _2 ( T_s(X,Y) )
buradaki temel fark, iki ihtimal bulunan her bir bit (0 veya 1 olabileceğini hatırlayınız) 2’nin üssü şeklinde artan bir olasılığa sahipken bu işlemin tersi olan logaritma ile tersinin alınıyor oluşudur.
Tanimoto Benzerliği, resimler için kullanılabildiği gibi metinler için de kullanılabilir ve yakın zamanlarda çıkan Jaccard benzerliği ve Jaccard Mesafesi, tanım itibariyle Tanimoto’nun yaklaşımına oldukça benzemektedir.

Örnek olarak aşağıda verilen iki basit resim üzerinden Tanimoto benzerliğini hesaplamaya çalışalım:

R1 =
100
010
111

R2=
110
000
111

Resimdeki her bitin ikili olarak ve işlemi sonucunu alıp toplayacağız ve çıkan sonucu yine aynı şekilde veya alınmış değere bölümünü alacağız:
R1 land R2
100
000
111
Yukarıdaki 1’lerin toplamı (veya sayısı) ise 4 olarak bulunur. Şimdi de veya işlemine tabi tutalım:
R1 lor R2
110
010
111
Yukarıdaki 1’lerin toplamı ise 6 olarak bulunur. O halde Tanimoto benzerliğini aşağıdaki şekilde hesaplarız:
 T_s(R_1, R_2) = frac{sum_i ( R_1 land R_2)}{sum_i ( R_1 lor R_2)} = frac 4 6 = frac = {0,66}

Yorumlar

  1. Enkh-Amgalan

    Birinci resimde(R1) bin tane 0 bir tane 1 ve ikinci resimde(R2) 999 tane 0 iki tane 1 varsa ve birler denk geliyorsa R1 ve R2 arasındaki benzerliği 0.5 mi olur?

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir


dört × 6 =