Rapid Miner ile K-NN Uygulaması

Rapid Miner ile K-NN Uygulaması Yazan: Şadi Evren ŞEKER Bu yazımızda Rapid Miner yazılımına genel anlamda bir giriş yapacağız. Bu yazının amacı Rapid Miner’ın 7.0 versiyonu esas alınarak hazırlanmıştır ve yazının yazılma tarih itibariyle henüz yeni bir versiyondur. Rapid Miner bir topluluk yazılımıdır (community founded software) ve dolayısıyla topluluk üyeleri için ücretsizdir, ayrıca akademik ve […]

Devam

Kemmi Normalleştirme (Quantile Normalization)

Yazan : Şadi Evren ŞEKER Literatürde Quantile Normalization olarak geçen ve çoğu Türkçe kaynakta da kantil normalleştirme olarak çevrilen kavramı (ben kelimenin kökü olan qunatity, yani sayısal veya kemiyet olarak gelen kelimeyi kullanmayı tercih ettim) açıklamaktır. Kemmi normalleştirme basitçe iki veya daha fazla farklı özellikteki veri kümesinin benzer dağılımlara sahip hale getirilmesi için kullanılan bir […]

Devam

JAVA dilinde WEKA ile kod geliştirilmesi

JAVA dilinde WEKA ile kod geliştirilmesi Yazan: Şadi Evren ŞEKER WEKA, geliştiriliş şekli itibariyle JAVA dili üzerinde yazılmış açık kaynak kodlu bir yazılımdır. Bunun anlamı, WEKA içerisinde bulunan ve bu bölüme kadar ara yüzleri kullanarak eriştiğimiz bütün işlemlere, JAVA dilinden yapılacak basit nesne tanımlama ve metot çağırmaları ile ulaşabileceğimizdir. Basit bir WEKA kodu Weka ile […]

Devam

Sorenson-Dice Katsayisi (Dice Sorensen Coefficient)

Yazan : Şadi Evren ŞEKER Bu yazının amacı, dizgiler (String) arasındaki mesafenin ölçülmesi için kullanılan dizgi metriklerinden (string metrics) Sorensen-Dice katsayısını (Sorensen-dice coefficient) anlatmaktır. Öncelikle bir özellik çıkarımı yöntemi ile iki metin üzerinden özellikler çıkarılır ve ardından aşağıdaki formüle göre benzerlik hesabı yapılır. Yöntemin çalışmasını iki dizgi üzerinde gösterelim:   Dizgi 1 = “bilgi” Dizgi […]

Devam

Weka Knowledge Flow

Weka Knowledge Flow Yazan : Şadi Evren ŞEKER Bu yazının amacı, veri madenciliği çalışmalarında sıkça kullanılan araçlardan birisi olan WEKA yazılımının “knowledge flow environment” ekranını basit bir örnek üzerinden anlatmaktır. Knowledge flow ekranının amacı, Weka içerisinde bulunan çok sayıdaki kütüphaneye göresel bir ortamdan erişebilmektir. Amaç: Bu örnekte, Weka’nın kurulumu ile birlkte gelen, hazır veri kümelerinden […]

Devam

Caching Mekanizmaları

Yazan: İsmet Bahadır – Ersin Aksoy 26 Mart 2012 Binlerce insanın internet üzerinden eriştiği web platformlarının temeldeki en büyük sıkıntısı, bu platformların kullandığı kaynakların (yazılım, donanım v.b.) yetersiz kalabilmesidir. Platforma erişen kullanıcı sayısı arttıkça, sistem kaynaklarını arttırmak gerekir. Bu işlem genelde veri tabanı için yeni sunucu sistemlerinin takviyesiyle veya mevcut sunucu sistemlerinin hafıza (RAM) alanlarının […]

Devam

Konu Dışı

Sitede bulunan konular ile ilgili olmayan bütün sorularınız ve cevapları için bu yazıyı kullanabilirsiniz. Lütfen burada sorunuzu veya yorumunuzu yazmadan önce sağ üst köşede bulunan arama kutularından, sorunuzun ilgili olduğunu düşündüğünüz kelimeleri mutlaka arayınız. Buradaki sorular ve yorumlar, daha sonra ilgili bir yazı eklenmesi halinde bu yazının altına taşınacaktır. İlginiz için teşekkürler ve hepinize başarılar. […]

Devam

SLR(1)

Yazan : Şadi Evren ŞEKER Bu yazının amacı, özellikle derleyici tasarımı (compiler design) konusunda sıkça kullanılan parçalama algoritmalarından (parse algorithm) birisi olan SLR(1) algoritmasını açıklamaktır. Algoritma, klasik LR algoritmalarından LR(1) algoritmasının basitleştirilmiş halidir. Bu anlamda Simplified LR(1) şeklinde okunabilir. LR(1) algoritması hatırlanacak olursa, bu algoritma Left to Right parsing ve Rightmost derivation terimlerinin baş harflerinden […]

Devam

Birliktelik Kurallarının Pay Ölçümleri (Interest Measures for Association Rules)

Yazan : Şadi Evren ŞEKER Yapay zeka çalışmalarında kullanılan araçlardan birisi de, veri ve veri kümeleri arasındaki birliktelik kurallarının (munasebet kurallarının, association rule) belirlenmesidir. Özellikle büyük veri tabanı (very large database, VLDB) çalışmalarından çıkan, münasebetlerin tespiti problemi için çeşitli yöntemler ortaya atılmıştır. Yöntemlerin detayına geçmeden önce problemi daha iyi tanıyabilmek için bir örnek verelim. Örneğin […]

Devam

Atlamalı Liste (Skip List)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde, özellikle veri yapısı (data structures) konusunda kullanılan bir yöntemdir. Basitçe bir bağlı listeye (linked list) erişimi hızlandırmak amacıyla, listenin üzerinde bir fihrist (index) oluşturmayı hedefler. Örnek olarak kullanacağımız sayılar aşağıdaki şekilde verilmiş olsun : 2,7,15,37,43,98,123,155 Bu sayıları tutan ve hızlı bir şekilde arama yapan veri yapısını geliştirmek istiyoruz. […]

Devam