EJONS INTERNATIONAL JOURNAL ON MATHEMATICS, ENGINEERING & NATURAL SCIENCES ISSN 2602 - 4136

Quick Access


Bu Dergi DOI ve Crosscheck üyesidir


Summary


X-MEANS KÜMELEME ALGORİTMASI WEKA UYGULAMASI

Kümeleme veri dizisinde yer alan benzer nesnelerin aynı gruplarda yer alacak biçimde ayrıştırılmasıdır. Bölümleyici küme analizi algoritmalarından k-means, kümeleme konusunda popüler olmasına rağmen, yetersiz hesaplama yapması, küme sayısının kullanıcı tarafından tanımlanması ve aramada yerel minimuma eğilimli olması açısından üç temel eksikliğe sahiptir. X-means algoritması, k-means ın her çalışmasından sonra, mevcut merkezlerin hangi alt kümelerinin, verilere daha iyi uyacak şekilde bölünmesi gerektiği konusunda yerel kararlar verebilen, k sayısını belirtilen aralıkta bulabilen alternatif bir algoritmadır. X-means ile Bayes Bilgilendirme Ölçütünü (BIC) optimize ederek kümelenme yerlerinin ve kümelenmelerin sayısını verimli bir şekilde araştıran yeni bir algoritma önerilmiştir. K-means ile yapılan çalışma Silhoutte katsayısı, x-means ile yapılan da BIC ile test edilerek x-means kümeleme algoritmasının k-means kümeleme algoritmasından daha efektif sonuçlar ürettiği görülmektedir. Bir kez çalıştırılarak kullanılan k-means algoritmsı geliştirilerek, x-means ile model seçimi için yeni bir k-means tabanlı algoritma sunulmaktadır. İstatistiksel temelli kriterler kullanan bu model üzerinde yapılan uygulamalar k-means’tan hızlı ve daha iyi performanslı olduğunu göstermektedir. X-means; küme sayısını kendi belirlemektedir. Verileri analiz ederek min/max küme sayısını belirleyebilir. Dictance metric ve veri yapısı kendisine özeldir. Nominal veri alamaz. Bu çalışmada WEKA (Waikato Environment for Knowledge Analysis) yardımıyla aynı veri setine k-means ve x-means kümeleme uygulaması yapılmıştır aynı veri setini deneysel olarak 2 den 6 ya kadar kümelere ayırarak gerekli değerleri belirledik. Matlab kullanarak, Silhuette indeksine göre en uygun sonucu 2 kümenin verdiğini gözlemledik. X-means ile aralık değerini 2-6 girerek optimum sonuca 2 küme sayısıyla varıldığını gördük. X-means sınırsız bir Gaussian EM algoritmasında bir model araştırmasını yönlendirmek için BIC'nin uygulanması olarak tanımlanabilir. Çok büyük veri setlerinde çok büyük ölçekli gözlemler kullanarak yapılan çalışmalara yardımcı olacak geniş bir algoritma sınıfı için bir fırsat sunmaktadır.



Keywords
Kümeleme, k-means, x-means

References

Advanced Search


Announcements

    Mart Sayısı

    VERBİS'E KAYIT S�RELERİ HAKKINDA DUYURU | Kırklareli Ticaret ve ...

    Mart ayında yayınlanacak Sayımız için  25 Şubat Tarihine kadar çalişmanızı Yükleyebilirsiniz



Address :Kazakh National Women's Pedagogical University, Almatı, Kazakhistan
Telephone :+7 778 921 0336 - 0 534 349 92 73 Fax :
Email :ejonsjournal@gmail.com

Web Yazılım & Programlama Han Yazılım Bilişim Hizmetleri