Kümeleme veri dizisinde yer alan benzer nesnelerin aynı gruplarda yer alacak biçimde ayrıştırılmasıdır. Bölümleyici küme analizi algoritmalarından k-means, kümeleme konusunda popüler olmasına rağmen, yetersiz hesaplama yapması, küme sayısının kullanıcı tarafından tanımlanması ve aramada yerel minimuma eğilimli olması açısından üç temel eksikliğe sahiptir. X-means algoritması, k-means ın her çalışmasından sonra, mevcut merkezlerin hangi alt kümelerinin, verilere daha iyi uyacak şekilde bölünmesi gerektiği konusunda yerel kararlar verebilen, k sayısını belirtilen aralıkta bulabilen alternatif bir algoritmadır. X-means ile Bayes Bilgilendirme Ölçütünü (BIC) optimize ederek kümelenme yerlerinin ve kümelenmelerin sayısını verimli bir şekilde araştıran yeni bir algoritma önerilmiştir. K-means ile yapılan çalışma Silhoutte katsayısı, x-means ile yapılan da BIC ile test edilerek x-means kümeleme algoritmasının k-means kümeleme algoritmasından daha efektif sonuçlar ürettiği görülmektedir. Bir kez çalıştırılarak kullanılan k-means algoritmsı geliştirilerek, x-means ile model seçimi için yeni bir k-means tabanlı algoritma sunulmaktadır. İstatistiksel temelli kriterler kullanan bu model üzerinde yapılan uygulamalar k-means’tan hızlı ve daha iyi performanslı olduğunu göstermektedir. X-means; küme sayısını kendi belirlemektedir. Verileri analiz ederek min/max küme sayısını belirleyebilir. Dictance metric ve veri yapısı kendisine özeldir. Nominal veri alamaz. Bu çalışmada WEKA (Waikato Environment for Knowledge Analysis) yardımıyla aynı veri setine k-means ve x-means kümeleme uygulaması yapılmıştır aynı veri setini deneysel olarak 2 den 6 ya kadar kümelere ayırarak gerekli değerleri belirledik. Matlab kullanarak, Silhuette indeksine göre en uygun sonucu 2 kümenin verdiğini gözlemledik. X-means ile aralık değerini 2-6 girerek optimum sonuca 2 küme sayısıyla varıldığını gördük. X-means sınırsız bir Gaussian EM algoritmasında bir model araştırmasını yönlendirmek için BIC'nin uygulanması olarak tanımlanabilir. Çok büyük veri setlerinde çok büyük ölçekli gözlemler kullanarak yapılan çalışmalara yardımcı olacak geniş bir algoritma sınıfı için bir fırsat sunmaktadır.