Veri madenciliğinde CRISP-DM yaklaşımı


Daha önceki blog girdilerimden birinde, veri madenciliğinin tüm BI düzleminde akademik çalışmayla en yakından ilgili alan olduğunu söylemiştim. Bu alandaki yaklaşımlardan birinin adımlarını sıraladığımda ne demek istediğimi daha iyi anlayacaksınız.

Yaklaşımın ismi CRISP-DM (CRoss-Industry Standard Process for data mining). Orijinal üyeleri Daimler-Benz, SPSS ve NCR olan bir konsorsiyum tarafından geliştirilmiş.

CRISP-DM yaklaşımındaki veri madenciliği yaşam adımları şunlar:

İşi anlamak – hedefleri ve gereklilikleri geliştir.
Veriyi anlamak – veriyi detaylı olarak incele, saklı desenler hakkında hipotez geliştir.
Veriyi hazırlamak – veri kaynağıyla bağlantı kur ve veri madenciliği modelinde kullanılacak veri kümesini oluştur.
Modelleme – bir ya da daha fazla veri madenciliği modeli seç, parametreleri belirle, dene ve iyileştir.
Deneme – iş hedeflerine göre model ya da modelleri dene, gözden geçir ve gerekiyorsa iyileştirmeleri yap.
Sahaya sürmek – model sonuçlarını analistlere ve son kullanıcılara sun, model sonuçlarını iş süreçlerine yorumlanacak ve uygulanacak şekilde rafine et.

Bu yazı Veri madenciliği içinde yayınlandı ve olarak etiketlendi. Kalıcı bağlantıyı yer imlerinize ekleyin.

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Google fotoğrafı

Google hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Connecting to %s