Veri madenciliği, bilim mi bilişim mi?


İş zekası çözümleri içinde belki en az anlaşılanı veri madenciliği. Çokça kişinin dilinde olan ama öyle çok fazla da anlaşılmayan bir konu.

Temel zorluklarından birisi, farklı disiplinlerle ilgili yönleri bulunması.

Veri madenciliğini gerçek anlamda yapabilmek için devasa veri havuzlarını değerlendirebilecek işleme ve saklama kapasiteleri gerekiyor. Bu tür kapasiteler yeni yeni yaygınlaşabilecek fiyat seviyelerine inmiş durumda.

Öte yandan çalışacak uygulamaların gerekli yetenekleri kazanması da zamanla mümkün oluyor.

Hem araç gereç hem de teknik donanımın yeni yeni yaygınlaşmaya başlaması yüzünden, veri madenciliğiyle ilgililenme lüksüne yakın zamana kadar çok az kişi sahip oldu.

Ama araç gereç ve imkan bolluğu da veri madenciliği için yeterli değil. İş zekasını kurgulamak zor bir iş olsa da veri madenciliğine göre nispeten daha kolay. Çünkü veri madenciliğinde teknik yeterlilikten başka yaratıcı ve bilimsel disipline sahip zeka da gerekiyor. Devasa veri havuzlarında desenler tespit edebilmek için, kaba güç analizlerine başvurmak akıllıca bir yöntem değil. Bunun yerine, daha küçük analizlerle hipotezler geliştirmek ve bu hipotezleri test etmek gerekiyor.

Yaratıcı veri madenciliğine örnekler açısından Malcolm Gladwell’in ‘Blink’ adlı kitabını okuyabilirsiniz. İşin ilginci, bu kitapta temel yaklaşım, anlık karar verebilme yeteneği üzerine kurgulanmış. Kitapta anlatılan pekçok vaka temelde veri madenciliğinin başarılı örnekleri olarak da okunabilir. Ama bu paralel okuma, yazarın asıl vurgulamak istediği kanal değil. İş zekası konusuna özel ilgim olduğu halde, ben de okurken veri madenciliği örnekleri okuyor olduğumu algılayamadım aslında. Ama kitabı bitirdikten birkaç hafta sonra, arka planda bilinç altım bu ilişkiyi kurdu.

Göğüs ağrılarından şikayetçi bir hastanın, kalp krizi geçiriyor ya da geçirmek üzere olduğunun anlaşılmasına ilişkin geliştirilmiş bir test mekanizmasını anlatıyor bir bölüm. Onlarca yıllık deneyime sahip doktorların birinci elden teşhislerine göre daha başarılı sonuçlar vermesi çok ilginç. Çok az veriyi inceleyen bu test mekanizması, tam da bahsettiğimiz gibi çarpıcı bir zekanın oluşturduğu bir hipotezin uzunca süre denenmesi sonucu ortaya çıkmış. Yani az veri ile önce bir hipotez geliştirilmiş, sonra da bu hipotez daha geniş veri havuzunda uzunca süre çalıştırılarak geçerliliği ispatlanmış.

Bir diğer örnek de, 20 dakikalık sıradan konular üzerinde eşler arasında yapılan konuşmaların analizi ile, evliliklerinin geleceğinin tahmin edilmesine ilişkin. Burada da görece kısacık bir süre değerlendiriliyor ama arkada yıllara dayanan bir veri madenciliği çalışması ve bunun sonucunda oluşturulmuş bir desen analizi var.

Veri madenciliği ile ilgileniyorsanız, bu kitabı okuyun. Ama yazara kaptırmayın kendinizi (çok akıcı bir kitap yazmış), veri madenciliği bakış açısıyla hareket ettiğinizi unutmadan okuyun.

Bu yazı Veri madenciliği içinde yayınlandı ve olarak etiketlendi. Kalıcı bağlantıyı yer imlerinize ekleyin.

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Google fotoğrafı

Google hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Connecting to %s