‘Data Mart’lara Hayır!


Yıllar önce, iş zekası sistemlerinin temel bileşenleri konuşulurken data warehouse – veri ambarı ve data martlardan – veri marketleri bahsedilirdi. Hatta veri ambarlarını veri marketlerinin bir arada bulunduğu yer gibi tarif etme yönelimi bile vardı.

Bu yaklaşıma hayır diyoruz. Hayır dememizin sebebini veri ambarı konusunun duayenlerinden Kimball, Margy Gross’la birlikte yazdığı kitapta şöyle açıklıyor:

“It is important to remember that we’re not referring to an organizational business department or function when we talk about business processes. For example, we’d build a single dimensional model to handle orders data rather than building separate models for the sales and marketing departments, which both want to access orders data. By focusing on business
processes, rather than on business departments, we can deliver consistent
information more economically throughout the organization. If we establish departmentally bound dimensional models, we’ll inevitably duplicate data with different labels and terminology. Multiple data flows into separate dimensional models will make us vulnerable to data inconsistencies.
The best way to ensure consistency is to publish the data once. A single publishing run also reduces the extract-transformation-load (ETL) development effort, as well as the ongoing data management and disk storage burden.”

Çevirecek olursak:
“İş süreçlerinden bahsederken, kastımızın organizasyonel bir iş departmanı ya da fonksiyonu olmadığını hatırlamak önemli. Mesela her ikisi de sipariş verilerine ulaşmak isteyen satış ve pazarlama departmanları için ayrı birer model geliştirmektense, tek bir boyut modelinde sipariş verilerini ele almayı tercih ederiz. Departmanlar yerine süreçlere odaklanarak organizasyon çapında tutarlı bilgiyi daha ekonomik olarak sunabiliriz. Departmanlarla sınırlı boyutlu modeller kurarsak, kaçınılmaz olarak farklı etiketler ve terminolojilerle aynı veriyi çoklamış oluruz. Farklı boyutlu modellere çoklu veri aktarımları veri tutarsızlıklarına hedef haline gelmemize sebep olur.
Tutarlılığı sağlamanın en iyi yolu veriyi bir kez yayımlamaktır. Tek bir yayımlama, ETL geliştirme çabasını azaltmanın yanısıra süregelecek veri yönetimi ve disk alanı yükünü de hafifletir.”

Data Mart’ları, veri marketlerini unutun. Hedefimiz, şirket çapında geçerli tek bir veri ambarı yapısı kurmak.

Bu yazı Genel içinde yayınlandı ve olarak etiketlendi. Kalıcı bağlantıyı yer imlerinize ekleyin.

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Google fotoğrafı

Google hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Connecting to %s