Veri Kalitesi Doğrulama
Veri Kalitesi Doğrulama
Bilinen Şablonda tanımlanan uzmanlara Veri Kalitesi Doğrulama Şablonu sağlanır. Bu şablonu tamamlamak ve size geri vermek onların sorumluluğundadır. Bunu yaptıklarında, her veri öğesinin kalite seviyesiyle ilgili belirli bir durumu olacaktır:
■■ Veriler meta verilerle eşleşir ve bu nedenle veri kalitesi sorunu yoktur.
■■ Veriler, meta verilerle eşleşmiyor ve veriler yanlış.
■■ Veriler, meta verilerle eşleşmiyor ve meta veriler yanlış.
■■ Veriler meta verilerle eşleşmiyor ve hem veriler hem de meta veriler yanlış.
■■ Daha fazla örnek veri almamız gerekecek çünkü bir sorun olup olmadığından emin değilim.
Meta veriler ve veri sütunları, Veri Kalitesi Doğrulaması bölümünde zaten açıklanmıştır. Doğrulama sütunları Y, N veya soru işareti (?) ile doldurulabilir. Y, “Evet, meta veriler verilerle doğru bir şekilde eşleşiyor ve bu nedenle, veri örneklemesine dayanarak, bir veri kalitesi sorunu görmüyorum” anlamına gelir.
N, “Hayır, burada bir veri kalitesi sorunu var” anlamına gelir. Sembol ? “Bir sorun olup olmadığından emin değilim; Bir karara varmadan önce biraz daha bilgiye ihtiyacım olacak.” Yorumlar sütunu, ele alınması gereken notları ve soruları içerir.
Örneğin, herhangi bir sütunda N varsa, Uzmanlar bir sorunun neden var olduğunu Yorumlar’ın altına koyabilir. varsa ? herhangi bir sütunda sembolü varsa, uzman gereken ek bilgileri Yorumlar altında listeleyebilir. Doğrulama sütunlarının her birini açıklayalım:
Anlam. Ad ve tanım, bize verilen örnek verilerle eşleşiyor mu? Sahip olduğumuz 10 ila 25 satıra göre tutarlılığımız var gibi görünüyor mu? Bu, uzmanın hata yapma olasılığının olduğu doğrulamalardan biridir, çünkü sadece bir avuç farklı değere bakıyoruz.
Hükümsüz. Boş sütun, verilerde gördüğümüzle eşleşiyor mu? Burası, boş olmayan olarak tanımlanmış, boş değerlere sahip olabilecek veri öğelerine ve tamamen boş veri öğelerine sahip olacağımız yerdir.
Uzunluk. Karakter veya sayısal veri öğelerinin uzunluğu, örnek verilerde gördüğümüzle eşleşiyor mu? Ayrılan uzunluk ve biçim ile gerçekte gördüklerimiz arasındaki büyük tutarsızlıkları burada tespit edebiliriz. Yalnızca en büyük uzunluğa bakıyoruz ve bu nedenle bu kontrolde de hata payı var.
Bakmak. Bu veri öğesinin tüm durumlarını mevcut verilerle doğru bir şekilde eşleştiriyor muyuz? Örneğin, sipariş bilgilerinde, ürün tanımlayıcı değerleri mevcut ürün tablomuzdaki karşılık gelen ürünlerle eşleşiyor mu? Bu kontrolün, veri öğelerinin çok küçük bir azınlığı için yapıldığını unutmayın, çünkü genellikle yalnızca birkaç arama verisi öğesi vardır.
Yorumlar. Bu bulgularla ilgili herhangi bir not veya soru var mı? Bunlar, daha fazla bilgi taleplerini, uzmanın neye baktığını açıklığa kavuşturmak için soruları veya bulunan sorunlar hakkında daha fazla açıklamayı içerebilir.
Veri kalitesinin özellikleri
Veri kalitesi modeli
AHIMA veri kalitesini belirleyen özellikler
Veri kalitesini belirleyen özellikler
AHIMA veri Kalitesi Modeli
Ahıma veri kalitesi nedir
AHIMA Veri Kalitesi modeline göre
Veri Nedir
Uygulamada Veri Kalitesi Doğrulama Şablonu
Veri Kalitesi Doğrulama Şablonunu kullanmanın ayrıntılı bir örneğini inceleyelim. Bu şablonu tamamlamak için attığınız adımları tartışacağız ve ardından gerçek bir örnek üzerinden gideceğiz. Ayrıntılı örnekte, çok büyük bir e-tabloyu tekrarlamak yerine, yalnızca Öğe konu alanına odaklanacağız.
İşte adımlar:
1. Veri Kalitesi Yakalama Şablonunu tamamlayın. Bu bölümde daha önce tartışılan adımlara bakın.
2. Bu şablonu doğrulamak için uzmanı belirleyin. Bilinen Şablona bakın. Genellikle konu alanına göre doğrulama atayabilirsiniz.
3. Uzmanın bulgularını gözden geçirin. Uzmanın gündeme getirmiş olabileceği veri kalitesi sorunlarını burada ele alacağız. Uzman ayrıca bu sorunları çözmemize yardımcı olacak bir konumda olmalıdır. Örneğin, boş tanımlı olmayan bir veri öğesinde boş değerler görüyorsak hangisi doğru? Veri öğesini null olarak değiştirmeli miyiz yoksa değerler eksik mi?
4. Gerekli değişiklikleri ve önerileri yapın. Burası, uzmanın tavsiyelerine dayalı olarak herhangi bir güncelleme yaptığımız yerdir.
Bu nokta, şu sırayla uygulanması gereken bu dört mantıksal veri analizi aracına odaklanmaktadır.
Veri Elemanı Aile Ağacı. Uygulama için veri öğelerinin tam listesini ve her biri için kaynakları ve dönüşümleri, veri öğesi meta verilerinin birkaç başka önemli parçasıyla birlikte içerir.
Veri Öğesi Matrisi. Bir elektronik tablo formatı kullanarak her bir ölçüm veya olgu için raporlama düzeylerini yakalar. Bu, raporlama gerekliliklerini doğrulamak için okunması çok kolay bir belge sunar.
Veri Kalitesi Yakalama Şablonu. Her veri öğesi için meta veriler ile gerçek verilerin bir kısmı arasındaki karşılaştırmayı gösterir. Bu araç, format, null ve açıklama dahil olmak üzere meta verilerdeki en önemli bilgileri doğrulamak için kullanılır.
Veri Kalitesi Doğrulama Şablonu. Her bir veri öğesi için meta verilerin ve gerçek verilerin bir kısmının ne kadar iyi karşılaştırıldığını belgeler. Doğrudan Veri Kalitesi Yakalama Şablonuna dayanan bu araç, her bir veri öğesindeki verilerin gerçekte ne kadar iyi veya kötü olduğuna ilişkin bir uzmanın görüşünü içerir.
Bu dört aracı uyguladıktan sonra, uygulamamızda ihtiyaç duyduğumuz veri öğelerini ve her birinin genel veri kalitesini çok iyi anlamış olacağız.
Gereksinimlerin Modellenmesi ve Bazı Öneriler
Hiç bir proje için mantıksal veri modellemeye başladınız ve modelde yakaladığınız her veri öğesini tam olarak anladığınıza tamamen inandınız mı? “Normalizasyon Yürüyüşü ve Denormalizasyon Hayatta Kalma Kılavuzu” adlı bu metinde yer alan araçları uyguladıktan ve özelleştirdikten sonra bu güveni hissedeceksiniz.
1. Bölümde uygulama geliştirmenin temelini oluşturduk,
2. Bölümde üst düzey gereksinimleri ve veri öğelerini yakaladık ve
3. Bölümde veri gereksinimlerini modellemeye hazırız.
İdeal veri modelini düşündüğümüzde, temel veritabanında performans ve depolama faktörlerinden ödün vermeden iş gereksinimlerini esnek bir şekilde doğru bir şekilde yakalayan bir modeldir.
Metnin bu kısmı, veri modellerimizin bu kriterleri karşılamasını sağlamaya yardımcı olan araçlara odaklanmaktadır. 8’den 10’a kadar olan bölümler, veritabanı performansını ve depolama sonuçlarını göz önünde bulundurarak veri gereksinimlerinin esnek bir şekilde modellenmesi için bir dizi araç sunar. Bonus olarak, kitabı yıllar boyunca öğrendiğim ve bir veri modelleyici olarak sürekli takip ettiğim bazı tavsiyelerle sonlandıran da dahil edilmiştir.
AHIMA veri kalitesi modeli AHIMA Veri Kalitesi modeline göre AHIMA veri kalitesini belirleyen özellikler Ahıma veri kalitesi nedir Veri kalitesi modeli Veri kalitesini belirleyen özellikler Veri kalitesinin özellikleri Veri Nedir