Veri Kalitesi Yakalama Şablonu
Veri Kalitesi Yakalama Şablonu
Veri Öğesi Aile Ağacını ve Veri Öğesi Tahıl Matrisini tamamladıktan sonra, uygulamanın veri öğelerinin ve raporlama gerekliliklerinin çok tutarlı ve doğru bir temsiline sahip olduğunuza inanıyorsunuz. Veri öğesi listesi eksiksiz görünür ve her veri öğesinin sağlam bir tanımı ve üzerinde anlaşmaya varılan bir kaynağı vardır.
Gerçek olan bu veri öğeleri için raporlama düzeylerini de belirledik. Ancak, bu bilgileri bir meta veri düzeyinde topladık ve muhtemelen henüz herhangi bir gerçek veri görmedik. Verilerin meta verilerle eşleştiğinden nasıl emin olabiliriz? Örneğin, bir veri öğesi boş değil olarak tanımlanırsa, boş olabilecek herhangi bir gerçek değer var mı? Bu sorular sizi rahatsız etmeye başlıyor, çünkü gerçek verilerin her zaman birkaç sürprizi ortaya çıkarabileceğini biliyorsunuz.
Veri kontrolü gerektiren kategorileri belirlemeniz ve veri kontrolü sonuçlarını kaydetmeniz gerekir. Veri Kalitesi Yakalama Şablonuna ihtiyacınız var.
Birçok kişi ya veri kalitesi kontrolünden kaçınır ya da bunu geliştirme sürecinde çok geç yapar. Uygulama geliştirmeye önemli ölçüde girene kadar beklerler; daha sonra tablolarda bulunan veriler modeldeki meta verilerle eşleşmediğinde büyük sorunlar gelişir. Verileri meta verilerle tutarlı hale getirmek için bu gerçekleştiğinde bir şeylerin değişmesi gerekir.
En küçük değişiklik, veri modelindeki bir tanımın güncellenmesidir. Nadiren durum böyledir. Daha sıklıkla, veri elemanı formatı, geçersiz kılınabilirlik, ad vb. için değişiklikler gerekir; bu değişiklikler, veritabanı tablolarının yeniden yapılandırılmasını ve muhtemelen bazı kodların yeniden yazılmasını gerektirir. Bu, veri kalitesi kontrolüne çok reaktif bir yaklaşımdır.
Proaktif olan daha iyi yaklaşım, geliştirmenin mantıksal veri analizi aşamasında verileri incelemektir. Bunu yapmak için uygun yer, uygulamada gerekli olan veri öğelerini belirledikten hemen sonra, yani Veri Öğesi Aile Ağacından sonradır.
Bu nedenle, bir veri öğesi tanımlanıp tanımlanır tanımlanmaz, onun olduğuna inandığımız şey olduğundan emin olmak için verilere bakabiliriz. Bu araçları doğrusal bir şekilde tamamlıyor olsaydınız, yani bir öncekini bitirmeden bir araca başlamazsanız, muhtemelen verilere Veri Öğesi Aile Ağacı yerine Veri Öğesi Tane Matrisi tamamlandıktan sonra bakmaya başlarsınız.
Ancak, bu veri öğesi analiz araçlarını paralel olarak tamamlayacak kaynaklara sahipseniz, Tahıl Matrisi ve Veri Kalitesi Yakalama Şablonunu aynı anda yapabilirsiniz. Zorluk, uygulamanın geliştirilmesinde o kadar erken olmasıdır ki, çoğu durumda tablolar ve arabirim dosyaları henüz oluşturulmadığından verilere erişmek zor olabilir.
Verilere yaşam döngüsünün bu kadar erken bir döneminde ulaşmak için yaratıcı yollar bulmanız gerekebilir. Ancak, verilere ne kadar erken erişebilirseniz, meta verilerinizin ve verilerinizin senkronize olmasını o kadar hızlı sağlayabilirsiniz. Bu erken noktada verileri elde etmek için harcanan çabaya değecektir.
Excel resimli tablo
PDF ten Excel’e veri Alma
Excel tablo çekme
Fotoğraftaki yazıları Excel’e Aktarma
Metni Excel’e Çevirme
Tarayıp Excel’e Aktarma
Excel’den fotoğraf alma
pdf den excel’e tablo aktarma
Basitçe tanımlanan veri kalitesi, veri değerlerinin iki ana soruya dayanan beklentilerimizle eşleşmesidir:
1. Veriler, güvenilir bir kaynaktan alınan verilerle eşleşiyor mu? Bu, Brüt Satış Tutarında 5,00 ABD Doları değerine bakıyorsam, Brüt Satış Tutarı için güvenilir bir kaynak olduğuna inandığım uygulamada 5,00 ABD Doları görmeyi beklediğim anlamına gelir. Güvenilir bir kaynak, verilerin başlangıçta girildiği stratejik uygulama olmak zorunda değildir. Kullanıcının güvendiği herhangi bir uygulama olabilir.
Örneğin, yakın zamanda, kullanıcıların çok güvendiği başka bir raporlama uygulamasına karşı değerleri doğruladığımız bir data mart üzerinde çalıştım. Bununla birlikte, verilerin yüklenmesindeki zamanlamanın ve miktar yuvarlama sorunlarının sonuçlarda küçük farklılıklara yol açabileceği unutulmamalıdır.
Örneğin Pazartesi günkü değerlerle Salı günkü değerleri karşılaştırırsam farklı sonuçlar elde edebilirim. Ayrıca, en yakın dolara yuvarlamak yerine iki ondalık haneye yuvarlarsam farklı sonuçlar elde edebiliriz.
2. Veriler meta verilerle eşleşiyor mu? Bu, Müşteri Ayakkabı Bedeni veri öğesinde 11 sayısını bir değer olarak gördüğümde, bu değerin müşterinin ayakkabı numarası olmasını beklediğim anlamına gelir. Bu değerin müşterinin sahip olduğu çocuk sayısı olmasını beklemem. Verileri meta verilerle eşleştirirken, yalnızca tanıma değil, diğer önemli karşılaştırmalara da bakarız.
Bunlar, ad, biçim, geçersiz kılınabilirlik vb., yani tutarsızlık bulma olasılığının bulunduğu her türlü meta veriyi içerir. Buradaki verilerin doğru olup olmadığını test etmediğimizi unutmayın. Veri doğruluğu, verilerimizi güvenilir bir uygulama kaynağıyla karşılaştırdığımız ilk soruda ele alınmaktadır. Bu noktaya kadar yapılan tüm meta veri analizlerine dayanarak, verilerin beklediğimiz gibi görünüp görünmediğini görmek için burada test ediyoruz.
Veri Kalitesi Yakalama Şablonu, bu iki sorunun ikincisi ile ilgilenir. Verileri meta verilerle karşılaştırmaya odaklanır. Bu şablon, verilere gerçekten baktığımız ilk aracımızdır. Bu noktaya kadar, analizimiz meta verileri tanımlamaya ve bunlar üzerinde uzlaşmaya odaklandı. Veri Kalitesi Yakalama Şablonu, bu noktaya kadar tüm meta verileri alır ve bunları dört temel kategoride gerçek verilere karşı düzenler:
İsim ve Tanım. Ad ve tanım verileri ile meta veri karşılaştırmaları en fazla çabayı ve analizi gerektirir. Bunun nedeni, her veri öğesi adının ve tanımının, bu veri öğesinin değerlerinde görmeyi umduğumuzla eşleştiğinden emin olmak için kontrol etmemizdir.
Örneğin, Müşteri Yaşı veri öğesinin müşterinin yaşı hakkında harika bir tanımı varsa ancak gerçekte Müşterinin Ayakkabı Numarasını içeriyorsa, veriler ile meta veriler arasında, yani gerçek değerler ile söylediklerimiz arasında bir çelişki vardır. gerçek değerler anlamına gelir.
Bu kategori için veriler ve meta veriler arasında sağlam bir karşılaştırma yapmak için, kontrol etmek üzere oldukça iyi boyutta bir veri değerleri örneğine ihtiyacımız var. Bir veya iki değer genellikle yeterince iyi değildir. 10 ila 25 arası değerlerin genellikle kabul edilebilir bir miktar olduğunu buldum.
Biçim. Bu şablon, Veri Öğesi Aile Ağacında tanımlanan biçimi gerçek verilerdeki biçimle karşılaştırır. Bir Eyalet Kodu iki karakter uzunluğundaysa, gerçek veriler bu değerlerin her biri için iki karakter içermelidir. Bir açıklama 1.000 karakter uzunluğundaysa, 1.000 karaktere oldukça yakın bazı değerler görmeyi beklemeliyiz.
Bu 1.000 karakter uzunluğundaki veri öğesinin maksimum uzunluğu sadece 50 karakter ise, bu meta veri ile eşleşmeyen veriye bir örnek olacaktır. Biçim, bir veri öğesinin hem uzunluğunu hem de türünü içerir; tür, karakter, sayısal, tarih vb. içerir. Bir Eyalet Kodunun değerleri sayısalsa ancak biçimimiz iki karakterden oluşuyorsa, veri kalitesi sorunumuz olabilir.
Bu karşılaştırma aynı zamanda aynı veri öğesinde birden fazla değer tespit etmemize yardımcı olur. Bu 1.000 karakter uzunluğundaki açıklamada metin ve ardından birkaç boşluk ve ardından daha fazla metin görüyorsak, bu metin blokları farklı iş bilgileri olabilir; bu nedenle, aynı veri öğesinde birden çok değer bulmuş olabiliriz.
Excel resimli tablo Excel tablo çekme Excel'den fotoğraf alma Fotoğraftaki yazıları Excel'e Aktarm Metni Excel'e Çevirme pdf den excel'e tablo aktarma PDF ten Excel'e veri Alma Tarayıp Excel'e Aktarma