Veri Unsurlarını Belirlemek
Veri Unsurlarını Belirlemek
Hepimiz bir anda yapbozlar yaptık. Yapboz kutusunu ilk açıp parçaları çalışma alanımıza döktüğümüzde, önümüze çıkanlar karşısında şaşkına dönebiliriz. Büyük bir yığının içinde yüzlerce, hatta binlerce minik parçamız var. Bu büyük yığın bir kaos halindedir.
İncelemek için her yapboz parçasını elimize aldığımızda, onu benzersiz kılan özellikleri anlıyoruz. Ancak bu noktada eksik olduğumuz şey, bu yapboz parçalarının birbiriyle nasıl birleştiğidir. Parçaları bir araya getirmeye yönelik bu yoğun ve zorlu sürece başlıyoruz. Uzun uğraşlar sonucunda yapbozun her bir parçasını yerli yerine oturtarak şaheserimizi tamamlıyoruz.
Kaos terimi, veri öğeleri de dahil olmak üzere herhangi bir düzenlenmemiş çok sayıda küçük şey yığınına uygulanabilir. Bahsedilen tüm veri analiz araçlarını bitirdiğimiz için, her bir veri unsuru hakkında güçlü bir anlayışa sahibiz.
Örneğin, veri öğelerinin tam listesine zaten sahibiz ve bunların tanımlarını ve dönüşümlerini Veri Öğesi Aile Ağacından biliyoruz. Bu noktada eksik olan, tüm bu veri öğelerinin nasıl bir araya geldiğidir. Veri öğeleri birbiriyle nasıl ilişkilidir? Yapbozun her parçasını anlıyoruz ama parçalar arasındaki bağlantıları henüz anlamıyoruz.
Örneğin, müşteri adresi ve telefon numarası veri öğeleri birbiriyle nasıl ilişkilidir? Yapbozumuzdaki her parça için uygun yeri belirlememiz gerektiği gibi, tasarımımız içindeki her veri öğesi için uygun yeri belirlememiz gerekir.
Veri unsurlarımız arasındaki bağlantıları veya ilişkileri henüz anlamadığımız bu kaotik durum, Normalleşme Yürüyüşü için başlangıç noktamızdır. Kaotik duruma geçmek için tek ihtiyacımız olan, veri öğeleri listemiz ve bunların meta verileriyle birlikte tamamlanmış Veri Öğesi Aile Ağacı var olabilir.
İlk Normal Form
İlk normal form, fazlalıkları ortadan kaldırmaya ve tasarımımızın esnekliğini artırmaya başladığımız ilk seviyedir. Kaostan 1NF’ye geçmek için gerekli üç aktivite olduğuna inanıyorum. Bu listede üçüncü etkinlik olarak görünen fazlalığı kaldırma adımı olan 1NF’nin standart tanımının biraz ötesine geçiyorlar.
Bu üç aktiviteyi dahil ediyoruz çünkü normalleşme sürecine başlar başlamaz hepsinin olması gerektiğini düşünüyoruz:
Önceden normalleştirilmiş bir modele geçiş yapın. Tüm Normalleşme Yürüyüşü boyunca yapacağımız en önemli değişiklik bu. Elektronik tablodan modele geçiyoruz.
Veri Öğesi Aile Ağacındaki izole edilmiş veri öğelerinin her biri, daha önce bahsedilen bağımlılık ve katılım yönergelerini izleyen varlıklara atanır. Bu ilk modeli elde etmek için kullandığım en iyi yöntem, Aile Ağacındaki her konu alanı için bir varlık yaratmaktır. Başlangıç noktam olarak “Konu Alanı Modellemesi” olarak ele alınan Uygulama Temiz Sayfa konu alanı modelini de kullanabiliriz.
Bu konu alanı modeline sahip olduğumda, elektronik tablo satırlarında her konu alanı altında listelenen veri öğelerinin her birini kopyalayıp modeldeki ilgili kutuya yapıştırırım. Ardından, tüm veri öğeleri modeldeki konu alanı kutularından birinde göründükten sonra, bir birincil birincil anahtar belirleriz.
Veri toplama teknikleri
Nicel veri toplama teknikleri
Veri seti örnekleri
Nitel veri toplama teknikleri
Veri toplama Araçları
Nitel veri toplama araçları
Nicel veri toplama araçları
Birincil veri toplama yöntemleri
Bu, bu konu alanındaki bir satırı benzersiz şekilde tanımlayacağına inandığım bir veya daha fazla veri öğesidir. Örneğin, Müşteri benim konu alanlarımdan biri olsaydı, ilk modelimde Müşteri varlığı içindeki 20 müşteri veri öğesinin tamamına sahip olurdum. Daha sonra, bir müşterinin konu alanı konseptini benzersiz bir şekilde tanımlayan bir veya daha fazla müşteri verisi öğesinin her birini incelerdim.
Bu daha sonra bir müşteri için ilk birincil anahtarım olur. Böyle bir model için önceden normalleştirilmiş terimini seviyorum, çünkü bu modele henüz herhangi bir normalleştirme kuralı uygulanmadı ve tüm bu kuralları uygulamak için başlangıç noktası vardır.
Çoktan çoğa ilişkileri çözün. Modelimizde çoktan çoğa ilişkilerin olduğu her yerde, bunları ilişkisel varlıklarla değiştirmemiz gerekir. İlişkili varlıklar, en azından çoktan çoğa ilişkiyi oluşturan iki varlıktan veri öğesi yabancı anahtarlarını içeren varlıklardır.
Örneğin, bir Müşterinin birçok hesabı olabilir ve bir Hesabın sahibi birçok müşteri olabilirse, çoktan çoğa bir ilişkimiz olur. Müşteri ve Hesap arasına Hesap Sahipliği gibi bir ilişkisel varlık eklememiz gerekir.
Artıklığı kaldırmaya başlayın. Normalleşmenin bu erken noktasında uygulamamız gereken iki basit kural var:
1. Yinelenen veri öğelerini yeni bir varlığa taşıyın. Yinelenen bir veri öğesi, aynı varlıkta en az iki kez görünen öğedir. Çoğu zaman bu veri öğeleri, adda bir sıra numarası aranarak kolayca tanımlanabilir. Örneğin, Müşteri varlığımızda bu veri öğelerine sahip olduğumuzu varsayalım.
Bu yinelenen veri öğelerini kaldırmak için, Müşteri varlığıyla çoktan çoğa ilişkisi olan Adres adlı yeni bir varlık oluşturmamız gerekir. Bu yeni varlıkta, müşteri tanımlayıcı ve bir adres sıra numarasından oluşan bileşik bir birincil anahtar ile bir adres satırı veri öğesi olacaktır.
Bu sıra numarası, bu satırın adresin birinci satırı mı yoksa dördüncü satırı mı olduğunu gösterecektir. Ayrıca, yeni bir varlık oluştururken esnekliğimizi artırdığımıza da dikkat edin. Sadece üç satırlık adres bilgisi ile sınırlı değiliz, bir veya daha fazla adres bilgisi satırı sunabiliriz.
Birincil anahtarın orijinal varlığın anahtarı olduğu yeni bir varlık oluştururken, fazlalığı zorunlu olarak azaltmıyoruz; ancak esnekliği artırıyoruz. Sütunlar yerine yeni kayıtlar getiriyoruz, yine de aynı miktarda fazlalık var.
Örneğin, 10 Ana Cadde’de oturan her Müşteri için 10 Ana Cadde tekrarlanacaktır çünkü müşteri tanımlayıcı adres tablosu varlığının bir parçasıdır. Bu nedenle, bu kısa örnekte, yinelenen veri öğelerinin kaldırılması, aynı miktarda artıklıkla daha fazla esnekliğe yol açmıştır.
2. Çok değerli veri öğelerini ayırın. Çok değerli, aynı veri öğesi içinde en az iki ayrı iş konseptini sakladığımız anlamına gelir. Örneğin, bir ad veri öğesi, iki ayrı iş konsepti olarak kabul edilebilecek hem bir ad hem de soyadı içerebilir.
Başka bir örnek, hem brüt satış tutarını hem de ağırlığı içeren Brüt Satışlar olabilir. Zorlayıcı sınıf sözcükleri, çok değerli veri öğelerini minimumda tutar. Örneğin, Brüt Satışların ayrı bir veri öğesi olmasına izin vermez. Her sınıf sözcüğü için ayrı bir veri öğesi gerektirecektir ve bu nedenle, Brüt Satış Tutarı ve Brüt Satış Ağırlığımız olacaktır.
Birincil veri toplama Yöntemleri Nicel veri toplama araçları Nicel veri toplama teknikleri Nitel veri toplama araçları Nitel veri toplama Teknikleri Veri seti örnekleri Veri toplama araçları Veri toplama Teknikleri