Veri analistleri ve bilim adamları, veri setindeki varyasyonları görmek ve ayrıca ilgili tarafa neyle çalıştıklarını ve ne tür çıkarımlar yaptıklarını net bir şekilde anlamak için verilerini her zaman görselleştirmelidir. Herhangi bir veri analistinin veri görselleştirme teknikleri hakkında önceden bilgi sahibi olması çok önemlidir.
Şimdi soru, bilgisayar sisteminde veri görselleştirmenin nasıl gerçekleştirileceği ve bu çok verimli bir şekilde ortaya çıkıyor?
Bu sorunun cevabı MS Excel, Tableau, Power BI, programlama dilleri gibi özel veri görselleştirme araçlarını kullanmaktır. Bu araçların en iyisi ve en yaygın kullanılanı Python programlama dilidir. Bu dil, belirli formülleri kullanarak verileri analiz edebilen ve ardından farklı grafik ve glif türlerini çizebilen birçok yerleşik kitaplığa sahiptir.
Böyle bir kütüphane, Python için Seaborn kitaplığı. Bu, Python’un Matplotlib kitaplığı üzerine kurulmuş, daha az zaman harcayarak kolayca çeşitli grafikler oluşturan üst düzey bir API olan çok güçlü bir kitaplıktır. CSV, xlsx veya başka herhangi bir dosya formatında yeni çizilen veri seti bir çeşit kategorik ve sayısal sütunlara sahiptir ve bu sütunların hedef değişkenle anlamsal ilişkisini görebilmek için iyi görselleştirilmesi gerekir.
Bu nedenle, Seaborn hem kategorik hem de sayısal sütunları görselleştirmeye yardımcı olur ve Seaborn kütüphanesi kullanılarak görselleştirilebilecek farklı grafik türleri aşağıda verilmiştir:
Kategorik sütunları görselleştirin
Seaborn’da kategorik özellikleri görselleştirmek için bir hüküm vardır ve çizilebilecek farklı kategorik çizim türleri şunlardır:
Arsa sayısı
Bu tür bir grafik, sütundaki meta veri sayısını vermemize yardımcı olduğu için tek bir kategorik sütunla yapılabilir. Seaborn kullanarak sayım grafiği işlevini çağırmanın yolu aşağıda verilmiştir:
Bar grafiği
Bu tür çizim, Sayım grafiğine çok benzer, tek fark, kategorik özellikleri bazı sayısal özelliklere göre görselleştiren, belirtmek için hem x hem de y koordinatlarını kabul etmesidir. Bar grafiği çağırmanın yolu aşağıda verilmiştir:
Kutu grafiği
Bu çizim, kullanıcıların sayısal niteliklerle ilgili belirli kategorik niteliklerin yüzdelik değerini elde etmelerine yardımcı olur. Yüzdelik dilim (veya yüzdelik dilim), bir gözlem grubundaki belirli bir gözlem yüzdesinin altına düştüğü değeri gösteren, istatistiklerde kullanılan bir ölçüdür. Örneğin, 20. yüzdelik, altındaki gözlemlerin %20’sinin bulunabileceği değerdir (veya puandır). Boxplot’u Seaborn ile çağırmanın yolu aşağıda gösterilmiştir:
keman arsa
Bu, kategorik özellikler ile sayısal özellikler arasındaki çekirdek yoğunluğu tahminine ve kutu grafiği temsiline dayalı olarak görselleştirmenin sağlandığı özel bir kutu grafiği durumudur. Bir keman planını çizmenin yolu aşağıda gösterilmiştir:
Sayısal sütunları görselleştirin
Sayısal sütunları görselleştirmek için, Seaborn farklı türde grafik temsiller sağlar ve bunlardan bazıları şunlardır:
korelasyon
Korelasyon temel olarak her bir özelliğin birbiriyle olan ilişkisini anlatır. Bir korelasyon haritası, iki ayrı boyut veya olay türü arasındaki bir 2B korelasyon matrisini temsil etmek için tek renkli bir ölçekte renkli hücreler kullanır. Özellik seçiminde hayati bir rol oynar. Korelasyon, yalnızca veri kümemiz tamsayı veya kayan nokta içeriyorsa ve kategorik nitelikler (dizeler) içermiyorsa bulunabilir. Seaborn kullanarak korelasyon çizmenin yolu aşağıda gösterilmiştir:
Ortak arsa
Bir sayısal özelliğin diğerleriyle dalgalanmasını gösteren özel bir grafik türüdür. Birçok farklı türde görüşe sahiptir ve aynısını Seaborn ile çizmek için buraya bakın:
Çift arsa
Çift grafik, aynı veri satırındaki bir değişkenin başka bir değişkenin değeriyle karşılaştırıldığı dağılım grafiği olarak da bilinir. Seaborn kullanarak Pair Plot’u çizmenin yolu aşağıda gösterilmiştir:
Dist arsa
Dist plot, sütun işlevinin dağılımlarını kontrol etmemize yardımcı olur. Çekirdek yoğunluğu tahmini olarak tanımlanan KDE grafiği, sürekli bir değişkenin olasılık yoğunluğunu görselleştirmek için kullanılır. Sürekli bir değişkende farklı değerlerdeki olasılık yoğunluğunu temsil eder. Birden fazla örnek için tek bir grafik de çizebiliriz, bu da daha verimli veri görselleştirmeye yardımcı olur. Aynı şeyi çizmenin yolu aşağıda verilmiştir:
Çözüm
Seaborn’un yardımıyla veri analistleri, veri kümelerini hem kategorik hem de sayısal nitelikler için görselleştirmeyi çok kolay buluyor. Bu harika Python kitaplığıyla çalışmak için bu fırsatı yakalayın ve bundan sonra kuruluşunuzda saygı ve ün kazanmak için güzel grafikler oluşturmaya başlayın.
Daha fazla oku:
- Veri Analizi Nedir? Hayatı kolaylaştırmak için farklı veri analizi yolları
- Navicat Premium’un veri görselleştirme aracı incelemesi 15- Grafikler ve raporlar oluşturun
- Python’da veri analizi ve makine öğrenimi gerçekleştirmek için gereken çeşitli araçlar