Çok büyük boyuttaki veri setleri ile çalışanları bekleyen iki tehlike vardır. İstatistiksel hata ve matematiksel hatalar. Çok küçük bir hata, kartopu efekti gibi çok büyük bir soruna sebep olabilir. Kimi zaman bir virgül ile noktanın karıştırılması hatta semantik anlam hataları belki de geri dönülemez boyutta yıkımlara sebep olabilir.
Bunun için veriyi çok iyi okumak ve bu şekilde yaklaşımlar kurarak anlamlı grafiklere dönüşmesi sağlanabilir.
Şekildeki grafik tam 2200 satır ve 9 sütundan oluşamaktadır. Python ortamında hazırlanan ve sırasıyla Pandas, NumPy ve MatplotLib kütüphanelerinden destek alınarak hazırlanmıştır. Veri analizi dünyasını mükemmel üçlüsü dediğimiz Pandas - Numpy - MatPlotLib ile çok anlamlı sayısal ve görsel içerikler oluşturabilirsiniz.
Python platformu ise sizi yüksek hız ve optimizasyon dolu bir ortam sağlayacaktır. Hataların kolayca bulunabildiği ve daha modelin başında iken düzeltilmesi nedeniyle test ortamında size süreci hızlandıracaktır.
KAYNAKÇA:
1- https://www.omersahin.com.tr/python-matplotlib-modulu/
2- https://github.com/omersahintr/BootCampEdu
Hiç yorum yok:
Yorum Gönder