R Programı ile Coğrafik Veri Görselleştirme (GIS)

GIS in R

Utku Kubilay ÇINAR

 

Coğrafik veri analizleri son yıllarda çalışma sahasının gelişmesi ile beraber, veri analistleri/veri bilimcileri de bu alandaki çalışmalarını arttırmışlardır. Coğrafik veri analizini(ya da GIS), iş hayatımda kullanmasam da ilgimi çeken bir alan olduğu için R programıyla hazırladığım haritaları paylaşmak istedim.

Haritalandırma, R programı sayesinde son derece keyifli hale gelmiştir. Google Earth ya da Google Haritalar üzerinden veri çekip (enlem ve boylam bilgilerini alıp) ilgi çekici haritalar yapabiliyoruz. Çektiğimiz bu koordinat verileri ile araştırmak istediğimiz veriyi haritanın üzerine basıyoruz. R programı bu konuda gelişmiş olup iyi olanaklar araştırmacıya sunmaktadır.

Bu çalışmada sizlerle küçük haritalar yapıp simülasyon verisi üzerinde çalışacağız(veri setlerini ben ürettim). Bu yazının amacı R programı ile eğlenmek ve kütüphane tanıtımı yapmaktır.

Veri seti https://mockaroo.com/ adresinden üretilmiştir Bu siteyi kullanmanızı öneririm. Yüze yakın veri türünde veri seti üretebilmenize olanak sağlıyor. Analizlerinizde ya da yazmak istediğiniz tezlere/makalelere simülasyon verisi üretebilirsiniz.

Belirtmek isterim ki haritalandırma-harita görselliği gibi konularda çalışmalar yapacaksanız eğer, veri setlerinizin özel olarak hazırlanmış olması gerekmektedir. Bu çalışmada, veriler yapay olarak üretildiği için harita görselliği konusunda R programının bize sağladığı faydaları tam olarak gösteremedim. İnternetten hazır veriler kullanılarak çok daha güzel, 3 boyutlu, etkileşimli ve estetik grafikler oluşturabilirsiniz. Bu çalışmada hazır veri seti kullanılmamıştır. Hadi biraz eğlenelim.

Yapay olarak ürettiğimiz veri setini programa yükleyelim.

Veri setimiz;

Veri seti incelendiğinde parametrelerimiz(değişkenler); gelirler, firmaların bulunduğu sektörler ve firmaların bulunduğu konumun enlem ve boylam bilgileridir. Veri setinden de görüldüğü üzere bir kısım veri manipülasyonu gerekmektedir.

Veri Manipülasyonu (Tidy Data)

Uç değerin olmadığı kutu grafiği yardımı ile görülmüştür. Gelirlerin sektörlere göre nasıl farklılaştığını inceleyelim.

Gelirlerin kısmen benzer dağıldığı görülmüştür. İstatistiksel olarak anlamlılığını incelemeden önce veri setinin normal dağıldığına bakmamız gerekmektedir.

Gelirin normalliğinin sınandığı hipotez testinde (Shapiro-Wilk Testi) görüyoruz ki veri setimiz normal dağılmamıştır(p.value<0.05). Gelirin sektörlere göre anlamlı bir farklılığın olup olmadığını incelemek istediğimizde ANOVA testi kullanamayız (varsayım sağlanmamıştır). Bunun üzerine Kruskal Wallis testi (h testi) gerçekleştirilmiştir.

  • H0: Gelir, grupların ortalamaları arasındaki fark anlamlı değildir. (Gruplar arasında fark yoktur)
  • H1: Gruplar arasında fark vardır. (En az biri farklı)

p istatistik değerimize baktığımızda Ho hipotezi reddedilememez ve kabul edilir. Bunun üzerine sektörler arasında % 95 güven aralığında istatistiksel olarak anlamlı bir farklılık olmadığı yorumu yapılabilir.

Lokasyonlara göre gelirler incelenmiştir.

İlk Haritamız

İlk haritamızı oluşturduk. Veri setimizde bulunan verileri oluşan haritamıza yerleştirdik.

Haritaların Görsellerini Değiştirelim

Fiziki harita;

İstanbul’u Görelim

Uydudan ne kadar da güzel görünüyor İstanbul.

İstediğimiz şekilde haritayı özelleştirebilirsiniz. Onlarca farklı harita tipleri mevcut.

HTML kodlaması ile verinin bulunduğu konumdaki popup’ı kişiselleştirebiliyoruz. HTML kodlama ile çok farklı popuplar yapabilirsiniz.

Google Maps üzerinden illerin koordinatlarını bulalım. Bunun için bir kaç farklı ili yazalım ve veri setimize illerin nüfus sayısını yerleştirelim.

Bu kod dizini ile verilerinizi görsel üzerinde gruplandırabilirsiniz. Veri setimizde daha fazla lokasyonun enlem ve boylam bilgisi olsaydı ya da daha geniş ölçekli bir harita oluşturmuş olsaydık, bu kümeleme yönteminin faydasını görebilirdik.

 

HTML kodlama konusunda bir geçmişiniz yoksa https://www.w3schools.com/ sitesinden faydalanabilirsiniz. Haritada imlecinizi noktanın üzerine koyduğunuzda ortaya çıkan popup’ı değiştirebilirsiniz. Hatta video bile yükleyip, imleci noktaya götürdüğünüzde videoyu otomatik olarak çalıştırabilirsiniz.

Yazımı sonlandırmadan önce harita görselliği için sık kullandığım diğer kütüphaneleri maddeler halinde yazmak isterim. Eğer bu tür coğrafik verilerle uğraşıyorsanız ya da beğeniyorsanız aşağıda yazdığım kütüphaneleri araştırmanızı öneririm.

  • -sp
  • -rgdal
  • -rayshader
  • -leaflet
  • -ggmap
  • -ggplot
  • -maptools
  • -raster
  • -tmap
  • -rgeos
  • -maps
  • -RSAGA
  • -GISTools

Hazır veri setleri ile daha estetik görseller ve çalışmalar yapabilirsiniz. Verinin her türlüsü ile uğraşmaktan keyif alıyorsanız ya da benim gibi harita / coğrafik veri görselleştirme gibi konulara meraklıysanız bu blog yazısı ve kaynaklar işinize yarayabilir. Türkçe kaynağın az olduğu bu konularda, bu yazının sizlere faydalı olacağını umuyorum.

 

Varsayımlarınızın sağlanması dileğiyle,

Veri ile kalın, Hoşça kalın..

Yazar Hakkında
Toplam 21 yazı
Utku Kubilay ÇINAR
Utku Kubilay ÇINAR
YTÜ - Doktora - Veri Bilimi - Alghanim Industries - Data Scientist
Yorumlar (Yorum yapılmamış)

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

×

Bir Şeyler Ara