Veri Bilimi Okulu

Pandas: Veri Türleri Üzerindeki Perdeyi Kaldırın

Loading

Merhabalar bu yazımızda: “Pandas dataframe veri türlerini nasıl görebiliriz?” sorusunun cevabını iki farklı yöntemi mukayese ederek öğreneceğiz. Aslında bir nevi pandas dataframe şeması üzerinde keşif yapacağız. “Okudum veriyi oldu bitti” deyip dümdüz, tam gaz ilerlemeyin. İleride başınıza neler gelebilir dikkat edin. Aslında dataframe nesnesinin dtypes özelliği var oradan çok kolay veri türlerini öğrenebiliriz niçin böyle […]

Pandas Dataframe’i Veri Tabanına Yazmanın En Kötü Yolu

Loading

Pandas dataframe veri bilimci ve mühendisleri tarafından çok yaygın kullanılan bir araç. Veriyi şekilden şekile sokmak için birebir. Veriyi istediğimiz hale getirdikten sonra çoğu zaman bir yere yazıp saklamak isteriz. Eğer saklanacak yer bir veri tabanı olacak ise bunun bir kaç farklı yöntemi var. Bunlardan birisi de pandas dataframe to_sql metodu. to_csv’ye çok alışığız, bu […]

Pratik Bilgiler, Pratik Komutlar: Python Pandas

Loading

Merhabalar bu yazımızda Python Pandas ile pratik bilgiler ve komutları paylaşıyor olacağım. Pandas dataframe tarih (date) filtreleme Dataframe içinde takrarlanan sütunları elde etmek Bir sütunda birden fazla değer içinde arayarak filtrelemek: where a_column in () Pandas ile zip dosyasından veri okumak Python Pandas head Sütun Truncate Önleme – pandas truncate column Pandas dataframe sütunlarını tek […]

Günlük İşlerinizi Kolaylaştıracak Pandas ve Numpy Fonksiyonları

Loading

Python ortamında veri bilimi ile uğraşanların en çok kullanığı kütüphaneler Pandas ve Numpy’dır. Bu yazıda ise bu kütüphanelerde olan, işlerinizi oldukça kolaylaştıracak fonksiyonlardan bahsedeceğim. Numpy 1 – argpartition() Bu fonksiyon, bize N en büyük değerlerin indekslerini vermektedir. İhtiyaca göre bu indekslere sahip değerleri sıralayabiliriz. 2 – allclose() Bu fonksiyon, 2 tane dizinin birbirine eşit ya […]

Python İle Tek Yönlü Varyans Çözümlemesi(One Way ANOVA)

Loading

Merhaba VBO severler, bugün Python ile Tek Yönlü Varyans Çözümlemesi yapacağız. Önceki yazılarımdan birinde R ile Tek Yönlü Varyans Çözümlemesine yer vermiştim o yazıya da buradan ulaşabilirsiniz. Varyans Çözümlemesi iki ya da daha fazla grubun ortalamaları arasında istatistiksel olarak bir fark olup olmadığını araştırmak için kullanılır en kısa tabiriyle diyip lafı daha fazla uzatmadan Tek […]

Python ile Tidy Data

Loading

Veri bilimci olarak, veri setlerini standartlaştırılmış bir yapı halinde kullanmaya alışmamız lazım. Veri temizleme, veri bilimideki en sık yapılan iştir. İstediğiniz veri ile uğraşın yada istediğiniz analizi yapın, eninde sonunda veriyi temizlediğiniz bir noktaya varıcaksınız. Verinizi standart bir biçimde düzenlemek işlerinizi daha da kolaylaştıracaktır. Düzenli Veri (Tidy Data) Nedir? “Tidy Data” kavramını 2014 yılında Hadley […]

Python ile Makine Öğrenmesine Giriş Pandas Kütüphanesi

Loading

Merhabalar, Makine Öğrenmesine Giriş Serisi’nin İlk kütüphanesi Pandas’tan bahsedeceğim bu gün, serinin devamında numpy, matplotlib, scikit-learn vs. gibi kütüphanelerden bahsedip ardından önce basit örneklerden başlayıp daha komplike örnekler ile python’da makine öğrenmesini anlatacağım. Şimdiden İyi Okumalar! Pandas Nedir? Pandas genelde veri işleme ve temizlemede oldukça efektif şekilde kullanılan, hatta makine öğrenmesi gibi alanlarda oldukça fazla […]

Python Pandas ile Temel İşlemler

Loading

Bölüm 1 – Dosya Okuma & Sütun İsimlendirme Pandas; veri analizi ve veri ön işlemeyi kolaylaştıran  açık kaynak kodlu bir kütüphanedir. Dil olarak Python kullanır. Pandas dağıtık işlemeye uygun değildir. Bu sebeple işleyeceğiniz verinin büyüklüğü makinenin kapasitesiyle sınırlıdır, özellikle de ana belleğin. Ben büyük veri setleri üzerinde işlem yaptığım için Pandas’ı çok fazla kullanamıyorum ancak […]

Password Requirements:

  • At least 8 characters
  • At least 1 lowercase letter
  • At least 1 uppercase letter
  • At least 1 numerical number
  • At least 1 special character