Veri Bilimi Okulu

Derin Öğrenme ile Sahte Haberlerin Belirlenmesi

Loading

Herkese Merhabalar! Bu yazımda sahte haberlerin belirlenmesinde derin öğrenme yaklaşımını inceleyeceğiz. Derin öğrenmeye giriş seviyesinde bir yazı demekte doğru olacaktır. Bu yazının içeriği bir önceki yazının devamı niteliğindedir. VBO için hazırlamış olduğum ilk yazımda, sahte haberlerin belirlenmesinde kullanılan makine öğrenimi algoritmalarından elde edilen sonuçlardan bahsetmiştim. Bu yazıda ise derin öğrenme yaklaşımını kullanarak ikili sınıflandırma problemini […]

Scikit-Learn ile Eğitilen Modelin Farklı Dillerde Native Koda Dönüştürülmesi (Java, C, Python, Go, JavaScript, Visual Basic, C#)

Loading

Bu yazımda 2019 başlarında ilk commiti yapılmış benim henüz farkedip test etme imkanım olan bir Python kütüphanesinden bahsedeceğim. Daha önce Python veya Knime ile eğittiğim modelleri farklı dillerde -mesela Java- kullanmak için o dilde pmml dosyasını okuyup sonuç üretecek bir kütüphane olmasını bekliyordum. Mesela Java için bu iş pmml4s ile kolaylıkla yapılıyorken. Golang için bulduğum […]

RFM Analizi ile Müşteri Segmentasyonu

Loading

Merhaba VBO okuyucuları! Bu yazımda sizlere, müşteri segmentasyonu ve analizinde yaygın bir kullanımı olan RFM analizinden bahsedeceğim. Bir önceki yazımda yine e-ticaret verisi üzerinde belli analizler yapıp, veriyi incelemiştik. Yazıya buradan ulaşabilirsiniz: https://veribilimiokulu.com/e-ticaret-veri-analizi/ RFM nedir? Recency, Frequency, Monetary kelimelerinin baş harflerinden oluşup, bu üç metriğin hesaplanmasından sonra birleştirilmesiyle meydana gelen bir skordur. Müşterilerin mevcut durumunun […]

Python ile Doğal Dil İşlemede Fuzzy String Matching

Loading

Merhaba arkadaşlar, bugün sizlerle birlikte iki cümle arasındaki benzerlik ilişkisini çeşitli örnekler yaparak göreceğiz. Benzerlikleri yakalamak için kullandığımız kütüphanenin adı FuzzyWuzzy. Bu kütüphane bir çok programlama dilinde geliştirilmesine rağmen ben bugun size Python dilini kullanarak anlatacağım ama öncesinde biraz string eşlemesi ne işe yarar nerede kullanırız bunlara biraz değineceğim. Fuzzy(Bulanık) string eşlemesi , kullanıcılar kelimeleri […]

Natural Language Toolkit(NLTK)

Loading

Doğal Dil İşleme kütüphanesi olan Natural Language Toolkit(NLTK)’i ve en sık kullanılan modüllerinden bahsedip Pyhthon’da uygulamalarını gerçekleştirdim.

Python ile Adres Bulma Motoru Oluşturma

Python ile Adres Bulucu

Loading

Merhaba arkadaşlar, bu aralar işimden dolayı Python ile haşır neşir olduğumdan dolayı Python ile yazılarıma devam etmekteyim ama bu demek değildir ki R ile istatistiksel çözümlemeler devam etmeyecek sadece biraz ertelendi diyelim 🙂 Yapacağımız arama motorunu oluştururken Google amcanın çok yardımı dokunuyor. 🙂 Google’dan aldığımız API anahtarı ile ve bize sağladığı Python modülü ile bu […]

Veri Analizi – E-ticaret Uygulaması

Loading

Merhaba VBO okuyucuları! Bu yazımda, e-ticaret örnek verisi üzerinden veri analizi uygulaması yapacağız. Bir önceki yazımda, CRM ve müşteri analitiği hakkında genel bilgiler verip sonraki yazılarımda örnekler uygulayacağımdan bahsetmiştim. Yazıya buradan ulaşabilirsiniz. Python üzerinde yapacağımız uygulama için, Kaggle.com üzerinden indirdiğimiz e-ticaret verisini analiz edip, bazı çıkarımlarda bulunacağız. Veri analizi, aslında sorular sormakla başlar. Verideki her […]

Dolandırıcılık Tespiti – Kaggle Yarışması – Bölüm 1

Loading

Bu yazımda sizlere Kaggle platformu üzerinden düzenlenen “IEEE-CIS Fraud Detection” başlıklı yarışmada ekipçe yaptığımız işlemleri, yarışmanın hikayesini, yol haritamızı ve kodlarımızı sizlerle paylaşacağım. Öncelikle yarışmaya 6.381 takım ve 7.416 kişi katıldı. Biz bu yarışmada 482. olduk ve %8’lik dilime girerek bronz madalya ile yarışmayı tamamladık. Utku Kubilay Çınar, Dr. Fırat Gönen, Ekrem Bayar ve Gökhan […]

Dolandırıcılık Tespiti – Kaggle Yarışması – Bölüm 2

Loading

Yazımın ikinci kısmına hoşgeldiniz. Bildiğiniz üzere yazımı iki parçaya bölmüştüm. İlk bölümde yarışmanın hikayesini, yol haritamızı, R ve Python kütüphanelerini, Eksik verilerle mücadelemizi ve değişken mühendisliğine biraz giriş yaparak birkaç değişken üretmiştik. Şimdi kaldığımız yerden devam edelim. Eğer yazımın ilk bölümünü okumadıysanız, bu link ile erişebilirsiniz. Veri setimizde diğer değişkenlerden biri de gözlemin sahip olduğu […]

Python Virtual Environment Nedir?

virtual environment

Loading

Yeni bir yazı ile herkese merhaba! Bugün size karşılaştığım bir problemden bahsedeceğim. Python ile veri bilimi projeleri yaparken paket dağıtımı olarak Anaconda kullanıyordum. Çünkü Anaconda, çok fazla Python ve R paketini bünyesinde bulunduran bir paket dağıtımıdır. Karşılaştığım sorun ise tam olarak burada başlıyor. Anaconda’yı bilgisayarınıza yüklediğiniz zaman o kadar çok paket yüklüyor ki bir süre […]

Language Model

Loading

Merhaba arkadaşlar, bugünkü yazım NLP üzerine olacak. Bugün sizlere dil modellemesinden bahsedeceğim. Nerede kullanılır, nasıl olur gibi benzeri sorulara cevap bulmaya çalışacağız. Bu yazıdaki amacım Dil Modellemesine bir bakış sağlamaktır… Dil modellemesinin amacı, çeşitli dil birimlerinin örneğin sözcüklerin, cümlelerin vb. olasılık dağılımını tahmin etmektir. Şöyle düşünürsek daha akılda kalıcı olur. Telefonda bir mesaj yazdığınızı varsayalım, […]

Python İle Tek Yönlü Varyans Çözümlemesi(One Way ANOVA)

Loading

Merhaba VBO severler, bugün Python ile Tek Yönlü Varyans Çözümlemesi yapacağız. Önceki yazılarımdan birinde R ile Tek Yönlü Varyans Çözümlemesine yer vermiştim o yazıya da buradan ulaşabilirsiniz. Varyans Çözümlemesi iki ya da daha fazla grubun ortalamaları arasında istatistiksel olarak bir fark olup olmadığını araştırmak için kullanılır en kısa tabiriyle diyip lafı daha fazla uzatmadan Tek […]

Plotly ve Dash İle Python’da Dashboard Geliştirmek

Loading

Herkese merhabalar! Bir veri bilimi projesini bitirdiğimizde sonuçları bir dashboard ile karşımızdakilere aktarmak en güçlü yollardan biridir. İyi bir dashboard ile: Veri analizinin ana sonuçlarını özetleyebiliriz. Müşterilerin yada şirket yöneticilerinin, parametreleri değiştirmenin sonuca nasıl etkileri olabileceğini görmesini sağlayabiliriz. Sürekli olarak yeni veriler ile grafikleri ve özet bilgileri güncelleyebiliriz. Makine öğrenmesi modellerinin yardımıyla tahminler yapabiliriz. Dashboard […]

Uçtan Uca Makine Öğrenmesi Örneği: Titanik Gemi Kazası Uygulaması

Loading

21. yüzyılın en popüler mesleklerinden biri olan veri bilimi; çok kısaca, geçmiş gözlem değerlerine bakarak geleceği tahminleyen, verilerden gerekli modeller kurarak sorunları önceden belirtmeye çalışan, gelecek durumlar hakkında bilgiler sunan, yapay zeka algoritmaları geliştiren ve veri yığınlarından anlamlı bilgiler üreterek eylem planları (şirket stratejileri) hazırlayan kişilerin içinde bulunduğu, büyük otoritelerce “son 10 yılın en seksi” […]

Cv2 İle Yüz Tanıma ve Belirleme

Loading

Yüz belirleme ya da nesne tanıma, derin öğrenmenin gelişmesi ve ciddi çalışmaların literatüre katılmasıyla son zamanlarda önemli bir konu haline gelmiştir. Günlük hayatımızda çok fazla kullanılan yüz belirleme (face detection) algoritmaları aslında derin ağlarla eğitilen modellerin, yüz hatlarını bulmasıyla çalışır. Kişilerin yüz hatlarına göre biyometrik çıkarımlar yapma işlemidir. CNN (Convolutional Neural Network), ImageNet, Opencv vs […]

Python ve Poisson Dağılımı ile Deprem Olasılığı Hesaplaması

Loading

Herkese merhabalar! Eğer üniversitede istatistik bölümü okuduysanız, olasılık dağılımları işlenirken verilen örnekleri az çok hatırlıyorsunuzdur. Bu örnekler yıldan yıla hiç değişmez. Bernoulli denemesi mi anlatılılır, hemen “Bir torbada 5 siyah, 7 siyah top vardır. Torbadan rastgele seçilen bir topun siyah olma olasılığı nedir?” örneği verilir. Bu örnekleri çoğaltabiliriz ama burada hepsini yazmayacağım. Benim asıl üstünde […]

Python ile Hipotez Testleri – Oran Testleri Bölüm – 3/3

Loading

Python ile Hipotez Testleri yazı serimin 3.kısmına hoş geldiniz. Bu bölümde size oran testlerinden bahsedeceğim. Eğer bu yazı serisinin diğer kısımlarını okumadıysanız aşağıdaki linklerden erişebilirsiniz: Bölüm – 1: https://veribilimiokulu.com/python-ile-hipotez-testleri-parametrik-testler-bolum-1-3/ Bölüm – 2: https://veribilimiokulu.com/python-ile-hipotez-testleri-parametrik-olmayan-testler-bolum-2-3/ Oran testi, bir popülasyondan alınan bir örneğin tüm popülasyonun gerçek oranını temsil edip etmediğini test etmektedir. One Proportion Z-Test One Proportion Z-Testi […]

LSTM ile Dolar/TL Kuru Tahmini

Loading

Merhabalar, bugünkü yazımda sizlere Özyinelemeli Sinir Ağlarından ve LSTM ile nasıl dolar kuru tahmini yapılacağından bahsedeceğim, yazının içeriği şu şekilde; Özyinelemeli Yapay Sinir Ağları Konuşma Tanıma Örneği Kaybolan Eğim(Vanishing Gradient) Uzun-Kısa Dönem Hafıza(LSTM) LSTM ile Dolar Tahmini Dolar Verisinin Alınması Veri Analizi ve Ön İşlemesi LSTM Modelinin Kurulması Sonuçlar 1 – Özyinelemeli Sinir Ağları Bir […]

Python ile Birliktelik Kuralları Analizi (Association Rules Analysis with Python)

Loading

Merhabalar, Bu gün sizlerde birlikte Python üzerinde Birliktelik Kuralları Analizi çalışmasını gerçekleştireceğiz. Çok daha evvel olması yazılması planlanan bu yazı için lütfen kusuruma bakmayınız. ☹ Birliktelik Kuralları Analizi (Association Rules Analysis) hakkındaki daha önceki yazılara aşağıdaki linklerden ulaşabilirsiniz. Birliktelik Kuralları Analizi (Association Rules Analysis) https://veribilimiokulu.com/associationrulesanalysis/ R ile Birliktelik Kuralları Analizi (Association Rules Analysis with R […]

Password Requirements:

  • At least 8 characters
  • At least 1 lowercase letter
  • At least 1 uppercase letter
  • At least 1 numerical number
  • At least 1 special character