Veri Ambarı Tasarımında Kaçınılması Gereken 10 Temel Hata
Kimball, gelişmiş teknikleri kapsayan kitabında veri ambarı tasarımında kaçınılması gereken 10 temel hata sıralaması yapmış, bu yazımda onları inceliyoruz.
Veri Ambarı Tasarımında Kaçınılması Gereken 10 Temel Hata
Kimball, gelişmiş teknikleri kapsayan kitabında veri ambarı tasarımında kaçınılması gereken 10 temel hata sıralaması yapmış, bu yazımda onları inceliyoruz.
Scala Eğitimi Başlangıç (Just Enough Scala)
Scala eğitimi alarak büyük veri işlemede usta olun. Scala eğitimini sektör deneyimli eğitmenlerden alın. Scala Apache Spark’ın ana dilidir. Scala, nesne yönelimli ve işlevsel programlama...
Günlük İşlerinizi Kolaylaştıracak Pandas ve Numpy Fonksiyonları
Python ortamında veri bilimi ile uğraşanların en çok kullanığı kütüphaneler Pandas ve Numpy’dır. Bu yazıda ise bu kütüphanelerde olan, işlerinizi oldukça kolaylaştıracak fonksiyonlardan bahsedeceğim. Numpy...
Nokta Tahmini, Aralık Tahmini ve NGBoost Algoritması
Bir Veri Bilimi projesinde en önemli olan şey iş problemidir ve amacımız belirsizlik içeren iş problemini çözümleyebilmektir. Projeye başlamadan sorulması gereken bazı soruların, analist arkadaşlar...
LightGBM
LightGBM diğer boosting algoritmaları ile karşılaştırıldığında yüksek işlem hızı, büyük verileri işleyebilmesi, daha az kaynak(RAM) kullanımı, yüksek tahmin oranı, paralel öğrenme ve GPU öğrenimini desteklemesi gibi avantajları vardır.
Öneri Sistemleri 101 – İçerik Bazlı Filtreleme
Merhaba VBO okuyucuları, Bir önceki yazımda günümüzde çok popüler olan ‘öneri sistemleri’ konusuna bir giriş yapmıştık, yazıya bu linkten ulaşabilirsiniz. Bu yazımda biraz daha bu...
Titanic Verisi ile No Free Lunch Teoremi ve Algoritmaların Kaggle’daki Başarısı
No Free Lunch Teoremi kısaca Makine Öğrenmesi algoritmalarının birbirlerine üstün olmadıklarını belirtir. Bir iş probleminin çözümü, kullanılan algoritmaya bağlı değildir veri setine bağlıdır! Bu uygulamada...
Spark ile Cassandra’dan Veri Okumak
Merhabalar, Spark ve Cassandra büyük veri dünyasının önde gelen 2 popüler aracı. Apache Cassandra NoSQL veri tabanlarının önde gelen isimlerinden birisi. Adem-i merkeziyetçi yapısıyla (no...
NGBoost Algoritması
Bu yazımda, son zamanlarda araştırmak ve iş yerimde projelerimde kullanmak istediğim bir algoritmayı sizlerle beraber incelemek ve bir uygulama yapmak istedim. Yazımın konusu NGBoost (Natural...
Risk Analitiği: tidycreditrisk Paketi
Corona günlerinden herkese merhaba,Bu yazımda, risk analitiği kapsamında temerrüt verisi üzerinde yapılabilecek istatistiksel analizler hakkında bilgiler vereceğim. Analizleri, Tunç Oygur ve Arda Keskin ile beraber...