PCA’i Boyut İndirgeme Dışında da Kullanabilir miyiz?

Soru: İstatistiksel bir teknik olan PCA (principal component analysis) sadece boyut indirgemek için mi kullanılır? Başka işimize yaramaz mı? Cevap: 1. Çok boyutlu veriyi görselleştirme imkanı sağlar. Çok boyutlu veri setini iki bileşene indirgeyip veri setini iki eksen üzerinde görselleştirebiliriz. 2. Kavramsal indirgeme ile paha biçilmez bilgiler sunar. Eğer indirgeme işlemi sonrasında bileşenlerin içlerinde kalan […]
Ağaca Dayalı Yöntemlerde Bagging ve Boosting Arasında ne Fark var?

Random Forests, GBM, XGBoost’un bu yaklaşımlar ile ne ilgisi var? Merhabalar, Soru: Ağaca dayalı yöntemlerde “Bagging” ve “Boosting” ifadeleri geçiyor bunlar ne anlama gelmektedir ve aralarında ne fark vardır? Cevap: İki yöntemde teknik olarak aşırı öğrenme ve model performanslarını arttırmaya yönelik ortaya çıkan yaklaşımlardır. Bagging, “bootstrap aggregation” ifadesinin kısaltılmışıdır. Bu ne anlama gelir? Yeniden örneklem […]
Büyük Veri Nedir?

Google’a “büyük veri nedir?” diye sorduğumuzda birçok tanım, birçok “V”, birçok bir şeyler denk gelecektir. Önemli bir etkinlikte bir Doçent hocamızın şu ifadesi çok güzeldi: “Yıllardır büyük veri ile ilgileniyorum ama hala ne olduğunu hala anlamadım.” Yaklaşın, ben anladım! 🙂 Bu büyük sırrı paylaşmaya karar verdim 🙂 Büyük veri iki farklı şekilde algılanıyor. Birincisi teknik […]
Makine Öğrenmesi ile İstatistiksel Öğrenme Arasında Ne Fark Var?

Makine öğrenmesi ve istatistiksel öğrenme ifadeleri ne anlama gelmektedir? Veri bilimi kapsamında bu konular ile ilgili bir farkındalığın olması gerekmekte midir? Bu bilgiye sahip olmak neyi değiştirecektir? Problem çözme yaklaşımlarıma bir katkısı olacak mıdır? gibi sorulara yanıt olmasını umduğum bir takım bilgileri paylaşmak istiyorum. Öncelikle rolleri bakımından bilgisayar bilimleri ve istatistikçilerin yapay öğrenme konusundaki durumlarını […]
Arkadaş! Hani Bu Paranın Yazı Gelme Olasılığı Yüzde 50 idi?

Bak arkadaş atıyorum şimdi parayı hoop TURA, tekrar atıyorum TURA, tekrar atıyorum TURA, tekrar atıyorum YAZI, tekrar atıyorum TURA, ve tekrar TURA. 6 TURA 1 YAZI. Bu örnek olaylar üzerinden bir sonraki atacağım paranın yazı gelme olasılığı nedir? 1/6 = 0.16 Hani yüzde elli idi? Merhabalar, Yazı mı? tura mı? Genelde tura kazanıyor sanki hep. […]
Analitik Dikeyler ve Tidy Data’nın Önemi (büyük veri ile çalışan kurumlar için )

Büyük veri tamam peki ya büyük verinin analitiği? Büyük veri analitiğininde de çözülmüş olduğu durumda peki ya büyük veri kullanılarak üretilen veri bilimi projelerinin verimi, ölçeklenebilirliği, sürekliliği ve el değiştirme hızı? Yazının amacı veri bilimi projelerinin verimini artırmak, keşifsel analiz süreçlerini hızlandırmak ve keşiflerin kümülatif olarak değer yaratmasına ortam sağlamak üzere tavsiyelerde bulunmaktır. İki bölümden […]
AB Testi Nedir ? İstatistiksel A/B Testleri Nasıl Yapılır?

Bu yazıda İstatistiksel A/B testi, doğru yöntemlerin nasıl seçileceği ve A/B testlerinde dikkat edilmesi gereken noktalara değinilip bir örnek yapılacaktır. İki bölümde ele alınacak yazının birinci bölümü kavramsal ve sonuç odaklı, ikinci bölüm teknik olarak arka plandaki testler ve bu testlerin teorik çalışma prensipleri ile alakalı olacaktır. A/B testleri bir cümle ile özetlenecek olursa: Front-End […]
Artık Büyük Veri Var, İstatistiğe Gerek Yok (mu?)

Mesele “Big data” değil kardeeeş, bak resimdeki abileri kızdırıyorsun. 🙂 Bu büyük veri denilen şey nedir? Teknik olarak boyutundan dolayı geleneksel yöntemlerle işlenmesi mümkün olmayan verinin işlenme biçiminin fiziki ve yazılımsal anlamda değişmesidir. BU KADAR. Değişen tek şey verinin işlenme biçimidir. Biçimin değişmesinin sebebi de boyutudur. (Çeşitlilik, hız vs. girmiyorum) Elimizde daha yüksek boyutta verinin […]
İşte Veri Önümde, Şimdi Ne Yapacağım?

Heh veriyi okuttuk sonunda. İşte veri, bakıyorum şöyle, veri bu ve önümde. Şimdi ne yapacağım? Öncelikle böyle durum ile karşı karşıya kalınması başlı başına bir problemi ifade etmektedir. DS (data science) proje döngüsü altında bir anda önünüze böyle bir veri gelmez. Bu sebeple bu yazı veri bilimi proje döngüsü yazısı bağlamında hazırlanmamıştır. Gelen […]
Veri Bilimi Proje Döngüsü

Veri Bilimi Projesi Nasıl Yapılır? Her DS (data science) projesini kapsayan akış döngüleri yapmak çok mümkün olamamaktadır. Fakat yine de içerisinde ML çıktısı olan projeler için bir DS proje döngüsü nasıl olmalıdır sorusu yanıtlanmaya çalışılacaktır. Microsoft’un dökümanlarında yer alan bir görsel: Hadley Wickham’ın R for Data Science kitabında yayınlanan görsel: Yukarıdaki döngülerin hangi […]
Veri Bilimci Olmak İçin Yol Haritası

Merhaba Veri Bilimci Adayı! 1. Veri Bilimi ile İlgili Tüm Etkinliklere Katıl Türkiye’de ücretsiz düzenlenen etkinlikler var, hatta ücretli olanlara da git ki kıymeti olsun. Bunları zaman kaybetmeden takip etmeye ve etkinliklere katılmaya başla. Bu sana veri bilimi dilini öğretecek, kavramları daha hızlı tanımana sebep olacak, işin uzmanlarından bilgi edinmeni sağlayacak ve en önemlisi daha […]
Nasıl Veri Bilimci Olunur?

Giriş Bir klasik olarak internette bir dakikada neler oluyor görseli ile başlamadık. Burada olduğunuza göre her an yüksek miktarda veri üretildiği ve bu verinin hızlı bir şekilde anlamlı hale getirilmesi gerektiğinin farkındasınızdır. Eğlence kanallarımızdan savunma sistemlerimize kadar her noktada veri güdümlü hale gelmiş olan insanoğlu için veri odaklı yeni bir anlayış türü ortaya çıkıyor. Kısacası: […]