Trino
Merhaba bu yazıda size Trino’dan bahsedeceğim. İlk olarak Trino’nun kısaca ne olduğuna bakalım ve ardından demo uygulaması yapalım. Trino Nedir? Trino, büyük veri analizi için...
Gerçek Zamana Yakın – Apache Hudi
Merhaba bu yazımda sizlere Apache Hudi’yi kısaca tanıtmaya çalışacağım. Veri dünyasında uzun süredir konuşulan konuların en başında Real Time(Gerçek Zamanlı) veriler geliyor. Gerçek zamanlı veri...
Derin Öğrenme ile BBC Haberlerinin Sınıflandırılması
Merhabalar! Bu yazımda derin öğrenme (deep learning) yöntemlerinden evrişimli sinir ağları (convolutional neural networks – CNN) ve uzun kısa süreli bellek (Long short-term memory – LSTM) modelini kullanarak çoklu sınıflandırma...
SSIS’de Conditional Split
Daha önceki SSIS (SQL Server Integration Services) konulu yazılarımda, farklı kaynaklardaki verileri kullanarak amacımıza uygun şekillerde dönüşümler gerçekleştirmiştik. Daha sonra ise hedef çıktımızı tek bir kaynağa indirgemiştik. Bu yazıda ise tam tersi; kaynak verimizi farklı çıktılara nasıl dağıtacağımızı SSIS'de Conditional Split kullanarak göreceğiz.
Çok Büyük Veri
Merhaba arkadaşlar, Özellikle tırnak içinde yazmak istediğim “Big Data” kavramı hakkında düşüncelerimi ve geçmiş deneyimlerimi aktarmak istiyorum. Öncelikle büyük veri için çok kapsamlı ve detaylı...
SSIS’de Union All
Bu yazımda SSIS'de Union All görevini kullanmayı göreceğiz. Örnek paket çalıştırarak SSIS'de neden Union All var ve nasıl kullanılır konularına değinmiş olacağız.
Power BI’da Veri Modelleme ve Tablo İlişkileri
Herkese merhaba. Bu ayki konumuz Power BI’da veri modelleme ve tablo ilişkileri üzerine olacak. Bugüne kadarki örneklerimizde hep tek tablo üzerinden çalıştık, fakat gerçek dünyada...
Hiyerarşik Kümeleme
Merhabalar! Uzun bir aradan sonra yine sizlerleyim 🙂 Bu yazımda denetimsiz öğrenme (unsupervised learning) algoritmalarından hiyerarşik kümelemeyi ele alacağız. İlk olarak denetimsiz öğrenme nedir? Denetimsiz Öğrenme Denetimli öğrenmede...
Apache Spark’a Giriş
Verinin her geçen gün katlanarak büyüdüğü günümüz dünyasında o veriyi işleyebilmenin ve veriden anlamlı çıkarımlarda bulunabilmenin önemi de katlanarak artmaktadır. Ancak terabaytlarca ve hatta petabaytlarca...
Boosting Kutu Açılışı
En sık kullanılan boosting algoritmalarının kullanımı, hiperparametre optimizasyonu ve performansları Python dili kullanılarak incelenmiştir.