Spark

Büyük Veri Makine Öğrenmesi PySpark Spark Veri hazırlığı Veri Ön İşleme

Spark ML Custom Transformer Yazma

Bu yazımızda Spark ML Custom Transformer yazacağız. Spark’ın makine öğrenimi kütüphanesi (MLlib), veri bilimcilere ve makine öğrenimi mühendislerine zengin bir araç seti sunuyor. Model geliştirme...

Erkan ŞİRİN 5 ay önce

0 131

Büyük Veri Makine Öğrenmesi PySpark Spark Veri hazırlığı Veri Ön İşleme

Spark ML Custom Transformer Yazma

Erkan ŞİRİN 5 ay önce

0 435

Büyük Veri PySpark Spark

Apache Spark, Minio, Nessie Catalog, Iceberg ve Docker ile Lakehouse Örneği

Veri ambarı (data warehouse) ile veri gölünün (data lake) en iyi yönlerini birleştirerek bizlere ilişkisel veri tabanı konforunu büyük veri üzerinde sunan lakehouse çözümleri gün...

Erkan ŞİRİN 12 ay önce

0 686

Büyük Veri PySpark Spark

Delta Lake Temizliği ile Depolama Alanı Optimizasyonu

Herkese merhaba! Gittikçe artan veri hacimleriyle birlikte, verilerin depolanması, yönetilmesi konusundaki güçlüklerin de benzer oranda arttığını biliyoruz. Açık kaynaklı bir depolama katmanı olan olan Delta...

Elif Sinem AKTAŞ 1 yıl önce

0 1987

Büyük Veri PySpark Spark

Apache Spark’ı Hangi Ortamlarda Kullanabiliriz?

Apache Spark büyük veri ve analitik dünyada çok popüler bir araç. Spark’ı bir çok farklı amaçla kullanabileceğimiz gibi bir çok farklı ortamda çalıştırabiliriz. Bu yazımızda...

Erkan ŞİRİN 2 yıl önce

0 3092

Data Engineering Spark

Apache Spark, Apache Airflow, Delta Lake ve MinIO ile ETL Çalışması

Veri odaklı kuruluşlarda, çeşitli ham ve karmaşık verilerden içgörü elde etmek için gerektiğinde büyük miktarda verinin düzenlenmesi, basitleştirilmesi veya zenginleştirilmesi gerekir. ETL (Çıkart, Dönüştür, Yükle)...

Elif Sinem AKTAŞ 2 yıl önce

0 4022

Büyük Veri Scala Spark SQL

Spark SQL Window Functions

Window functions SQL dünyasında yaygın olarak bilinen fonksiyonlar. SQL’de kullandığımız bir çok fonksiyonu Spark ile de kullanabiliyoruz. Bu yazımızda Spark Scala ve SQL söz dizimleriyle...

Erkan ŞİRİN 2 yıl önce

0 4623

Büyük Veri Kubernetes PySpark Python Spark

Spark on Kubernetes

17 Ekim 2024’de güncellendi. Merhabalar. Bu yazımızda bir Spark uygulamasını Kubernetes cluster (Minikube) üzerinde çalıştıracağız, yaygın adıyla Spark on Kubernetes. Bildiğimiz gibi Spark 2.3 sürümüne...

Erkan ŞİRİN 3 yıl önce

0 1933

Büyük Veri PySpark Spark

Apache Spark AWS S3 Veri Kaynağı

Merhabalar. Bu yazımızda Apache Spark AWS S3 entegrasyonu yapacağız. Bu kapsamda bir Spark dataframe’i AWS S3’e nasıl yazacağımızı ve S3’den Spark ile nasıl veri okuyacağımızı...

Erkan ŞİRİN 3 yıl önce

0 2857

Büyük Veri İş Zekası PySpark Python Spark

Spark ve Delta Lake ile Büyük Veri Slowly Changing Dimension Type2

Bu yazımızda veri ambarı dünyasında boyut (dimension) tablolarında sıklıkla kullanılan bir güncelleme yöntemi olan slowly changing dimension örneğini Apache Spark ve Delta Lake ile yapacağız....

Erkan ŞİRİN 4 yıl önce

0 1976

Büyük Veri PySpark Spark

Spark İşini Cep Telefonundan Başlatmak: Apache Livy Server

Başlık çarpıcı geldi değil mi? İnanmazsınız ancak doğru. Spark işlerini genelde client kütüphanelerinin kurulu olduğu makinelerden, yani Spark’ın Hadoop’un nerede olduğundan haberdar ve konfigürasyonları yapılmış...

Erkan ŞİRİN 4 yıl önce

Spark ML Custom Transformer Yazma

Spark ML Custom Transformer Yazma

Apache Spark, Minio, Nessie Catalog, Iceberg ve Docker ile Lakehouse Örneği

Delta Lake Temizliği ile Depolama Alanı Optimizasyonu

Apache Spark’ı Hangi Ortamlarda Kullanabiliriz?

Apache Spark, Apache Airflow, Delta Lake ve MinIO ile ETL Çalışması

Spark SQL Window Functions

Spark on Kubernetes

Apache Spark AWS S3 Veri Kaynağı

Spark ve Delta Lake ile Büyük Veri Slowly Changing Dimension Type2

Spark İşini Cep Telefonundan Başlatmak: Apache Livy Server

Ansible ile Trino Cluster Kurulumu

Miuul’da Yılın En Büyük İndirimi!

Airflow-GitHub Entegrasyonu: GitHub DAG Dosyalarınız Anında Airflow’da

Docker ile Oracle XE Veritabanı Kurulumu

Apicurio Schema Registry ve Kafka ile Veri Akışı Yönetimi

Bir Şeyler Ara