Python Pandas ile Aynı Anda Birden Fazla Excel Dosyasını Okumak

Dosya veri kaynakları arasında csv uzantılı dosyalar kadar excel dosyaları da bulunmaktadır. Pandas kütüphanesi her ne kadar bize bir .xls veya .xlsx uzantılı excel dosyalarını okumamıza imkan tanısa da bir dizin içinde birden fazla excel dosyasını okumak gerektiğinde iş bu kadar basit olmuyor. Birden çok excel dosyasını aşağıdaki gibi okuyabiliriz.

import glob
import pandas as pd
all_data = pd.DataFrame()
for f in glob.glob("excel_dosyalarının_bulunduğu_dizin/*.xlsx"):
    df = pd.read_excel(f,"SheetName")
    all_data = all_data.append(df,ignore_index=True)

yukarıda all_data ile her for döngüsünde ekleyeceğimiz boş bir dataframe yaratıyoruz. glob modülü ise bize dizin içindeki .xlsx uzantılı dosyaların isimlerini toplamamızı sağlıyor. Topladığımız bu isimleri dolaşarak tek tek normal excel okur gibi okuyoruz ve all_data’ya ekliyoruz.

İstersek okuyup birleştirdiğimiz dataframe’i tek dosya halinde diske tekrar yazabiliriz.

Pandas Dataframe’i Diske Yazmak

all_data.to_csv(path_or_buf="Yazılacak_dizin/dosya_adı.csv",
          sep="|", index=False, header=True)

Yazar Hakkında
Toplam 179 yazı
Erkan ŞİRİN
Erkan ŞİRİN
10 yılı aşkın süredir yurtiçi ve yurtdışında sektörde büyük veri mühendisliği, platform yönetimi ve makine öğrenmesi ile ilgili çalışmalar yürütmekte ve aynı zamanda birçok kurum ve şirkete danışmanlık ve eğitimler vermektedir. Çalışma alanları: Data ve MLOps platformları, gerçek zamanlı veri işleme, değişen veriyi yakalama (CDC) ve Lakehouse.
Yorumlar (Yorum yapılmamış)

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

×

Bir Şeyler Ara