Python Pandas ile Aynı Anda Birden Fazla Excel Dosyasını Okumak
Dosya veri kaynakları arasında csv uzantılı dosyalar kadar excel dosyaları da bulunmaktadır. Pandas kütüphanesi her ne kadar bize bir .xls veya .xlsx uzantılı excel dosyalarını okumamıza imkan tanısa da bir dizin içinde birden fazla excel dosyasını okumak gerektiğinde iş bu kadar basit olmuyor. Birden çok excel dosyasını aşağıdaki gibi okuyabiliriz.
import glob import pandas as pd
all_data = pd.DataFrame() for f in glob.glob("excel_dosyalarının_bulunduğu_dizin/*.xlsx"): df = pd.read_excel(f,"SheetName") all_data = all_data.append(df,ignore_index=True)
yukarıda all_data ile her for döngüsünde ekleyeceğimiz boş bir dataframe yaratıyoruz. glob modülü ise bize dizin içindeki .xlsx uzantılı dosyaların isimlerini toplamamızı sağlıyor. Topladığımız bu isimleri dolaşarak tek tek normal excel okur gibi okuyoruz ve all_data’ya ekliyoruz.
İstersek okuyup birleştirdiğimiz dataframe’i tek dosya halinde diske tekrar yazabiliriz.
Pandas Dataframe’i Diske Yazmak
all_data.to_csv(path_or_buf="Yazılacak_dizin/dosya_adı.csv", sep="|", index=False, header=True)