Veri Bilimi Okulu

Python Pandas ile Aynı Anda Birden Fazla Excel Dosyasını Okumak
Python Pandas ile Aynı Anda Birden Fazla Excel Dosyasını Okumak
pandas_multiple_excel_file

Loading

Dosya veri kaynakları arasında csv uzantılı dosyalar kadar excel dosyaları da bulunmaktadır. Pandas kütüphanesi her ne kadar bize bir .xls veya .xlsx uzantılı excel dosyalarını okumamıza imkan tanısa da bir dizin içinde birden fazla excel dosyasını okumak gerektiğinde iş bu kadar basit olmuyor. Birden çok excel dosyasını aşağıdaki gibi okuyabiliriz.

import glob
import pandas as pd
all_data = pd.DataFrame()
for f in glob.glob("excel_dosyalarının_bulunduğu_dizin/*.xlsx"):
    df = pd.read_excel(f,"SheetName")
    all_data = all_data.append(df,ignore_index=True)

yukarıda all_data ile her for döngüsünde ekleyeceğimiz boş bir dataframe yaratıyoruz. glob modülü ise bize dizin içindeki .xlsx uzantılı dosyaların isimlerini toplamamızı sağlıyor. Topladığımız bu isimleri dolaşarak tek tek normal excel okur gibi okuyoruz ve all_data’ya ekliyoruz.

İstersek okuyup birleştirdiğimiz dataframe’i tek dosya halinde diske tekrar yazabiliriz.

Pandas Dataframe’i Diske Yazmak

all_data.to_csv(path_or_buf="Yazılacak_dizin/dosya_adı.csv",
          sep="|", index=False, header=True)

0

Bir yanıt yazın

Password Requirements:

  • At least 8 characters
  • At least 1 lowercase letter
  • At least 1 uppercase letter
  • At least 1 numerical number
  • At least 1 special character