Büyük Veri Nedir?
Google’a “büyük veri nedir?” diye sorduğumuzda birçok tanım, birçok “V”, birçok bir şeyler denk gelecektir.
Önemli bir etkinlikte bir Doçent hocamızın şu ifadesi çok güzeldi: “Yıllardır büyük veri ile ilgileniyorum ama hala ne olduğunu hala anlamadım.”
Yaklaşın, ben anladım! 🙂 Bu büyük sırrı paylaşmaya karar verdim 🙂
Büyük veri iki farklı şekilde algılanıyor. Birincisi teknik kişilerin baktığı yön ikincisi popüler kültür ya da pazarlama dünyasının baktığı yön.
Birincisi, yani teknik olarak: büyük veri bir problemdir.
“Nasıl bir problemdir?”
Elimizdeki verilerin geleneksel yöntemler ile işlenememeye başlamasıyla ortaya çıkan bir problemdir. Yani kabaca, veri boyutunun artması ve türünün çeşitlenmesi ile ilgili bir problemdir.
“Hıım yani büyük veri dediğimiz şeyin aslında veri işleme ya da veri saklama ile ilgili yapısal bir problem olduğunu söylemek istiyorsun?”
Evet. Ek olarak basitçe büyük verinin tanımı şudur:
Geleneksel yöntemler ile işlenemeyen verilere büyük veri denir.
“Peki bu bir problem ise bunun çözümü nedir?”
Bu problemin çözümü birden fazla bilgisayarın bir araya gelerek tek bir bilgisayar gibi hareket etmesidir. Yani bir işi yapmak için birden fazla bilgisayarın tek bir bilgisayar gibi davranmasıdır.
Bu birlikte iş yapma işi fiziksel ve yazılımsal anlamda gerçekleşmektedir. Fiziksel olarak birden fazla bilgisayar bir araya gelerek cluster yani bir küme oluşturur. Bilgisayarların fiziki olarak bir araya gelmesiyle oluşan kümenin birlikte hareket etmesi işini yazılım anlamında “map reduce” programlama modeli gerçekleştirir. Ve böylece bu problem çözülmüş olur.
“Peki bu problemin çözülmesi bize ne kazandırdı?”
Veri analitiği alanında yeni ufuklar açtı, hesaplama gücünün artmasıyla makine öğrenmesi algoritmalarının performansları arttı. Daha büyük miktar ve çeşitteki verilerin kullanılması ile veriden faydalı bilgi çıkarma süreci için çok önemli bir kaynak/araç sağlanmış oldu.
İkincisi, pazarlama dünyası tarafından algılanan şekli: Farklı tiplerdeki ve farklı kaynaklardaki verilerin bir araya getirilerek gizemli analizlerin ve dünyayı kurtaracak çözümlerin yapılması.
İki algılanış biçimide doğrudur. Dünyayı kurtaracak çözümlerin büyük veri ile geldiğinin sanılması dışında. Bu dünyayı kurtaracak çözümler tamamen yalın analitik bir bakış açısı ile yani veri analisti ya da veri bilimcinin ortaya koyacağı performans ile ilgilidir. Bir şirket 10 farklı veri kaynağından bilmem kaç Zeta Byte veriyi bir araya getirdiğinde şirketlerimizin büyük problemleri çözülmüş olmuyor. Bu büyük verinin yapısal kısmının halledilmesi ve artık büyük veri analitiği devresine geçilmesinin yolunun açıldığını gösteriyor. Büyük veri; veri zenginliği ve hesaplama performansı getirmiştir. Fakat her zamanki gibi konu veriden faydalı bilgi çıkarma süreçlerine geliyor…
Bir gün elektrik ve suyun varlığını tartışmıyor olduğumuz gibi verinin büyüklüğünü ve bu veriyi işlemenin zorluklarını da tartışmıyor olacağız, bu durumda mesele yeniden veriden işe yarar, aksiyona döner bilgi çıkarma konusuna geri gelecektir/gelmeye başladı.
“Peki netice olarak nedir bu büyük veri ile ilgili son bakış açımız, yorumumuz?”
Büyük veri büyük nimettir! Büyük veri, veri odaklı çalışanlar için çok büyük bir zenginlik, yeni keşifler için zemin ve dünyaya veri penceresinden olan bakış açımızı değiştiren bir vizyondur.
Veri bilimi alanına sağlam bir giriş yapmak için Data Scientist Bootcamp eğitimine kayıt olabilirsiniz.