Süreç Madenciliğine Giriş
Herkese merhaba, bu benim VBO bünyesinde ki ilk blog yazımdır. Bu zamana kadar hep akademik makale disiplininde yazdığım için lütfen ciddiyetimi mazur görün. 😊
Henüz daha “Büyük veri nedir, veri madenciliği nedir ne işe yarar”ı yeni yeni sindirirken bir de karşınıza süreç madenciliği diye bir kavram çıkardım ki bu disiplin hepsinden faydalanmaktadır. 😊
Bana süreç madenciliğini tek kelime ile anlat deseniz, Vallahi de billahi de anlatamam. 😊 Çünkü dört tane kocaman disiplinin birleşimini kapsamaktadır. Yazının devamında bu disiplinlerden bahsettim ancak şimdi yüzeysel olarak şöyle söyleyeyim, veri bilimi, iş süreçleri yönetimi, iş süreç akışı yönetimi ve makine öğrenmesidir.
Hemen belirteyim ki buradaki “İş Süreçleri Yönetimi ile İş Akışı Yönetimi” aynı şey değildir. İş Süreçleri Yönetimi, adından da anlaşılacağı gibi iş süreçlerinin yönetimini kapsamaktadır. Aslında iş akışı yönetiminin genişletilmiş halidir. İş akışı yönetiminde ise işin akış şekli yönetilir. İş akışı yönetiminde sonuç önemlidir.
İzninizle biraz daha derinlere dalalım…
İş Akışı Yönetimi( Workflow Management)
İş akışı yönetimi, temelde iş süreçleri otomasyonuna odaklanmaktadır. Aynı veya farklı disiplinlerdeki kullanıcıların bilgi göndermesini, iş isteğinde bulunmasını, sonuçlarını tahmin etmelerini ve yönetmelerini sağlamaktadır. İş akış yönetimi sayesinde şirketler sahip oldukları tüm iş verilerini ve kaynaklarını dijital ortamda takip ederek verimli çıktılar alabilmektedirler. Sonuç olarak iş akışı yönetimi bir sonuç elde etmek içindir.
İş Süreç Yönetimi (Business Process Management)
İş Süreç Yönetimi, İngilizce literatürde “Business Process Management” olarak geçmektedir. BPM bilgi teknolojilerini ve yönetim bilimleri bilgilerini bir araya getiren ve bunu operasyonel iş süreçlerine uygulayan bir disiplindir. BPM için WFM’nin genişletilmiş versiyonudur da diyebiliriz.
BPM geniş bir alana sahiptir. Bu alan süreç otomasyonu ve süreç analizinden, süreç yönetimi ve iş organizasyonunu da kapsamaktadır. Bir diğer açıdan bakıldığında ise BPM, yazılım yönetimi, kontrolü, ve operasyonel destek süreçleri ile alakalıdır. BPM, operasyonel iş süreçlerini geliştirmeyi hedeflemekte ve bunu yeni teknolojileri kullanmadan yapmaya çalışmaktadır.
Veri Bilimi ve Süreç Madenciliği Arasındaki İlişki
Veri bilimi son yıllarda çok duyduğumuz bir terim olmak ile birlikte iş dünyasına oldukça faydası olan bir disiplin olmuştur. Verinin artması ile birlikte daha önem kazanan bu disiplin, iş dünyasında rekabet gücü sağlamak adına sıklıkla kullanılmaktadır. Süreç madenciliği, bilişim sistemlerinde gerçekleşen işlemlerin kayıt günlüklerinin veri tabanlarına olay kayıt günlüklerini temel almaktadır. Buradan da anlaşılacağı gibi süreç madenciliğinin hammaddesi anlık olarak kayıt edilen süreç verileridir. Bu süreç verileri kayıtlarının veri ambarlarından çıkarılıp analiz edilmesi “veri bilimi” kısmında dahil olmaktadır.
Süreç madenciliğinde kullanılan programların İçe/Dışa aktar seçenekleri vardır ancak, kullanmak istediğiniz veriyi özelleştirebilmek adına, yani istediğiniz parametreleri kapsayacak şekilde ayarlamak isterseniz burada devreye “veri madenciliği” kavramı dahil olmaktadır. İncelemek istediğiniz sürecin verilerini özelleştirebilmenizi sağlamaktadır.
Makine Öğrenmesi
Makine öğrenmesi son zamanlarda oldukça popüler olan bir çalışma alanıdır. Makine öğrenmesinin temelinde algoritmalar yer almaktadır. Bu algoritmalar “α algoritması[1]” vb. algoritmalardır. Makine öğrenmesinin süreç madenciliği ile alakalı kısmı, kullanılan algoritmaların yardımıyla tahminler yürütülebiliyor ve süreç madenciliğinin üç ana fonksiyonundan biri olan “Discover” yani keşif fonksiyonunun kullanılabiliyor olmasıdır. Bu algoritmalar süreç keşfini oldukça verimli kılmaktadır.
[1] Α-algoritması, bir dizi olay dizisinden nedenselliği yeniden yapılandırmayı amaçlayan süreç madenciliğinde kullanılan bir algoritmadır. İlk olarak van der Aalst, Weijters ve Măruşter tarafından öne sürüldü. (Wikipedia)
Görsel 1.2 (Wil M.P. van der Aalst, Process Mining – Discovery, Conformance and Enhancement of Business Processes, p.8)
Süreç Madenciliği
Süreç madenciliği iş süreçleri yönetiminde model-tabanlı süreç modellemeleri ve veri merkezli analiz teknikleri arasında köprü görevi görmektedir. Süreç madenciliği süreçleri keşfetmek, verileri, kurumu ve sosyal yapıyı kontrol etmek için olay kayıtlarını esas alarak devam etmekte olan süreçlerle ilgili anlamlı bilgi çıkarabilmeyi amaçlamaktadır.
Süreç madenciliğinin yapılabilmesi içine azami olarak gerekli olan üç nitelik şöyledir:
- Süreç Verisi
- Vaka-Olay kimliği
- Zaman Damgası
Süreç Madenciliği beş temel[1] aşamadan oluşur.
- Süreç Keşfi: Gerçekte neler oluyor?
- Uygunluk Kontrolü: Kabul edilenlerimi uyguluyoruz yoksa üstüne eklenmesi gerekenler var mı?
- Performans Analizi: Darboğazlar nerede?
- İşlem Tahmini: Olay gecikecek mi?
- Süreç Geliştirme: Bu süreçleri nasıl yeniden tasarlayabiliriz?
Süreç madenciliğinde bu soruların cevabını aranır ve gerekli geliştirmeler tasarlanır ve uygulanır.
Neyi keşfederiz?
- Süreç modellerinin keşfi (Petri ağları, EPCs, BPMN)
- Organizasyonel Modeller
- Sosyal Ağlar
- Sıralı diyagramlar
- İş Kuralları
- Darboğazlar
- Simülasyon Modelleri
Süreç Keşif Teknikleri
Bunların haricinde; süreç madenciliği dört temel disipline dayanır. Bunlar:
- İş Akışı Yönetimi (Workflow Management)
- İş Süreç Yönetimi (Business Process Management)
- Veri Bilimi (Data Science)
- Makine Öğrenmesi (Machine Learning)
Süreç madenciliği, bu dört disiplinden girdi almakta ve bu girdileri olumlu çıktılara dönüştüren bir teknolojidir. Süreç madenciliği ile şirketler kullandıkları süreçleri ayrıntılarıyla keşfederler, yeni süreç modelleri oluşturabilir mevcut süreçlerini geliştirebilir. Bu sayede verimliklerini ve karlılıklarını arttırabilme kapasitesine sahip olurlar.
Süreç madenciliğini anlamak için ön aşama olarak “İş Süreç Yönetimi Yaşam Döngüsü” konusunun iyice kavranması gerekmektedir. Yaşam döngüsü kavramı burada belirli bir iş sürecini yönetmenin farklı aşamalarını tanımlamaktadır.
İş Süreçleri Yönetimi Yaşam Döngüsü 6 aşamadan oluşmaktadır. Bunlar sırasıyla şöyledir:
- Tasarım (Design)
Sürecin tasarımını kapsamaktadır. Bu model daha sonra yapılandırma ve uygulama modelinde dönüşmektedir.
- Yapılandırma / Uygulama (Configuration/Implementation)
Eğer model hali hazırda çalıştırılabiliyor ve WFM ya da BPM sistemlerinde çalışıyor ise bu süreç daha kısa zaman almaktadır. Ancak model gayri resmi ve geleneksel projeler gibi kağıt üzerinde hazırsa bu sürecin alacağı zaman artacaktır.
- Artırma / İzleme (Enachement/Monitoring)
Bu aşama tasarımı gerçekleştirilmiş süreçler ve sistem desteğinden sonraki aşamadır. Bu bölümde süreçler devam ederken gözlemleme işlemi gerçekleştirilmektedir. Değiştirilmesi gereken ihtiyaçlar tespit edilmeye çalışılır.
- Ayarlama (Adjustment)
Yapılması gerekli değişikliklerin bazıları bu aşamada gerçekleştirilir. Bu aşamada yeniden tasarım işlemleri uygulanmaz ya da yeni yazılım entegre edilmez. Sadece önceden tasarlanmış ve tanımlanmış ayalar gerçekleştirilir.
- Tanı / Gereksinimler (Diagnosis/Requirements)
Bu kısım da süreçler ve acil gereklilikler saptanmaya çalışılır. Değişen yeni koşullar, bunların analiz ve değerlendirilmesi gerçekleştirilir. (Değişen politikalar, kurallar, kanunlar vb.)
Yeni çevre tarafından oluşturulan yeni talepleri ve yeni iterasyonların başladığı yerde devreye 6. Yeniden Tasarım (Re-Design) fonksiyonu girmektedir.
[1] http://www.processmining.org/_media/presentations/processminingtutorialesscass-2009.pdf
[2] Genetik Süreç Madenciliğini, genetik algoritmalar oluşturur. Genetik algoritmalar ise biyolojik sistemlerde evrim sürecini taklit eden bir arama tekniğidir. Temel fikir, genetik algoritma tarafından bulunacak bazı çözüm noktalarını içeren bir arama alanı olmasıdır. Algoritma, bu arama alanına sonlu sayıda noktayı rastgele dağıtarak başlar. (Genetic Process Mining, A. Karla Alves de Medeiros geboren te Campina Grande, Brazilie, pg 6-7).
[3] İz tabanlı Alfa Algoritmasının aksine madenciliği işlemek için Bölge-Tabanlı bir yaklaşımdır. (http://mlwiki.org/index.php/Region-Based_Process_Miner)
Görsel 1.3 ( http://consulta.com.tr/icerik/surec-madenciligi/807 )
Süreç Madenciliğinin Üç Ana Senaryoda Konumlandırılması
- Keşif (Discovery)
- Uygunluk (Conformance)
- Artırma/Geliştirme (Enhancement)
Olmak üzere üçe ayrılmaktadırlar.
Süreç madenciliğinin ilk ana senaryo “Discovery” yani keşiftir.
- Keşif (Discovery)
Keşif tekniği bir olay günlüğünü alır ve herhangi bir ön bilgi kullanmadan bir model oluşturulmaya çalışıldığı bölümdür.
Örnek vermek gerekirse alfa algoritması olabilir. Alfa algoritması bir olay günlüğünün kaydını alır ve bu kayıttan “Petri-Net” olarak bilinen Petri ağları oluşturur. Bu ağ olay günlüğünün kaydının davranışsal halini anlamamıza yardımcı olur.
- Uygunluk (Conformance)
Uygunluk süreç madenciliğinin ikinci ana senaryodur. Burada, mevcut bir işlem modeli, aynı sürecin bir olay günlüğü ile karşılaştırması yapılır. Uygunluk kontrolü günlüğe kaydedilen gerçekliğin modele uygun olup olmadığının kontrolü için yapılmaktadır. Aynı zamanda bunun tam tersi de geçerlidir.
Uygunluk, sapma kontrolü, sapmaları tespit etme, saptamak ve açıklamak aynı zamanda bu sapmaların şiddetini ölçmek için de kullanılabilinmektedir.
- Artırma/Geliştirme (Enhancement)
Buradaki ana fikir, olay günlüğüne kaydedilen gerçek süreç hakkında bilgi kullanılarak mevcut süreç modelini genişletmek veya geliştirmektir. Uygunluk kontrolü model ve gerçeklik uyumunu ölçerken süreç madenciliğinin üçüncü fonksiyonu olan “artırma ve geliştirme” olası model genişletmeyi ve değiştirmeyi hedeflemektedir.
Artırma ve Geliştirme kendi içinde iki kısımdan oluşmaktadır:
- Onarım (Repairing)
- Genişletme (Expansion)
Onarım:
Hali hazırda olan modeli daha iyi ve yansıması olmasını sağlamaya çalışır. Örnek olarak, eğer iki etkinlik sıralı olarak modellenir ise ancak gerçekte herhangi bir sırada da bu işlemler hiçbir sorun çıkmadan gerçekleştirilebiliyor ise model bu karmaşıklığı düzeltmek için yeniden onarılabilir.
Genişletme:
Süreç modellerine olay günlüğü kayıtlarıyla çapraz-korelasyon[1] uygulanıp yeni perspektifler oluşturma işlemidir. Genişletmeye örnek vermek gerekirse “performans verileri” örnek olarak gösterilebilir.
Olay günlüğündeki zaman damgaları kullanılarak, darboğaz ve hizmet seviyeleri zaman ve frekansları gösterilebilmek adına genişletme işlemi uygulanabilir.
Bunlara ek olarak
- Kontrol Akış Perspektifi
- Organizasyonel Perspektif
- Olay Perspektifi
- Zaman Perspektifi
Gibi perspektiflerde eklenebilir.
[1] iki değişkenin değerlerler dizisinde, birbirine karşılık gelen değerler arasındaki ilişkiler.( http://www.psikolojisozlugu.com/cross-correlation-capraz-korelasyon)
Yazılarımın devamında hem konular daha heyecanlı olacak, hemde eğlenceli bir şekilde yazmayı öğrenmiş olurum diye düşünüyorum. 😊