Mówi się, że jeśli znasz swoich wrogów i siebie samego, będziesz niezwyciężony w setkach bitew; jeśli znasz siebie, a o wrogach nie wiesz wiele – będziecie wojować ze zmiennym szczęściem; jeśli nie znasz ni siebie, ni swych wrogów – każda potyczka jest przegrana.

Sun Tzu “Sztuka wojny"

Data Mining dla użytkowników SAP

Przedsiębiorstwa świadome wartości informacji od dawna gromadzą duże ilości danych, których wolumen z jednej strony uniemożliwia ich analizę przez człowieka, z drugiej strony stwarza możliwość zastosowania nowoczesnych matematycznych i statystycznych algorytmów do odkrycia wiedzy zalegającej w repozytoriach danych.

Rosnący apetyt firm na informacje mogą zaspokoić narzędzia Data Mining, rozszerzające funkcjonalność dotychczasowych systemów analitycznych. Eksploracja wiedzy może pomóc w odnalezieniu nieznanych dotąd, ale istniejących wzorców i korelacji, jak również określaniu przyszłych trendów i przewidywaniu zachowań klientów.

Ze względu na wysokie koszty oraz poziom skomplikowania, narzędzia eksploracji danych przez długi czas były zarezerwowane dla wąskiego grona odbiorców: statystyków, analityków oraz aktuariuszy pracujących w dużych bankach i towarzystwach ubezpieczeniowych. Wykorzystano je do poznawania zachowań klientów, co pozwoliło na lepsze szacowanie ryzyka i automatyzację procesów przyznawania produktów kredytowych.

Wprawdzie wiele przykładów praktycznego użycia Data Mining można odnaleźć także w branży Retail i FMCG, jednak ze względu na koszty wykorzystanie tych technik nadal nie jest powszechne, zwłaszcza w sektorze średnich przedsiębiorstw.

Dziś z korzyści płynących z zastosowania Data Mining mogą cieszyć się także przedsiębiorstwa korzystające z rozwiązań SAP Business Intelligence, które otrzymują narzędzie do projektowania procesów analizy danych –  Analysis Process Designer (APD).

Modele eksploracji danych dostępne w APD można podzielić na dwie grupy – modele predykcyjne i informacyjne.

Funkcjonalność APD wraz z modelami Data Mining jest dostępna użytkownikom SAP BI w ramach zwykłej licencji, a proste analizy z wykorzystaniem technik eksploracji danych mogą być zbudowane bardzo szybko

Modele predykcyjne

Są stosowane do przewidywania trendów lub przyszłych wyników. Modele takie muszą zostać najpierw „nauczone” występujących do tej pory zachowań i zależności i na podstawie nabytej wiedzy i aktualnych danych potrafią określić prawdopodobieństwa możliwych rezultatów.

Zastosowanie tego typu analiz jest bardzo szerokie i może dotyczyć każdej sfery działalności organizacji. W ten sposób można odpowiedzieć na pytanie: którzy klienci są skłonni do migracji do konkurencji, ale też w podobny sposób można określić czynniki wpływające na odejścia pracowników i na podstawie tej wiedzy opracować działania profilaktyczne mające na celu zatrzymanie tych najbardziej wartościowych.

Przewidywanie przychodów z zastosowaniem narzędzi Data Mining przestanie być zwykłą prognozą, a planowanie poziomu zatrudnienia, wydatków reklamowych czy kosztów odzwierciedli realne trendy.

Modele informacyjne

W odróżnieniu od modeli predykcyjnych modele informacyjne nie wymagają wcześniejszego uczenia się. Są stosowane do natychmiastowej analizy zbioru danych w celu znalezienia pewnych głęboko ukrytych, nieoczywistych wzorców i korelacji. Wiedza odkryta w ten sposób może zostać wykorzystana na przykład w działaniach marketingowych.

Przykładem takiego modelu informacyjnego jest analiza asocjacji (ang. Association Analysis), nazywana również analizą koszyka z uwagi na powszechne wykorzystanie w identyfikacji grup produktów, które często kupowane są łącznie, co pozwala na  przykład na przygotowanie trafniejszych promocji łączonych.

Model ten pozwala na wykrycie zależności między wieloma różnymi zdarzeniami lub obiektami. Nie tylko przy badaniach marketingowych – przykładowo w przemyśle maszynowym można pokusić się o zastosowanie takiej analizy do znajdowania zależności pomiędzy konfiguracją różnych urządzeń a występującymi usterkami.

Nieoczywistą konsekwencją zastosowania takich modeli może być ich wykorzystanie do wykrywania wszelkiego rodzaju nadużyć. Jeżeli w trakcie analizy danych księgowych okazuje się, że pewne wartości bardzo „odbiegają” od reszty, można spodziewać się w tym miejscu nieprawidłowości, które należy sprawdzić.

W narzędziu APD analizowane są dane zgromadzone w hurtowni danych SAP BW, dzięki czemu możliwe jest badanie zależności między danymi z różnych dziedzin. W ten sposób plany dotyczące różnych obszarów działalności firmy mogą zostać powiązane i sprawdzone pod względem spójności czy adekwatności.

Integracja z BI

Analysis Proces Designer jest częścią systemu analitycznego SAP. Funkcjonalność APD wraz z modelami Data Mining jest dostępna użytkownikom SAP Business Intelligence w ramach zwykłej licencji. Integracja z SAP BI polega także na wykorzystywaniu oczyszczonych danych zgromadzonych w hurtowni jako repozytorium dla procesów zdefiniowanych w APD. Ogranicza to problemy z jakością i integralnością danych oraz znacznie skraca niezbędną fazę wstępnego przygotowania danych.

Pierwsze proste analizy z wykorzystaniem technik eksploracji danych mogą być zbudowane bardzo szybko. Algorytmy Data Mining dostępne w APD zamknięte są w predefiniowane, gotowe do parametryzacji elementy.

Modele eksploracji danych dostępne w SAP APD

  • Modele predykcyjne
  • Drzewo decyzyjne (ang. Decision Tree)
  • Analiza regresji (ang. Regresion Analysis)
  • Modele informacyjne
  • Analiza asocjacji (ang. Association Analysis)
  • Grupowanie (ang. Cluster Model)
  • Tabele punktacji ważonej (ang. Weighted Score Tables)
  • Analiza ABC (ang. ABC Analysis)

Przyjazne graficzne środowisko z funkcjonalnością Drag & Drop umożliwia łączenie kilku kroków analizy w jedną sekwencję. Tak zdefiniowany skomplikowany proces może zostać łatwo uruchomiony na bieżąco dla danych wymagających analizy. Elastyczność narzędzia pozwala także na integrację narzędzi statystycznych dostawców zewnętrznych.

Wyniki analiz są zapamiętywane w obiektach hurtowni danych SAP BW lub w systemie SAP CRM, dzięki czemu mogą być następnie wykorzystane przez aplikacje biznesowe lub włączone w pętlę procesu wspomagania decyzji.

Przykłady zastosowania Data Mining

  • Wybór grup docelowych do kampanii marketingowych
  • Organizacja kampanii łączonych
  • Utrzymanie klientów i pracowników
  • Trafny dobór kanału komunikacji z klientami
  • Wykrywanie nadużyć i nieprawidłowości
  • Ocena ryzyka