Dane w procesie eksploracji danych

Przedsiębiorstwa często nie zdają sobie sprawy z posiadanych zasobów danych, które posiadają. W celu wyciągania wiedzy z takich źródeł korzysta się z data mining, który jest eksploracją danych. W skład takiego działania wchodzi pozyskiwanie, analiza oraz wykorzystanie danych. Jako iż dotyczy to dużych zbiorów danych i wydobywanie z nich zależności oraz schematów działania takie przeprowadzane są z wykorzystaniem odpowiedniego oprogramowania komputerowego.

Dane pozostają zawsze najważniejsze

Eksplorację danych inaczej nazywa się zagłębianiem danych i stanowi ono etap odkrywania wiedzy, a przy tym jest złożonym procesem analitycznym. Dzięki podejmowaniu działania w obrębie data mining możliwe staje się przewidywanie przyszłych sytuacji. Proces eksploracji danych dzieli się na trzy etapy:

  • wstępną eksplorację;
  • budowanie modelu i wyznaczenie wzorców wraz z oceną i weryfikacją;
  • wdrożenie i wykorzystanie modelu dla kolejnych danych.

Jak odkryć wiedzę w wielości informacji?

Odkrywanie wiedzy w bazach danych koncentruje się na zastosowaniu metod uczenia się, które ukazują występujące regularności w danych. Metody te dzieli się ze względu na rodzaj wiedzy, które odkrywają. Do metod tych zalicza się na przykład:

  • klasyfikacje – stosunek między przynależnością do danej kategorii, a ilością i wartością atrybutów;
  • zależności przyczynowe – zależności przyczynowe między różnymi atrybutami;
  • zależności funkcyjne – wzorce, jakimi najlepiej wyrażają się zależności pomiędzy atrybutami o wartościach liczbowych;
  • asocjacje – wartości atrybutów, które często występują razem w danym zbiorze.

To może podlegać pod badanie!

Zależności statystyczne oraz schematy, które zostają odkryte w procesie badawczym prezentowane są za pomocą reguł logicznych, drzew decyzyjnych bądź sieci neuronowych. Najpopularniejszym oprogramowanie komputerowym stosowanym w celu zagłębienia danych jest SAS. Do danych uwzględnionych w data mining zaliczyć można między innymi:

  • dokumenty tekstowe;
  • bazy danych (ilościowych i jakościowych);
  • multimedia;
  • sekwencje DNA.

Badanie, które wymaga pewnych informacji

Eksploracja danych swoje działania nakierowuje na różne techniki, które w efekcie dają specyficzny rodzaj wiedzy. Punktem wyjściowym w podejmowanych działaniach są dane, które powinny charakteryzować się wysoką jakością, a przy tym powinny być zgodne z badanym zagadnieniem. Za najważniejszy etap data mining może uznać zbieranie danych oraz ich przygotowanie, gdyż to od posiadanych danych zależy powodzenie całego procesu badawczego.