Data-Analysis

Analiza Online Retail II i Student Performance

Aplikacja do analizy statystycznej, klasteryzacji, klasyfikacji oraz przetwarzania wstępnego danych z wykorzystaniem zbiorów Online Retail II i Student Performance.


Spis treści

  1. Opis projektu
  2. Funkcjonalności
  3. Wykorzystane technologie
  4. Instalacja i wymagania
  5. Uruchomienie aplikacji
  6. Interfejs użytkownika (GUI)
  7. Eksperymenty i wyniki
  8. Autorzy
  9. Literatura

Opis projektu

Celem projektu jest stworzenie narzędzia umożliwiającego:


Funkcjonalności

| Funkcjonalność | Opis | |———————————|———————————————————————| | Wczytywanie danych | Obsługa plików CSV z walidacją błędów. | | Statystyki | Obliczanie miar statystycznych dla danych numerycznych i kategorycznych. | | Korelacje | Metody Pearsona i Spearmana. | | Modyfikacja danych | Usuwanie kolumn/wierszy, zastępowanie wartości, skalowanie (MinMax, Standard). | | Kodowanie | One-Hot Encoding, Binary Encoding, Target Encoding. | | Wykresy | 4 typy: słupkowy, liniowy, punktowy, kołowy. | | Algorytmy ML | Klasyfikacja (Random Forest, ID3), klasteryzacja (K-Means). |


Wykorzystane technologie


Instalacja i wymagania

Wymagania sprzętowe/programowe:

Instalacja:

1) Sklonuj repozytorium:

git clone https://github.com/twoj_nick/projekt.git

Uruchomienie aplikacji

Uruchom plik główny:

2) Zainstaluj zależności:

pip install -r requirements.txt

Uruchomienie aplikacji

1) Uruchom plik główny:

python main.py

2) Krok po kroku:


Interfejs użytkownika (GUI)

Aktualnie trwają prace


Eksperymenty i wyniki

1) Zbiory danych:


Autorzy

Jakub Opar – frontend (GUI, wizualizacja).

Michał Pilecki – backend (algorytmy ML, statystyki). wakatime


Literatura