Nach dem Einlesen und der Konsolidierung eines übermittelten Datensatzes berechnet das Inspirient-System automatisch deskriptive Statistiken und wendet eine Reihe von Analysemethoden an. Diese Analysemethoden und ihre Eingabeanforderungen sind nachstehend im Einzelnen aufgeführt.
Analysemethode | Beschreibung | Datenanforderungen | Muster | Tags |
---|---|---|---|---|
Deskriptive Statistik | Berechnet deskriptive Statistiken für alle Dimensionen der Eingabedaten und erstellt ein Profil für jede Spalte und Tabelle | Kategorische und/oder numerische Variablen | Maximum, Minimum, Durchschnitt, Standardabweichung, Wertebereich und Art der Häufigkeitsverteilung | Column profile Table profile Histogram |
Aggregation | Aggregationsanalyse, vergleichbar mit einer Pivot-Analyse in Microsoft Excel, für alle Dimensionskombinationen (bis hin zu dreifachen Dimensionskombinationen) | Kategorische und/oder numerische Variablen | Maximum, Minimum, Durchschnitt und Standardabweichung | Aggregation |
Erkennung von Anomalien | Entdeckung potentiell unbekannter Muster durch unüberwachte maschinelle Lernverfahren zur Erkennung von Ausreißern | Geschäftsunregelmäßigkeiten, Dateninkonsistenzen, Abweichungen von einem Muster und Ausreißer auf Spaltenebene | Kategorische und/oder numerische Variablen, Geschäfts-KPIs (optional) | Anomaly |
Slicing und Dicing | Automatisches Slicing und Dicing des Datensatzes bei Bedarf, z.B. Fokussierung auf das letzte vollständige Geschäftsjahr oder Drill-down auf das umsatzstärkste Produkt | Kategorische und/oder numerische Variablen | n/a | Drill-down |
Zeitreihentrends und -prognosen | Die Trendanalyse liefert ein umfassendes Ranking aller Zeitreihentrends und -prognosen in den Eingabedaten | Zeitdimension und kategorische und/oder numerische Variablen | Zeitreihentrends und Trendabweichungen | Time series Trend Deviation |
Einfache and multivariate Regressionsanalyse | Die Regressionsanalyse ermittelt die Beziehungen zwischen den Variablen (linear und logistisch) und fasst die wichtigsten Beziehungen zusammen. Die Ausgabetabelle enthält Beziehungsstärken und -funktionen | Mehrere numerische Variablen und kategorische Variablen | Korrelationsstärke und Anomalien | Regression Correlation Deviation |
Geoanalyse | Analyse geografischer Informationen und Visualisierung in Form von regionalen Karten und/oder Geo-Standort-Highlights | Standortvariable | Regionale Hotspots | Geographic |
Root Cause Analysis | Erklärungen von Mustern in den Eingabedaten, die möglicherweise zur Aufdeckung versteckter Kausalitäten führen | Abhängige und unabhängige Variablen | Assoziationsregeln zur Erklärung relevanter Muster | Root cause |