Agile Data Science - Rôle des prédictions

Dans ce chapitre, nous apprendrons le rôle des prédictions dans la science des données agile. Les rapports interactifs exposent différents aspects des données. Les prédictions forment la quatrième couche de sprint agile.

Quatrième couche

Lorsque nous faisons des prédictions, nous nous référons toujours aux données passées et les utilisons comme inférences pour les itérations futures. Dans ce processus complet, nous transférons les données du traitement par lots des données historiques aux données en temps réel sur l'avenir.

Le rôle des prédictions comprend les éléments suivants -

  • Les prévisions aident à prévoir. Certaines prévisions sont basées sur l'inférence statistique. Certaines des prédictions sont basées sur les opinions des experts.

  • L'inférence statistique implique des prédictions de toutes sortes.

  • Parfois, les prévisions sont exactes, tandis que parfois les prévisions sont inexactes.

Analyses prédictives

L'analyse prédictive comprend une variété de techniques statistiques de la modélisation prédictive, de l'apprentissage automatique et de l'exploration de données qui analysent les faits actuels et historiques pour faire des prédictions sur les événements futurs et inconnus.

L'analyse prédictive nécessite des données de formation. Les données formées incluent des fonctionnalités indépendantes et dépendantes. Les fonctionnalités dépendantes sont les valeurs qu'un utilisateur tente de prédire. Les fonctionnalités indépendantes sont des fonctionnalités décrivant les choses que nous voulons prédire en fonction des fonctionnalités dépendantes.

L'étude des fonctionnalités s'appelle l'ingénierie des fonctionnalités; c'est crucial pour faire des prédictions. La visualisation des données et l'analyse exploratoire des données font partie de l'ingénierie des fonctionnalités; ceux-ci forment le cœur de la science des données Agile .

Ingénierie des fonctionnalités

Faire des prédictions

Il existe deux façons de faire des prédictions en science des données agile -

  • Régression

  • Classification

La construction d'une régression ou d'une classification dépend entièrement des besoins de l'entreprise et de son analyse. La prédiction des variables continues conduit au modèle de régression et la prédiction des variables catégorielles conduit au modèle de classification.

Régression

La régression prend en compte des exemples qui comprennent des fonctionnalités et produit ainsi une sortie numérique.

Classification

La classification prend l'entrée et produit une classification catégorielle.

Remarque - L'exemple d'ensemble de données qui définit l'entrée de la prédiction statistique et qui permet à la machine d'apprendre est appelé «données d'entraînement».