Patrice's portfolio

Ajoutez cette page à vos favoris pour suivre les mises à jour de mes projets !

Logo pieuvre

Projet de Certification Data Analyst

Analyse et optimisation des ventes en ligne

Introduction

Ce projet se concentre sur l'analyse et l'optimisation des ventes en ligne en utilisant des informations basées sur les données. L'objectif principal est d'identifier les schémas d'achat, de prédire les tendances de vente et de fournir des recommandations exploitables pour le propriétaire du site.

Quels ensembles de données ont été utilisés pour atteindre les objectifs de ce projet ?

Nous avons utilisé quatre ensembles de données collectés à partir d'un site de e-commerce réel :

Tous les ensembles de données ont été anonymisés pour protéger la confidentialité des utilisateurs. Ces ensembles de données, initialement issus de Kaggle, ont été adaptés pour cette analyse afin d'assurer l'évolutivité.

Volumétrie des données

Remarque : Une version allégée des ensembles de données originaux a été utilisée en raison des contraintes de volume.

Problème principal : Les données ont été tellement anonymisées que cela a affecté la précision et la qualité des analyses.

Lien GitHub vers les fichiers du projet
Voir le code Python du projet
Explorer l'application Streamlit

Objectifs du projet

Les principaux objectifs de ce projet étaient de :

Conclusion et recommandations

"Assurer la disponibilité des produits dans les clusters à forte demande est essentiel pour optimiser les taux de conversion."

Sur la base des résultats du clustering KMeans, le comportement des utilisateurs peut être segmenté en groupes distincts, permettant au propriétaire du site de se concentrer sur les clusters 1 et 3 pour des opportunités de vente ciblées.

Bien que la régression linéaire ait fourni des informations, sa performance prédictive était limitée pour la prévision des transactions. Des variables supplémentaires, telles que les données démographiques ou les comportements historiques, pourraient améliorer la précision du modèle.

Le modèle Isolation Forest, bien que prometteur pour la détection d'anomalies, nécessite un ajustement supplémentaire pour réduire les faux positifs. Il peut potentiellement aider à identifier des opportunités de vente croisée ou à cibler des segments d'utilisateurs spécifiques pour des activités promotionnelles.

Recommandations clés :

Pour plus de détails, vous pouvez consulter le rapport de conclusion complet ici.

Retour à l'index des projets