Lancement du Data Challenge : Kaggle : Défi IA 2023 : 1001 Nights !
Data Scientist, votre défi, si vous pouvez le relever 🙂
►La « DGCCRF » (la « répression des fraudes ») d’un pays imaginaire vient de recevoir des plaintes au sujet d’une agence de voyage en ligne.
✔️Saurez-vous décortiquer les prix de l’agence ? Et comprendre ce qui les fait varier ?
✔️ Serez-vous capable de prévoir les prix ?
Fin du défi : lundi 9 janvier 2023
Relevez le défi !
►Description
✔️La « DGCCRF » (la « répression des fraudes ») d’un pays imaginaire vient de recevoir des plaintes au sujet d’une agence de voyage en ligne.
✔️L’agence pratiquerait des prix à la tête du client et de nature à tromper les consommateurs.
✔️Une enquête approfondie est nécessaire avant de poursuivre l’agence en justice.
✔️Votre réputation de Data Scientist talentueux vous a fait obtenir un stage dans l’équipe en charge de la pré-enquête.
✔️On vous fournit de puissants moyens de calcul ainsi qu’un outil de scraping.
✔️On vous demande d’effectuer des tests, en interrogeant l’algorithme en ligne de l’agence de voyage.
✔️Afin que l’agence ne se doute de rien, votre budget en nombre de requêtes est toutefois limité.
►Règlement
✔️Fin du défi : lundi 9 janvier 2023
✔️Taille max d’une équipe : 3 personnes
✔️Jusqu’à 5 soumissions/jour
✔️Vous aurez le droit de sélectionner 2 soumissions qui seront les seules prises en compte pour le classement final
►Pour être éligible à la victoire, il faudra envoyer :
✔️Un petit rapport (3-4 pages) décrivant votre méthodo
✔️Le code utilisé pour générer vos 2 soumissions finales
✔️Le jeu de données d’entraînement brut utilisé, c-à-d avant que vous ne l’ayez transformé
✔️ Informations demandées pour s’assurer qu’aucune équipe n’a triché en partageant des données.
Saurez-vous décortiquer les prix de l’agence ?
Et comprendre ce qui les fait varier ?
Serez-vous capable de prévoir les prix ?
L’équipe compte sur vous pour soulever le capot de l’algorithme et identifier les biais qu’il comporte.
S’il y en a.
►Évaluation
Ce défi est un problème classique de régression :
✔️ll s’agit de prédire le prix d’un hôtel selon le contexte de la réservation
✔️Métrique d’évaluation : RMSE (root-mean-square error)
► Chaque soumission sera évaluée en deux parties :
✔️1ère partie : score qui sera affiché sur le leaderboard durant la compétition. C’est le score public
✔️2ème partie : score final qui servira à déterminer le classement final C’est le score privé
Vous ne pouvez pas savoir à quelle partie correspond une ligne dans le jeu de données à soumettre
►Parmi les Formations participantes
✔️Université Paul Sabatier Toulouse III, Toulouse INP-ENSIACET, Toulouse School of Economics, INSA Toulouse
✔️Insa Rennes, ENSEEIHT, ENAC – Ecole Nationale de l’Aviation Civile, Université Paris Cité, Université Gaston Berger
✔️Université Cheikh Anta Diop de Dakar (UCAD), INP Félix Félix Houphouët-Boigny (INP-HB)
✔️ENS Yaoundé (ENSPY), OpenClassrooms
► Avec le soutien de :
✔️ANITI Toulouse, Inria, Madics.fr (CNRS), AMIES (Agence Maths-Entreprises)
►Plus d’informations
► Inscrivez-vous !
________
Découvrez notre réseau !
►Pour promouvoir vos offres d’emploi, annonces, événements…
Nous vous invitons à nous envoyer sur : Contact@Big-Data-FR.com
- Toutes les informations concernant vos :
- Offres d’emploi en CDI, en particulier volumétrie
- Campagnes de recrutement, par ex : Graduate
Program, Concours Inspection Générale… - Événements recrutement : participation à des salons,
forums d’école, Job Fairs - Organisations de Job Dating, Hackathon,
concours inter-écoles…
Vous recevrez rapidement un devis détaillant les modalités de diffusion de ce type d’annonces auprès de notre réseau
+ d’informations : Contact@Big-Data-FR.com