Ouvrir le fil d'info
Source : Le Figaro
Fermer le fil d'info
Fusacq Buzz - L'actualité collaborative des fusions-acquisitions
Recevez chaque matin
la synthèse de l'actualité par mail !
 
Votre compte

< Retour au fil d'actualité
Qu’est-ce que la data préparation en machine learning et comment fonctionne-t-elle ?
19 septembre 2022 à 15h06 par ATLANTIC FINANCE


ATLANTIC FINANCE

91 rue du Faubourg Saint Honoré
75008 Paris

Tél : 06 16 81 34 17

Contact (s) :
Hervé CAMUS

En machine learning, la préparation des données inclut la collecte, le nettoyage et l’organisation des data apprentissage avant leur utilisation pour l’entraînement des modèles d’IA.

Data préparation en machine learning, késako ?

La data préparation ou dataprep signifie en machine learning la préparation des données d’entraînement pour qu’elles puissent être « ingérées » par le modèle d’apprentissage. C’est une étape majeure constituée d’un certain nombre de phases préalables, allant de la collecte des données à leur validation. La phase centrale inclut le formatage des données, la rectification des erreurs qui peuvent apparaître au sein de ces informations, et leur enrichissement.

En machine learning, la data préparation consiste, à vrai dire, à travailler la qualité des données avant leur traitement. En détectant à temps les éventuelles erreurs, on parvient aussi à rectifier les biais qui risquent d’impacter négativement les résultats du modèle. En outre, on peut aussi effectuer une data préparation pour visualiser des données ou réaliser d’autres opérations d’analyse.

Quelles sont les diverses phases de la data préparation ?

Comme expliqué plus haut, la data préparation comprend plusieurs phases. Elle passe d’abord par la collecte de données et l’évaluation de celles-ci. Viennent ensuite le nettoyage et l’ajout ou la suppression de certaines valeurs, la transformation et le formatage de ces données, leur validation, et enfin leur stockage et routage.

La durée de ces phases préparatoires est en fonction du nombre et de la complexité de ces informations. Ces dernières pourront ensuite être traitées et analysées facilement et dans un court laps de temps. Il en sera de même lors des opérations analytiques fréquentes qui engendrent des flux d’entrée et de sortie constants.

Data préparation et data exploration : quelle différence ?

La data préparation englobe l’étape durant laquelle les données brutes sont transformées en données mieux organisées pour être exploitées. Elle inclut la collecte, le nettoyage et le formatage de ces données selon le traitement auxquelles on les soumettra à la prochaine étape qu’est l’exploration des données.

Comme son nom l’indique, l’exploration des données est le fait de sillonner le data set qui a été rassemblé pour faciliter sa compréhension. C’est la phase qui précède celle où on crée les tableaux de bord d’analyse décisionnels en business intelligence. C’est également l’étape d’usage du data set pour l’entraînement d’un modèle de machine learning en Intelligence Artificielle.

Quels rôles jouent les data sets d’entraînement, de validation et de test ?

On utilise le data set d’entraînement bien avant la procédure de machine learning. En effet, c’est la base d’apprentissage, comme une série de photos de chiens dans la reconnaissance d’image par exemple et dont on se sert pour entraîner le modèle. Cela va l’aider à réaliser de prédictions sur la base de nouvelles informations, c’est-à-dire, reconnaître des photos de chiens qu’il n’a pas encore ingérées dans l’exemple précédent.

Le data set de validation consiste ainsi à valider un modèle qui a été entraîné. Le processus se base sur des exemples comme les images de chiens tout à l’heure, qui ne se trouvaient pas dans le data set d’entraînement. Cette phase sert à ajuster les paramètres du modèle. Le data set de test sert ensuite à s’assurer de la performance du modèle final. C’est une étape importante qui permet de vérifier sa précision et son aptitude à ne pas faire d’erreur ni à se tromper.

Pour en savoir plus : https://www.a-finance.fr/%ef%bf%bcquest-ce-que-la-...


Partager sur facebook Partager sur twitter Icone partage sur LinkedIn


A propos de ATLANTIC FINANCE :

Conseil en Fusion Acquisition dédié au secteur IT.
ESN, Editeurs de logiciels, technologies et Internet.

Le coeur de notre activité est de vous présenter des cédants ou des acquéreurs.


La fiche complète de ATLANTIC FINANCE




En direct de Fusacq
08h13 Menuiserie - ébénisterie
Annonce de cession d'entreprise
Localisation : Bretagne
CA : 390 k€
02/07 Directeur technique - Technologie, …
CV de repreneur
Localisation : France
Apport : 1500 k€
02/07 Mécanique générale de précision
Annonce de cession d'entreprise
Localisation : Poitou-Charentes
CA : 3000 k€
02/07 Construction de piscines
Annonce de cession d'entreprise
Localisation : Région lémanique
CA : 4100 k€
02/07 BlockChain / Web 3
Annonce de cession d'entreprise
Localisation : Ile-de-France
CA : <300 k€
02/07 Plateforme de chauffage connecté
Annonce de cession d'entreprise
Localisation : Rhône-Alpes
CA : 3100 k€
02/07 Site et applications de rencontre
Annonce de cession d'entreprise
Localisation : Rhône-Alpes
CA : 390 k€
02/07 VRD, terrassement, travaux d'infras…
Annonce de cession d'entreprise
Localisation : Ile-de-France
CA : 3500 k€
02/07 Étude notariale
Annonce de cession d'entreprise
Localisation : Rhône-Alpes
CA : 920 k€
02/07 Gros oeuvre et ravalement
Annonce de cession d'entreprise
Localisation : Bourgogne
CA : 750 k€

Publicité


© Fusacq | Contact | Mentions légales | CGU | Cookies | Newsletters | RSS | Supervised by Heatmap