in ,

Présentation de WEKA

Cet article fait parti de la série Data mining avec weka ( 2 / 8 )

Généralités

Weka (Waikato Environment for Knowledge Analysis) est un ensemble d’outils permettant de manipuler et d’analyser des fichiers de données, implémentant la plupart des algorithmes d’intelligence artificielle, entre autres, les arbres de décision et les réseaux de neurones. Les algorithmes peuvent être appliqués directement à un ensemble de données ou appelés à partir d’un code Java. Il est également bien adapté au développement de nouveaux modèles de Machine Learning. Weka est utilisé dans divers domaines comme dans la recherche, l’éducation et même les entreprises [8].

Weka est un logiciel open source publié sous licence publique générale GNU. Il a été développé à l’Université de Waikato en Nouvelle-Zélande.

Weka est extensible et est devenu une collection d’algorithmes d’apprentissage automatique pour résoudre les problèmes d’exploration de données dans le monde réel. Il est écrit en Java et fonctionne sur presque toutes les plateformes. Il est facile à utiliser et à appliquer sur plusieurs niveaux différents. Il est possible d’accéder à la bibliothèque de classes Weka à partir d’un programme Java et implémenter de nouveaux algorithmes d’apprentissage automatique.

Il se compose principalement :

  • De classes Java permettant de charger et de manipuler les données.
  • De classes pour les principaux algorithmes de classification supervisée ou non supervisée.
  • D’outils de sélection d’attributs, de statistiques sur ces attributs.
  • De classes permettant de visualiser les résultats.

On peut l’utiliser à trois niveaux :

  • Via l’interface graphique, pour charger un fichier de données, lui appliquer un algorithme, vérifier son efficacité.
  • Invoquer un algorithme sur la ligne de commande.
  • Utiliser les classes définies dans ses propres programmes pour créer d’autres méthodes, implémenter d’autres algorithmes, comparer ou combiner plusieurs méthodes.

La figure 1 montre le logo du logiciel Weka.

Résultat de recherche d'images pour "weka description francais"

Figure 1. Logo de Weka

 

Historique

Le nom Weka provient d’une espèce d’oiseau endémique de la Nouvelle-Zélande. Le Weka présente la particularité d’être incapable de voler.

La figure 2 représente l’oiseau Weka.


Figure 2. Oiseau Weka

  • 1993, Développement de la version originale en C ;
  • 1997, Re-développement à partir de zéro en Java ;
  • 2005, Weka reçoit le SIG KDD award ;
  • 2006, Pentaho Corporation acquiert une licence exclusive.

Format d’entrée

Le format d’entrée par défaut de Weka est le format ARFF (Attribute Relation File Format). Mais il prend en charge aussi d’autres formats : CSV, JSON, fichiers Matlab, BSI, les bases de données utilisant ODBC, etc.


 

Navigation<< Présentation générale du Data MiningDescription de WEKA >>

What do you think?

23 points
Upvote Downvote

commentaires

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Chargement & hellip;

Présentation générale du Data Mining

Description de WEKA