jeudi 8 novembre 2012

Data Mining Technology


Des outils d'exploration de données sont utilisés pour juger les tendances futures et les comportements qui permettent aux entreprises de prendre connaissance entraînés, des décisions proactives. Le data mining automatisé fournit, analyse prospective geste qui laisse derrière lui les analyses des événements passés fournis par des outils rétrospectifs des systèmes d'aide à la décision. Outils de data mining peuvent répondre à des questions qui ont été longs à résoudre. Ils cherchent des bases de données pour des motifs cachés et trouver l'information prédictive que les experts peuvent manquer.

Techniques d'exploration de données peuvent être mises en œuvre rapidement sur le matériel existant et plates-formes logicielles pour augmenter la valeur des ressources d'information existantes et il peut être facilement intégré avec de nouveaux produits et systèmes.

Comment l'exploration de données Works

1) Préparation de l'information:

Les données doivent être bien organisé pour le traitement efficace de l'information. Dans l'exploration de données, 70 pour cent à 80 pour cent du temps est consacré à trier et résumer les informations avant de réellement commencer efforts de déminage. Les données sont établies sur la base des objectifs information souhaitée.

2) Modélisation:

Modèle est créé en fonction de nombreux facteurs tels que la taille de base de données, le nombre de variables connues et quel type d'algorithmes d'exploration de données pour être utilisés. Les modèles réussis aider les entreprises à étudier et à identifier efficacement leur marché cible. Modèles d'exploration de données sont conçus contre les entrepôts de données de transactions massives de détail de 10 To à 20 To. Ces modèles sont souvent utilisés comme extrémité avant par les capacités de segmentation intelligente pour permettre la dérivation des segments de clientèle action.

3) Les clients de notation:

La meilleure façon d'accéder à la viabilité des modèles est de le tester contre un ensemble de données existantes lorsque la réponse à une question particulière est déjà connu. Score est la sortie d'un modèle, qui est compris entre 0 et 1, la probabilité de réponse à une question spécifique.

4) Notation dynamique:

Dans ce un processus de notation est déterminée par une autre application avec l'objectif d'utiliser ce score pour d'autres fins. Pour obtenir des résultats à jour et en éliminant la nécessité de marquer une base de données entière, sous-ensembles de disques ne sont nécessaires marqué.

Champ d'application du Data Mining

L'exploration de données gagne son nom des similitudes entre la recherche d'informations commerciales utiles dans une grande base de données. Data mining trouve des informations exactes soit tamisage à travers une immense quantité de matériel ou intelligemment sondage. La technologie de data mining peuvent générer de nouvelles opportunités commerciales en fournissant à ces installations:

1) la prévision automatisée des tendances et des comportements:

L'exploration de données détecte automatiquement les informations prédictives de grandes bases de données. Les questions qui nécessitent une analyse approfondie peut maintenant répondre directement à partir des données rapidement. Problème de prédiction est un exemple typique de marketing ciblé. L'exploration de données utilise des données sur les envois passés afin d'identifier les objectifs et fournir maximiser le retour sur investissement dans les futurs envois.

2) la découverte automatique des modèles jusque-là inconnues:

Données des bases de données minières Outils de recherche et d'identifier les tendances précédemment cachées en une seule étape. Découverte de motifs est par exemple de l'analyse des données sur les ventes au détail pour identifier les produits apparemment sans rapport qui sont souvent achetés ensemble.

Outils de data mining peuvent analyser les bases de données massives en quelques minutes si ces outils sont mis en œuvre sur des systèmes à hautes performances de traitement en parallèle. Un traitement plus rapide permet aux utilisateurs d'expérimenter automatiquement par des modèles plus pour comprendre des données complexes.

Bases de données peut être plus grand dans la profondeur et la largeur:

a) Le nombre de colonnes: Les analystes doivent offrir un service limité le nombre de variables lors de l'analyse en raison de contraintes de temps. L'exploration de données permet aux utilisateurs d'explorer toute la profondeur d'une base de données sans avoir à sélectionner un sous-ensemble de variables.

b) Autres lignes: des échantillons plus grands pour subir le moins d'erreurs d'estimation, la variance et permettent aux utilisateurs de faire des inférences sur de petits segments importants de la population.

Les techniques les plus couramment utilisés dans l'exploration de données sont les suivantes:

i) Réseaux de neurones artificiels: il fournit des modèles non-linéaires prédictifs qui apprennent par la formation et ressemblent à des réseaux de neurones biologiques dans la structure.

Les arbres de décision II): Il est en forme d'arbre structures qui représentent des ensembles de décisions. Cet arbre de décision génère des règles pour le classement d'un ensemble de données. Certaines méthodes d'arbres de décision comprennent arbres de classification et de régression (CART).

iii) Les algorithmes génétiques: il offre des techniques d'optimisation qui utilisent processus comme la combinaison génétique, la mutation et la sélection naturelle dans une conception basée sur les concepts de l'évolution.

l'induction iv règle): Utile si-alors les règles sont basées sur la signification statistique.

Architecture for Data Mining

Le data mining est totalement intégré à un entrepôt de données et des outils d'analyse interactifs flexibles d'affaires. De nombreux outils de data mining travaillent actuellement en dehors de l'entrepôt de données et nécessite des étapes supplémentaires pour l'importation, l'extraction et l'analyse des données. Alors que la nouvelle approche nécessite la mise en œuvre opérationnelle, l'intégration avec l'entrepôt simplifie l'application de data mining. Le résultat analytique entrepôt de données peuvent être utiles pour améliorer les processus d'affaires dans toute l'organisation dans la gestion des campagnes promotionnelles, lancement de nouveaux produits et la détection des fraudes.

Entrepôt de données est le point de départ idéal contenant une combinaison de données interne de suivi tout contact client couplé aux données de marché externes au sujet de l'activité des concurrents. Pour des informations générales sur la prospection des clients potentiels constitue une excellente base. Cet entrepôt peut être mis en œuvre dans Sybase, Oracle, Redbrick, et ainsi de suite, et doit être optimisé pour l'accès aux données flexible et rapide.

Lorsque vous naviguez dans l'entrepôt de données d'une OLAP (On-Line Analytical Processing) serveur permet un modèle d'entreprise plus sophistiquée de l'utilisateur final. Ces structures multidimensionnelles permettent à l'utilisateur d'analyser les données selon leur point de vue. Le serveur de Data Mining est entièrement intégré à l'entrepôt de données et le serveur OLAP à intégrer l'analyse du ROI entreprise ciblée. Modèle de métadonnées qui est centrée sur les processus définit les objectifs d'exploration de données pour les questions commerciales spécifiques tels que la gestion des campagnes, de la prospection et de l'optimisation de promotion. Intégration avec l'entrepôt de données permet des décisions opérationnelles doivent être directement mises en œuvre et suivies. Avec de nouvelles décisions et les résultats de l'entrepôt se développe et que l'organisation peut exploiter en permanence les meilleures pratiques et les appliquer aux décisions futures.

Applications

Zones de données d'applications minières sont les suivants:

1) Une entreprise pharmaceutique peut examiner son activité récente force de vente et leurs résultats afin d'améliorer les activités de marketing qui aura le plus d'impact dans les prochains mois. Les données doivent inclure des informations sur les systèmes locaux de soins de santé ainsi que l'activité du marché concurrent. En utilisant un réseau étendu, les résultats peuvent être distribués à la force de vente qui permet aux représentants d'examiner les recommandations du point de vue des principales caractéristiques du processus de décision. Cette analyse dynamique de l'entrepôt de données permet meilleures pratiques observées dans l'organisation à appliquer dans des situations particulières de vente.

2) La société de carte de crédit peut forcer son vaste entrepôt de données de transaction des clients pour identifier les clients d'être intéressés par un produit nouveau crédit. L'utilisation d'un envoi d'essai petit peut identifier les attributs des clients ayant une affinité pour le produit.

3) Un gros paquet de biens de consommation société applique exploration de données afin d'améliorer son processus de vente de ses distributeurs. Les données recueillies à partir des panels de consommateurs, les expéditions et activités concurrent peut être utilisée pour déterminer les raisons de la marque et de commutation magasin. En utilisant cette analyse, le fabricant sélectionner les meilleures stratégies qui atteignent leurs segments de clientèle cible....

Aucun commentaire:

Enregistrer un commentaire