La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Mission : qualité et productivité de vos développement s.NET 70 experts.Net et SQL Server Pôles dexpertise Génie Logiciel Visual Studio Team System Travail.

Présentations similaires


Présentation au sujet: "Mission : qualité et productivité de vos développement s.NET 70 experts.Net et SQL Server Pôles dexpertise Génie Logiciel Visual Studio Team System Travail."— Transcription de la présentation:

1

2 Mission : qualité et productivité de vos développement s.NET 70 experts.Net et SQL Server Pôles dexpertise Génie Logiciel Visual Studio Team System Travail collaboratif Sharepoint & Office Server 2007 Data management Microsoft SQL Server 2005 Smart client Vista, WPF, Ajax, Applications mobiles EAI et BPM Microsoft Biztalk 2006, Architectures SOA Winsight : No1 de la Business Intelligence MS Microsoft Analysis Services 1 er centre de formation.NET à Paris et en France depuis 2002 Conseil, forfait, assistance, formation : Winwise, 16 rue Gaillon PARIS

3 Exemples et domaines dapplication Place et perspectives dans la B.I. Principaux algorithmes danalyse prédictive Segmentation automatique (clustering) Autres algorithmes Langages et interfaces de programmation

4 Principal emploi « Analyse prédictive » Utiliser linformation que lon a pour prédire celle que lon voudrait avoir

5 Meteo ! Achètera ou pas (« score dappétence ») ? Remboursera ou pas (« credit scoring ») ? + =>

6

7 Système dinformation de lentreprise ExécutionPilotage Applications de production Analyse automatique Applications décisionnelles (« BI ») Restitution Analyse guidée Reporting - OLAPData Mining Interactif (pour analyse) Statique (pour info)

8 Objectif identique : extraire de linformation utile des données existantes lOLAP met laccent sur les outils de visualisation vs le data mining sur les outils de modélisation lOLAP donne les moyens de se faire une idée vs le data mining génère, teste et applique automatiquement les hypothèses

9 Domaines dorigine <= Intelligence artificielle <= Statistiques <= Bases de données KDD : Knowledge Discovery in Databases => Générer et valider automatiquement de nouvelles hypothèses à partir de données existantes => Transformer les données enfouies dans ses bases de données en information utile

10 Compliqué ou pas ? SQL Server 2005 OLAP Reports (Adhoc) Reports (static) Data Mining Simple Complicated Usability Relative business value

11 Modèle entraîné Structure & paramètre du modèle Mining Process DM Engine Echantillon dapprentissage Données à prédire (à scorer) Modèle entraîné With predictions

12

13 De linformation…

14 Tous types dinformations !

15 Des questions auxquelles je souhaite répondre…. Quelles combinaisons de caractéristiques distinguent les utilisateurs prêts à payer ? Quest-ce qui permet de deviner les utilisateurs qui seront populaires ? Les casse-pieds ? Les tricheurs ? Pour un utilisateur donné..quels utilisateurs sentendront le mieux avec lui?

16 La question pour notre démo : « Adam ou Eve » ?

17

18

19

20

21 Combien de couches cachées ? Combien de neurones par couche ? Aime les cartes routières Aime la danse Aime léquitation Femme Homme

22

23 Théorème de Bayes Probabilité de lhypothèse h sachant e h = hypothèse h = hypothèse e = « evidence » en anglais e = « evidence » en anglais Raisonnement inversé Raisonnement inversé au lieu de calculer la probabilité dobserver lévènement e en tenant pour admise lhypothèse h... (daprès mon hypothèse...il devrait se passer ceci) au lieu de calculer la probabilité dobserver lévènement e en tenant pour admise lhypothèse h... (daprès mon hypothèse...il devrait se passer ceci)...on calcule la probabilité que lhypothèse soit juste, connaissant la probabilité de lévènement observé...on calcule la probabilité que lhypothèse soit juste, connaissant la probabilité de lévènement observé (si si !)

24 eh x1x1 x2x2 x4x4 x3x3 x5x5 x6x6 x7x7 Ce que lon vient de voirUn réseau bayésien La probabilité dobserver létat e dépend de mon hypothèse h ET Ma croyance dans lhypothèse h est plus ou moins confortée par lobservation de e Ma croyance en h conditionne ma croyance en e et réciproquement p(h |e) ? p(e |h) ? Cest un réseau de croyance, dont chacune est influencée par les autres (aussi bien en amont quen aval)

25

26

27

28

29

30

31

32 CSP+ Masculin études supérieures non lecteurs Culture opéra, baroque voile, lecture hip-hop/rap gendarmes-douaniers jeunes foot mode

33 Autre utilisation Détecter les questionnaires remplis au hasard

34 Un algorithme simple adapté aux volumes élevés Deux indicateurs pour apprécier une association A => B Niveau de confiance Nombre doccurrences de (A ET B) divisé par le nombre doccurrences total de B Mesure la force dune association Niveau de support Nombre doccurrence et A ET B divisé par le nombre total de « transactions » considérées

35

36 Corrélation et auto corrélation Demande des tendances biens établies !

37 Putting Data Mining to Work Doing Data Mining Business Understanding Data Understanding Data Preparation ModelingEvaluationDeployment Data Data Mining Process CRISP-DM

38 Pour utiliser le data mining dans SQL 2005 Le SGBD lui-même (facultatif) : stockage des données Integration Services (facultatif) : ETL, préparation des données, text mining Analysis Services : paramétrage des modèles et exécution des analyses Reporting Services (facultatif) : publication et mise en forme du résultat des analyses Outils de développement SQL 2005 Business Intelligence Dev. Studio, SQL Server Management Studio Langages, API, librairies daccès clientes, protocole DMX ? ADOMD.NET ? XMLA ?

39 using Microsoft.AnalysisServices.AdomdClient; AdomdConnection conn = new AdomdConnection(); conn.ConnectionString = "Data Source=localhost; Initial Catalog=MyCatalog"; conn.Open(); foreach (MiningModel model in conn.MiningModels) {Console.WriteLine(model.Name);} foreach (MiningContentNode node in model.Content) foreach (MiningContentNode node in model.Content){ foreach( MiningContentNode in node.Children ) {...}}

40 ADOMD.Net et DMX Dim cmd as ADOMD.Command Dim reader as ADOMD.DataReader Cmd.Connection = conn Set reader = Cmd.ExecuteReader(Select Predict(AdamOuEve)…)

41 DMX Data Mining eXtensions for SQL Deux types de directive Data definition statements CREATE/DROP MINING MODEL EXPORT, etc. … Data manipulation statements SELECT FROM SELECT FROM SELECT FROM.CONTENT...

42 Data Mining Management System (DMMS) Mining Model Définir un modèle CREATE MINING MODEL …. Entrainer un modèle INSERT INTO dmm …. Training Data Prédire avec un modèle SELECT … FROM dmm PREDICTION JOIN … Prediction Input Data

43 DMX SELECT Elements SELECT SELECT FROM FROM PREDICTION JOIN PREDICTION JOIN ON ON [WHERE ] [ORDER BY ]

44

45 ...

46 Analysis Server Stored Procedure Adomd Server Application ADOMD ADOMD.NET AMO IIS TCP HTTP XMLA OLEDB Option zero footprint : depuis une application Ajax si vous le souhaitez !

47 Simplicité dutilisation extrême Retour sur investissement simple à évaluer (et souvent important !) Accède aux données quel que soit la source et le format Langages et API usuels (VB,C#,SQL,ADO...) Interrogeable et configurable intégralement par web services via XMLA

48 © 2007 Microsoft France Votre potentiel, notre passion TM


Télécharger ppt "Mission : qualité et productivité de vos développement s.NET 70 experts.Net et SQL Server Pôles dexpertise Génie Logiciel Visual Studio Team System Travail."

Présentations similaires


Annonces Google