#JSS2013 Les journées SQL Server 2013 Un événement organisé par GUSS
#JSS2013 Les journées SQL Server 2013 Un événement organisé par GUSS Windows Azure HDInsight Benjamin Guinebertière – Microsoft France François Simoës – V-Traffic Sébastien Etcheverry – V-Traffic
#JSS2013 Merci à nos sponsors
#JSS2013 Introduction (3) Nouveautés HDInsight (22) – PowerShell, wasb, Templeton, Python,.NET, … – Démo V-Traffic (25) Autres utilisations dHDInsight (3) Combien ça coûte ? (3) Conclusion Plan
#JSS % Apache Hadoop solution in the cloud Insights through Excel Deployment agility Hadoop with Enterprise security and manageability Develop in.NET and Java Built on Hortonworks Data Platform (HDP) Where Big Data Meets the Cloud Get Started with HDInsight:
#JSS Hortonworks Data Platform for Windows HDInsight
#JSS2013 Architecture HDInsight Azure Blobs HDFS HivePigHCatalogAmbari Map Reduce Sqoop Oozie Azure UXAzure SDKTempletonRDP
#JSS2013 Architecture
#JSS2013 demo CRÉATION DUN CLUSTER
#JSS2013 demo POWERSHELL
#JSS2013 demo EXPLORATION DU CLUSTER Portail Windows Azure, connexion en RDP
#JSS2013 demo EXÉCUTION EN PIG ET EN HIVE IIS LOGS
#JSS2013 demo EXÉCUTION HIVE + PYTHON
#JSS2013 V-TRAFFIC
#JSS2013 Chaine de production dinformation trafic
#JSS2013 Généralités Utilisations des véhicules traceurs (FCD) - Suivi de véhicule 1. Les automobilistes envoient leurs positions lors de leurs déplacements via leur GPS et un accès à internet mobile 2. Nos fournisseurs récoltent les données de géo-localisation 3. Mediamobile collecte ces données Lat2,Long2,D2 4. Suivi du véhicule : localisation sur le réseau routier Lat1,Long1,D1 5. Détermination de la vitesse du véhicule sur le réseau X km/h
#JSS2013 Méthode SqlServer
#JSS2013 WorkFlow HDInsight
#JSS2013 demo V-TRAFFIC ANALYSE SPATIALE
#JSS2013 Utilisation de R-Tree Voies doptimisation du code Python
#JSS2013 Jeux sur Facebook: analyse de logs – Lancement en PHP – ~1 heure par jour Banque: analyse de tweets Autres utilisations dHDInsight
#JSS2013 Master Chief meets Big Data In-game analysis detects cheaters and improves experience for everyone Enables targeted campaigns that improve customer retention
Near real-time visibility into terabytes of data Able to double processing capacity in minutes Two billion minutes a day…and counting
#JSS Combien ça coûte ?
#JSS2013 Source: Exemple pour 115 / mois
#JSS2013 HDinsight – Hadoop en tant que service sur Windows Azure – Automatisable – Exécution distribuée de transformation de données (souvent des fichiers texte) – Langages de script de plus haut niveau que Map/Reduce Conclusion
#JSS2013