Abonnez-vous à Universalis pour 1 euro

BIG DATA

Le futur du big data

Le big data offre d’énormes perspectives. Il a permis au monde scientifique de dénouer des problèmes non résolus jusqu’alors (mise en évidence du boson de Higgs en physique ; métagénomique en bio-informatique), aux groupes politiques de dresser des cartes électorales extrêmement précises (par exemple lors de la réélection en 2012 du président des États-Unis Barack Obama) et aux entreprises commerciales de devenir les « nouveaux devins » capables d’anticiper sans erreur des phénomènes socioéconomiques et d’en profiter.

Cependant, le big data nécessite une infrastructure très lourde qui le réserve aujourd’hui à quelques États et groupes commerciaux privilégiés. L’écosystème qui en résulte est aux mains d’une poignée d’acteurs du secteur des technologies de l’information, ce qui soulève de nombreux problèmes éthiques en termes de vie privée et d’utilisation abusive de profils.

Le big data n’en est qu’à ses balbutiements et le volume de données générées évolue beaucoup plus vite que la recherche dans ce domaine. Pour accompagner cette évolution, une modification profonde des principes et outils de modélisation de données et des langages informatiques permettant d’interroger ces modèles de données (langage de requête) devient nécessaire. Au-delà de ce qu’il est possible de décrire dans ces modèles, il faudra s’accorder sur une représentation interdisciplinaire des données communes, sur la manière d’ajouter des métadonnées relatives à une discipline spécifique, considérer la provenance, la véracité et le contexte dans lequel les données ont été acquises et accepter une certaine marge d’erreur. Autrement dit, tout ce qui permet d’associer une qualité objective et non biaisée à la donnée. Toutes ces évolutions impliquent la création de nombreux métiers autour du big data.

— François PÊCHEUX

La suite de cet article est accessible aux abonnés

  • Des contenus variés, complets et fiables
  • Accessible sur tous les écrans
  • Pas de publicité

Découvrez nos offres

Déjà abonné ? Se connecter

Écrit par

Classification

Médias

Centre de données - crédits : Google

Centre de données

Apprentissage supervisé - crédits : Encyclopædia Universalis France

Apprentissage supervisé

Apprentissage non supervisé - crédits : Encyclopædia Universalis France

Apprentissage non supervisé

Autres références

  • APPRENTISSAGE PROFOND ou DEEP LEARNING

    • Écrit par
    • 2 645 mots
    • 1 média
    L’apprentissage supervisé recourt à des techniques variées fondées sur la logique ou la statistique et s’inspirant de modèles psychologiques, physiologiques ou éthologiques. Parmi celles-ci, des techniques anciennes reposant sur un modèle très approximatif du tissu cérébral – les réseaux...
  • CARTOGRAPHIE CELLULAIRE DU CERVEAU

    • Écrit par
    • 2 990 mots
    • 1 média
    big data. Dans tous les cas, l’alignement des bases de données hétérogènes, dynamiques, utilisées et alimentées en ligne en continu, est réalisé en établissant des correspondances entre des ensembles distincts.
  • CONSOMMATION - Comportement du consommateur

    • Écrit par et
    • 9 030 mots
    • 1 média

    Par « comportement du consommateur », on entend l'ensemble des comportements qui se rapportent à l'acquisition de biens et services. On y inclut l’exposition à des messages commerciaux et à d’autres types d’information, l'expérience de l’utilisation des biens et services achetés et l'abandon éventuel...

  • HISTOIRE GLOBALE

    • Écrit par
    • 5 932 mots
    • 1 média
    La montée en puissance des ressources en données massives (big data) et de leur possibilité de traitement approfondit cette fracture méthodologique. Le Collaborative for Historical Information and Analysis (CHIA, fondé en 2011, université de Pittsburgh), le projet Pulotu (Database of Pacific Religions),...
  • Afficher les 8 références