Abonnez-vous à Universalis pour 1 euro

CORPUS, linguistique

Articles

  • CORPUS, linguistique

    • Écrit par
    • 309 mots

    Ensemble homogène et significatif de données linguistiques observées et à partir desquelles pourra s'élaborer la théorie. La notion de corpus est évidemment fondamentale dans la linguistique structurale : désireuse de substituer à la normativité de la grammaire ou aux fondements pseudo-logiques...

  • LANGAGE ACQUISITION DU

    • Écrit par
    • 4 950 mots
    • 3 médias
    ...véritable changement d’échelle dans les pratiques de recherche. L’étude des productions des jeunes enfants repose sur deux méthodes principales, l’analyse de corpus et les questionnaires parentaux, complétées par des expériences en laboratoire de production « provoquée ». LeC.H.I.L.D.E.S. (Child Language...
  • AMÉNAGEMENT LINGUISTIQUE

    • Écrit par
    • 4 745 mots
    — l'aménagement du corpus des langues (du point de vue graphique : création d'une écriture et d'un système de transcription, changement d'un type d'écriture à un autre, etc.), du point de vue orthographique (fixation de l'orthographe, création de grammaires, mise à...
  • DISTRIBUTIONNALISME

    • Écrit par
    • 964 mots
    ...Cette méthode, exposée de façon détaillée par Zellig Harris (1909-1992) dans Methods in Structural Linguistics (1951), consiste à recueillir un « corpus » (c'est-à-dire un ensemble homogène d'énoncés considéré comme représentatif de la langue à étudier), puis à segmenter ce corpus. La technique...
  • GRAMMATICALITÉ

    • Écrit par
    • 317 mots

    Une bonne grammaire doit être capable de « projeter le corpus fini et toujours plus ou moins aléatoire des énoncés observés sur l'ensemble, qu'on présuppose infini, des phrases grammaticales », écrit N. Chomsky (Structures syntaxiques). Ce passage de l'induction à la projection...

  • HUMANITÉS NUMÉRIQUES

    • Écrit par
    • 5 371 mots
    • 2 médias
    Le jésuite italien Roberto Busa (1913-2011) est souvent considéré comme le père du domaine des humanités numériques (Jones, 2018). Dès 1949, il a lancé en partenariat avec la société IBM un projet de création d’index autour de l’œuvre de saint Thomas d’Aquin, appelé l’Index thomisticus...
  • SMS (Short Message Service) ou TEXTO

    • Écrit par
    • 1 328 mots
    La première étape, pour appréhender le phénomène nouveau que constituent les SMS, a été de recueillir des grands corpus produits en situation naturelle. Le projet européen SMS4science, sous la responsabilité de Cédrick Fairon (université catholique de Louvain, U.C.L.) a permis d’organiser cette collecte....
  • STRUCTURALISME

    • Écrit par , et
    • 24 054 mots
    • 2 médias
    ...l'objet d'une reconstruction à partir des données individuelles de la parole des sujets. Dans le structuralisme américain, par exemple, le travail sur corpus (échantillon de langue constitué d'énoncés oraux ou écrits) va devenir un enjeu de la théorie du langage et de ses méthodes. L'orientation ...