Différence entre la grammaire régulière et la grammaire sans contexte

La grammaire signifie quelque chose de très différent pour les linguistes et les programmeurs informatiques que pour la plupart des gens. Alors que la plupart d'entre nous considèrent la grammaire comme un ensemble de règles d'étiquette pour une utilisation du langage socialement acceptable, les linguistes et les programmeurs considèrent la grammaire comme quelque chose de bien plus puissant : langue ou fragment de langue. Les grammaires régulières et sans contexte sont les deux types de grammaire logiquement possibles et diffèrent l'une de l'autre par les types de règles qu'elles autorisent et les types d'expressions qu'elles peuvent produire.

Origines

Le linguiste Noam Chomsky a développé les notions de grammaires sans contexte et régulières dans son ouvrage de 1959 « Sur certaines propriétés formelles des grammaires ». Il a posé l'existence de plusieurs types de grammaire de base, qui diffèrent les uns des autres en termes de complexité des expressions linguistiques qu'ils peuvent produire. Les grammaires régulières sont plus simples et moins productives que les grammaires sans contexte.

Différence entre les règles

Les grammaires régulières et sans contexte diffèrent par les types de règles qu'elles autorisent. Les règles des grammaires sans contexte autorisent des phrases possibles sous forme de combinaisons de mots individuels non liés (que Chomsky appelle « terminaux ») et de groupes de mots (phrases, ou ce que Chomsky appelle « non-terminaux »). Les grammaires sans contexte autorisent des mots et des phrases individuels dans n'importe quel ordre et autorisent des phrases avec un nombre quelconque de mots et de phrases individuels. Les grammaires régulières, en revanche, n'autorisent que des mots individuels avec une seule phrase par phrase. De plus, les phrases des grammaires régulières doivent apparaître à la même position dans chaque phrase ou phrase générée par la grammaire.

Structures

Étant donné que les grammaires sans contexte autorisent un plus large éventail de règles que les grammaires régulières, elles peuvent générer un plus large éventail de structures que les grammaires régulières. Par exemple, ils peuvent impliquer différentes structures de phrases possibles, telles que « une fille de la ville avec des problèmes d'argent » (ici, les structures varieront selon que « avec des problèmes d'argent » décrit la ville ou la fille). Les grammaires régulières ne peuvent pas faire cela. Au contraire, elles ne peuvent générer que des expressions simples constituées de chaînes de mots uniques et structurellement indépendants et éventuellement d'une seule phrase plus grande (telle que « des gens très, très intelligents »).

Les usages

Les grammaires sans contexte sont utilisées dans le traitement du langage naturel pour générer et analyser des données linguistiques, car elles peuvent capturer de nombreuses caractéristiques déterminantes du langage humain, telles que leur potentiel pour des structures infiniment récursives. Les grammaires régulières, qui ne génèrent qu'un sous-ensemble des expressions des grammaires sans contexte, sont également utilisées pour le traitement du langage naturel. Cependant, ils ne peuvent reproduire ou traiter que des expressions linguistiques courtes et grammaticalement simples, telles que les expressions courtes que l'on trouve généralement dans les dialogues informels.