Notre projet

Le manuel scolaire algérien: Analyse lexicométrique des manuels de la langue française (de la 3ème A.P à la 3ème A.S)

La statistique linguistique est à l’origine de logiciels basés essentiellement sur le langage informatique Perl capables de traiter quantitativement et qualitativement un corpus textuel numérisé de grande taille en un temps record, et avec une rigueur et une exhaustivité impossibles à obtenir manuellement.


En effet, une analyse traditionnelle des neuf manuels scolaires et des documents qui s’y réfèrent- c'est-à-dire une analyse qui se passerait des outils informatiques aujourd’hui disponibles – exigerait, non seulement un travail colossal et beaucoup de temps, mais serait également sujette à des carences inévitables dans une démarche manuelle qui se proposerait d’étudier un corpus d’étendue importante. Pour avoir une idée de ce que nous venons d’affirmer, pensons au travail que demande l’élaboration
de la liste exhaustive du vocabulaire de chacun de ces manuels avec pour chaque vocable sa fréquence et sa catégorie grammaticale, objectif qui fait partie de ceux que nous nous proposons d’atteindre dans ce projet. Pensons également au relevé des environnements linguistiques de chaque vocable qui permettent de délinéariser un texte et de révéler dans quel sens il est employé.

 

Voilà donc trois opérations au moins qui prouvent que l’analyse statistique assistée par ordinateur est  aujourd’hui que les documents sont souvent numérisés - d’un apport incontestable. Ce sont ces quelques constations parmi d’autres qui nous ont poussé à privilégier l’emploi des logiciels lexicométriques comme Lexico3, Hyperbase, Alceste, Nooj, et le langage informatique Perl dans le travail que nous nous proposons de faire dans ce projet.


Ces logiciels et Perl nous permettrons tout d’abord une exploration objective et achevée du contenu de nos manuels et documents. C’est ensuite à partir de ces résultats numériques que s’élaborera notre analyse interprétative de ce contenu. Nos hypothèses de travail ne seront donc construites qu’après cette exploration. Nous n’appréhenderons pas notre corpus avec des idées préconçues, c’est le vocabulaire et ses caractéristiques numériques qui nous guideront tout au long de notre travail.