![]() |
![]() |
AgoraClass & AgoraConcordances: Recherche instantanée
|
Liminaire
L'interrogation à réaliser prend appui sur une base textuelle disponible quelque part sur la Toile ou World Wide Web sous la forme d'un fichier texte ou codifié HTML. Cette base textuelle, au format HTML, peut renfermer des éléments adventices, comme, par exemple, un titre en anglais ou une référence en langue vernaculaire à l'édition qui a servi de base à l'encodage ou au scanning; ces éléments adventices ne peuvent être séparés, à l'heure actuelle, des données textuelles faisant l'objet de la constitution des outils informatisés décrits ci-dessous. Les éléments numériques, par contre, qu'ils soient affichés tels quels ou placés entre parenthèses ou crochets, sont éliminés des outils créés.
L'adresse Web (URL) du site refermant la base textuelle constitue donc la première information à fournir ci-dessous. A titre d'exemple: Le critère de recherche peut porter sur une forme exacte (Ex.: Romulus), une partie de mot (Ex.: Romul) et même un ensemble de mots (Ex.: accepto imperio); les opérateurs booléens, par contre, ne peuvent être employés. Tant les caractères majuscules que les caractères minuscules peuvent être utilisés dans la formulation du critère de même que les (principales) lettres accentuées. La recherche en elle-même, dont le traitement est exécuté via un serveur local, produit, par défaut, deux résultats: une concordance - phrase des contextes attestant le critère de recherche suivie d'une liste du vocabulaire de la base textuelle interrogée; en décochant la case relative à la liste du vocabulaire celle-ci ne sera pas produite; cette liste est classée d'après l'ordre alphabétique des formes et elle présente aussi la fréquence d'attestation de chaque item différent recensé. En l'absence de critère de recherche formulé seule la liste du vocabulaire sera construite. Les références précises (livre, chapitre, paragraphe, ligne, etc.) n'ont pas pu être intégrées dans le traitement élaboré au vu de la grande diversité de codification de ces informations dans les fichiers d'oeuvres. Diversité dont la prise en charge aurait eu une répercussion négative sur les délais de réponse aux interrogations posées. Ces références sont prises en compte, par contre, dans le module Recherche avancée. A l'affichage des résultats les caractères majuscules des textes traités sont neutralisés. Enfin, comme les fichiers disponibles en consultation sont d'origines diverses les graphies ne sont pas normalisées partout: des v et des j peuvent voisiner avec des u et des i ; uirum, tout aussi bien que virum, par exemple, peuvent donner des résultats en réponse à une requête. De plus, les particules enclitiques n'ont pas été disjointes des formes sur lesquelles ces particules portent.
L'interrogation prend appui sur des fichiers textes disponibles en local. Il s'agit en règle générale de conglomérats de fichiers attestant l'ensemble d'une d'oeuvre d'un auteur latin. De format texte ils ne sont pas alourdis par tout le fatras HTML typique des fichiers Web. De plus, les indications ou commentaires en langue vulgaire accompagnant les textes latins ont été enlevés au préalable. Conglomérats ainsi constitués en local:
Latin chrétien:
La procédure d'interrogation est la même que celle touchant les bases textuelles disponibles sur la Toile. Cependant, l'option par défaut, à savoir la construction d'une Liste alphabétique du vocabulaire des formes n'est pas retenue ici afin d'éviter aux utilisateurs de (trop) longs délais d'attente. La deuxième fenêtre d'interrogation ci-dessous concerne ces conglomérats.
Fureteur conseillé (du moins si l'on veut obtenir la liste complète du vocabulaire): MS Internet Explorer à partir de la version 4.5. |
| Responsable académique : Alain Meurant Analyse : Jean Schumacher Design & réalisation inf. : Boris Maroutaeff Dernière mise à jour : 17 janvier 2003 |