Projet, Résumé des séances

Avancement du script tableaux et séance du 7-14 Nov

Pendant les séances du 7 et 14 Nov, nous avons continué à travailler sur le script du tableau html à partir des listes d’urls que nous avons établies sur notre thème ‘Bonheur au travail’.

Tout d’abord, nous avons complété tous les traitements reste à faire dans le programme des séances précédantes.

logique

En complétant le script du traitement, avec les colonnes ajoutés de ‘Contexte‘, ‘Index‘ , ‘Fréquence Motif‘ et ‘Context html minigrep‘, nous avons aussi ajouté des colonnes ‘Encodage Initial‘ et ‘Encodage Final‘ pour se rendre compte plus clairement quel url a été traité par iconv.

1911-01

Et puis le traitement:

1911-02

1911_10

Pour le minigrep, il faut bien vérifier le nom du répertoire utilisé et il faut définir le parametre dans le fichier motif-regexp.txt pour pouvoir construire un contexte html.

En exécutant le programme, on peut voir qu’est-ce qui se passe avec les indications ‘user-friendly’ du programme.

1911_01_Fotor

1911_02

Et puis le résultat du tableau final:

1911_03

Voici la page de ‘Dump‘:

1911_04

La page de ‘Contexte html‘:

1911_07

La page de ‘Index‘:

1911_06

La page de ‘Bigramme‘: (Comme nous traitons un syntagme qui contient 3 mots, il faut qu’on modifie la partie Bigramme, peut-être en quadramme par exemple.)

1911_08

 

Leave a comment