Arnaud Vincent: "Introduction aux concepts et outils de la linguistique de corpus pour l'analyse de données textuelles"
Description
- Langue de la formation: français
- Niveau: introduction
- Prérequis: aucun
- Domaine concerné: Sciences sociales et humaines
- Public concerné: Toute chercheuse/tout chercheur souhaitant analyser des corpus de textes
- Programme informatique principalement utilisé: Lancsbox (gratuit et libre)
- Les points suivants seront notamment abordés:
- Situer la linguistique de corpus dans le paysage du Big Data, des Digital Humanities et du Text Mining
- Construction d'un corpus (conseils, précautions, DIY corpora vs ready-made corpora)
- Collocations
- Fréquence et dispersion
- Concordances
- Extraction de keywords, N-Grams, key N-grams
- Détection de "plagiat" entre deux textes et identification d'idiolectes
- Durée: 1 journée de 9h à 16h
- Inscription obligatoire avant le 20/08/20 - voir "Inscription" ci-dessous
Informations Pratiques
Université Saint-Louis
Boulevard du Jardin botanique 38 (entrer par le parking)
Local D16 (4ème étage)
1000 Bruxelles
Écrire commentaire