L’IEC actualitza el Corpus Textual Informatitzat de la Llengua Catalana

L’aplicació permet obtenir informació de textos en català publicats entre el 1832 i el 2008

El web de l’Institut d’Estudis Catalans (IEC) ha instal·lat una nova aplicació de consulta del Corpus Textual Informatitzat de la Llengua Catalana (CTILC), que permet obtenir informació a partir de textos en català publicats entre el 1832 i el 2008.

En la seva configuració inicial, el CTILC contenia 52 milions de mots i cobria el període cronològic comprès entre el 1832 i el 1988. L’any 2015, l’IEC va emprendre el projecte d’actualització del CTILC i, des d’aleshores, s’ha completat amb textos publicats fins al 2008 (uns vint milions de mots més), de manera que el Corpus consultable actualment té un volum total de 72 milions de paraules.

L’IEC preveu que a finals del 2021 s’haurà actualitzat el Corpus amb textos publicats fins al 2018. A partir d’aquest moment, s’espera portar a terme un pla de treball que permeti l’actualització permanent del CTILC.

La nova aplicació de consulta del CTILC s’integra plenament en el portal de dades lingüístiques de la Secció Filològica, i ha substituït les dues plataformes anteriors (anomenades consulta bàsica i consulta avançada, respectivament). L’accés al Corpus es pot fer directament (a través de l’adreça web ctilc.iec.cat) o bé mitjançant consultes realitzades sobre els altres recursos del portal (DIEC, DDLC, DCVB, Diccionari de sinònims, CiT i TERMCAT) clicant sobre el botó corresponent.

Els resultats de la consulta del CTILC es presenten bàsicament sota l’opció «Concordances», el patró de selecció de les quals pot ser de diferent naturalesa: lema, forma, lema (amb formes seleccionables), coocurrències (una seqüència encadenada de diferents elements lingüístics) i noms propis; també es pot obtenir informació quantitativa sobre les combinacions lèxiques que un determinat lema manté amb la resta de lemes del Corpus (opció «Col·locacions»); finalment, l’opció «dades numèriques» dona informació quantitativa sobre el volum del Corpus.

Deixa un comentari

L'adreça electrònica no es publicarà.