¿Qué es?

  CORDE es un banco de datos del español de todas las épocas y lugares, desde los inicios del idioma hasta el año 1975, en que limita con el CREA. Como la parte actual del banco de datos, CORDE recoge un conjunto de textos seleccionados y ordenados según criterios establecidos, de los que se puede extraer información léxica y gramatical.

¿Qué significa CORDE?

  CORDE quiere decir Corpus Diacrónico del Español. Un corpus diacrónico es aquel que recoge información de una lengua a lo largo de su historia.

¿Cuándo y por qué empezó?

  Al igual que CREA, CORDE comenzó en 1994, cuando, gracias al impulso del director, Fernando Lázaro Carreter, la Academia se planteó la posibilidad de aplicar las nuevas técnicas informáticas para construir un banco de datos que permitiera la consulta a todos los investigadores sin necesidad de desplazarse a la Academia para hacerlo.

¿Qué extensión tiene?

  CORDE cuenta en la actualidad con más de 60 millones de palabras, si bien su cifra total se calcula en 125 millones, cuando termine su confección, a finales del 2000. Este conjunto de palabras es suficiente para representar todas las épocas del idioma.

¿De qué está compuesto?

  CORDE recoge textos escritos de muy diferente género. Se distribuyen estos en prosa y verso y, dentro de cada modalidad, en textos narrativos, líricos, dramáticos, científico-técnicos, históricos, jurídicos, religiosos, periodísticos, etc. Se pretende recoger todas las variedades geográficas, históricas y genéricas para que el conjunto sea suficientemente representativo.

¿Cómo se elabora y actualiza?

  Como en CREA, las obras se obtienen de dos maneras: en formato electrónico y en papel; en este segundo caso, las obras pasan por un escáner con programa de reconocimiento óptico de caracteres (OCR). En los dos casos, un equipo se encarga de corregir los posibles errores y de codificar posteriormente los textos. Disponemos, además, de equipos de control de calidad que detectan posibles anomalías en la corrección o codificación de los textos.

¿Para qué se usa?

  CORDE se está empezando a utilizar ya para autorizar palabras y documentar su primera aparición. Los propios lexicógrafos de la Academia responden a consultas que llegan desde dentro y fuera de esta, con el objeto de saber si una palabra o expresión fueron de mucho uso en determinada época o país.

¿Para qué se puede usar?

  Uno de los cometidos fundamentales del corpus diacrónico será el servir de material básico para la confección del Diccionario histórico de la lengua española, que prepara la Real Academia; pero, evidentemente, las posibilidades son múltiples, ya que el corpus servirá también a cuantos investigadores necesiten documentar una palabra, frase o expresión determinadas. En el futuro será una herramienta imprescindible para la anotación de textos clásicos, y podrá servir también para la elaboración de estudios que afecten a la historia de la morfosintaxis y el léxico español. CORDE se puede convertir igualmente en una valiosa herramienta para el estudio de determinados temas nucleares a lo largo de la literatura, y para el análisis de determinados tipos de lengua especializada observada en su diacronía.