Lingüística computacional
De Wikipedia, la enciclopedia libre
La lingüística computacional es un campo multidisciplinar de la lingüística y la informática que utiliza la informática para estudiar y tratar el lenguaje humano. Para lograrlo, intenta modelar de forma lógica el lenguaje natural desde un punto de vista computacional. Dicho modelado no se centra en ninguna de las áreas de la lingüística en particular, sino que es un campo interdisciplinar, en el que participan lingüistas, informáticos especializados en inteligencia artificial, psicólogos cognoscitivos y expertos en lógica, entre otros.
Algunas de las áreas de estudio de la lingüística computacional son:
- Corpus lingüístico asistido por ordenador.
- Diseño de analizadores sintácticos (en inglés: parser), para lenguajes naturales.
- Diseño de etiquetadores o lematizadores (en inglés: tagger), tales como el POS-tagger.
- Definición de lógicas especializadas que sirvan como fuente para el Procesamiento de Lenguajes Naturales.
- Estudio de la posible relación entre lenguajes formales y naturales.
- Traducción automática.
Tabla de contenidos |
[editar] Orígenes
La lingüística computacional surgió en los EE. UU. en los años 1950 como un esfuerzo para obtener ordenadores capaces de traducir textos automáticamente de lenguas extranjeras al inglés, particularmente de revistas científicas rusas. Cuando la inteligencia artificial apareció en la década de los sesenta, la lingüística computacional se convirtió en una rama de la IA, tratando con el nivel de comprensión humano y la producción de los lenguajes naturales.
Para traducir un lenguaje en otro, se observó que uno tenía que entender la sintaxis de ambos lenguajes, al menos en el nivel de morfología (la sintaxis de las palabras) y las frases enteras. Para entender la sintaxis, uno debe entender la semántica del vocabulario y la pragmática del lenguaje. Lo que empezó como un esfuerzo para traducir textos se convirtió en una disciplina encargada de entender cómo representar y procesar el lenguaje natural individual usando ordenadores.
Este tipo de estudios se conocen también como lingüística de corpus, ya que la denominación "computacional" puede prestarse a confusión.
[editar] Ramas de estudio
La lingüística computacional se ha dividido en dos ramas:
[editar] Lingüística computacional teórica
Basa sus temas de trabajo en la lingüística teórica y en la ciencia cognitiva. Las aportaciones de la psicología cognitiva, en especial de la psicolingüística, también son de especial relevancia, lo que se ha tenido como consecuencia la aparición de una nueva ciencia, la psicolingüística computacional.
Su objetivo es dar una explicación del funcionamiento del lenguaje en alguno de sus niveles: fonético, morfológico, sintáctico, semántico, pragmático, etc.
[editar] La lingüística computacional aplicada
Es una vertiente de la lingüística computacional con una evidente orientación tecnológica, lo que ha provocado que con frecuencia nos refiramos a ella con nombres como ingeniería lingüística o tecnología del lenguaje humano. Se centra en los aspectos prácticos que se puedan derivar de la simulación de la conducta lingüística con medios informáticos.
Su objetivo es crear productos informáticos que incorporen algún componente en el que intervenga el lenguaje, oral o escrito.
[editar] Aplicaciones de lingüística computacional
- Analizador sintáctico
- Analizador morfológico
- Analizador semántico
- Alineador
- Conjugador
- Conversor de lenguajes
- Corpus lingüístico
- Corrector ortográfico
- Desambiguador funcional
- Flexionador
- Lematizador
- Motor de indexación = Motor de indización
[editar] Véase también
- Gestor lexicográfico
- Gestor terminológico
- Gestor de tesauros
- Procesamiento de lenguaje natural
- Sistemas de traducción asistida por ordenador
- memorias de traducción.
- Traducción automática
- Ordenador pizarra
[editar] Enlaces externos
- Grupo de Estructuras de Datos y Lingüística Computacional
- Seminario de Lingüística Informática (SLI) del departamento de lingüística de la Universidad de Vigo (mayormente en gallego)
- Natural Language Computing and Generative Grammar in Prolog (libro electrónico en inglés)
- Sistema de Aprendizaje Experimental (www.ergocortex.com)