En tareas de Procesamiento de Lenguaje Natural (PLN) es muy frecuente
la utilización de expresiones regulares para la detección de patrones
en texto para su posterior análisis y tratamiento. La mayoría de los
proyectos que involucra PLN utilizan los patrones a tratar mediante un
archivo de reglas externo a la aplicación. Dichas reglas generalmente
están conformadas mediante expresiones regulares. Su sintaxis es algo
difícil de recordar, debido a que los símbolos utilizados para su
construcción, generalmente no tienen un significado semejante al que
pudieran tener en lenguaje natural o en lenguajes de programación.
Para facilitar la tarea de generar las reglas y explotar a fondo el potencial de las expresiones regulares es
recomendable utilizar herramientas que permitan probar y corregir errores hasta ponerlas a punto.
Se consultaron varias herramientas informáticas que manipulan expresiones regulares: Visual RegExp v3.1
(Riesterer,
2006), Expresso v3.0 (inc., 2007), RegexBuddy3 (Goyvaerts, 2007),
Regextester (Regextester, 2007), Tester de Expresiones Regulares
(metriplica.com, 2008) y RegexPal (Levithan, 2008). Ninguna de las
herramientas consultadas obtiene la expresión regular a partir de su
representación gráfica, el autómata finito, un modelo matemático de un
sistema que recibe una cadena constituida por símbolos de un alfabeto y
determina si esa cadena pertenece al lenguaje (Hopcroft, 2001), elemento
que sería de gran utilidad en la tarea de reducir los esfuerzo
mejorando la interpretación y creación de expresiones regulares.
Ver Articulo Generación de expresiones regulares para la creación de reglas en aplicaciones de PLN
No hay comentarios:
Publicar un comentario