README

Este es un archivo README para el repositorio. A continuación, se describe el propósito del proyecto, cómo instalarlo y cómo utilizarlo.

Descripción

Este proyecto permite analizar expresiones regulares simples utilizando ANTLR4 y JavaScript, por medio de una gramática personalizada que reconoce expresiones como:

a|b
ab*c
(a|b)+

Requisitos Previos

Node.js: Asegúrate de tener Node.js instalado en tu sistema.
ANTLR4: Debes tener ANTLR4 instalado y correctamente configurado.
Java (JDK): Es necesario tener Java (JDK) instalado en su computadora.
GIT: Requiere tener instalado Git para poder clonar el repositorio.
Visual Studio Code: Se recomienda para editar y ejecutar el código de forma cómoda.

Instalación

Clone este repositorio utilizando el siguiente comando desde una terminal compatible con Git: git clone https://github.com/piacts/51947.git

Consideración importante al abrir el proyecto

Al descargar o clonar este repositorio, se generará una carpeta principal llamada 51947. No se recomienda abrir directamente esta carpeta en Visual Studio Code, ya que no contiene los archivos fuente del proyecto en su raíz.

En su lugar, se debe acceder a la carpeta 51947 y luego seleccionar la subcarpeta antlr-regex-project, que es donde se encuentra el proyecto propiamente dicho.

Ejecución

Archivo de Entrada: Escribí una expresión regular válida o inválida dentro del archivo input.txt. Ejemplos:

(a|b)c* (válida)
[a-z-0-9] (inválida)

Ejecutar la Aplicación: Es aconsejable esperar unos segundos para que el programa se inicialice. Luego, ejecuta el programa utilizando Node.js con el siguiente comando: node index. Para que se genere y visualice el árbol de derivación, es necesario iniciar el modo de depuración. Esto puede hacerse presionando F5 o manualmente desde Visual Studio Code, haciendo clic en el botón "Depurar". Es recomendable seleccionar el archivo con la gramática (regex.g4) primero.
Ejemplo de salida: El programa mostrará:

Una tabla con los tokens y lexemas generados por el lexer.
Una verificación de si la expresión es válida según la gramática.
Un árbol de derivación que representa la estructura sintáctica de la expresión.

✓ En el caso de un input correcto:

Tabla de tokens y lexemas:

Árbol de derivación:

✗ En el caso de un input incorrecto:

Tabla de tokens y lexemas:

Árbol de derivación:

Archivos de Ejemplo:

Para probar el programa, se pueden utilizar los ejemplos que se encuentran en los archivos de texto:

input_correcto_1.txt
input_correcto_2.txt
input_incorrecto_1.txt
input_incorrecto_2.txt

Estos archivos contienen expresiones regulares válidas e inválidas respectivamente, y sirven para verificar el funcionamiento del analizador. Se debe copiar el contenido de uno de ellos en input.txt antes de ejecutar el programa.

Acerca de la Gramática

En el archivo titulado "Reglas" se encuentra tanto la gramática original en EBNF (al final del archivo) como su correspondiente traducción al formato compatible con ANTLR. Durante este proceso de adaptación, se realizaron los siguientes ajustes:

Definición de CHAR: En lugar de usar una negación general para excluir metacaracteres (como permite EBNF), se definió explícitamente un conjunto de caracteres válidos en el token CHAR, incluyendo letras, dígitos y símbolos seleccionados: [a-zA-Z0-9_~@?#%&=<>!;,/].
Separación de tokens especiales: Los símbolos utilizados como operadores o delimitadores en la gramática (por ejemplo, '|', '-', '^', '*') se definieron como tokens independientes para facilitar el análisis y evitar ambigüedades.
Prioridad del token COMMA: Se declaró el token COMMA antes de CHAR, ya que el carácter coma también es parte del conjunto definido en CHAR. Esto evita conflictos en el análisis léxico y garantiza que , sea reconocido correctamente como separador dentro de las cuantificaciones.
Uso de class_ en lugar de class: Debido a que class es una palabra reservada en algunos lenguajes (incluido Java), se utilizó el nombre class_ para evitar conflictos en el código generado.
Reescritura de operadores opcionales y repetitivos: En ANTLR, los operadores de EBNF como [] (opcional) y {} (repetición) se tradujeron a ? y +, respectivamente, respetando la sintaxis propia del parser.
Eliminación de ambigüedad en range: Se permitió definir rangos tanto con caracteres (CHAR '-' CHAR) como con números (NUMBER '-' NUMBER) para mayor flexibilidad.

Estos cambios aseguran que la gramática sea interpretada correctamente por ANTLR y que el lexer pueda identificar los tokens de forma precisa.

Notas Adicionales

Si el archivo input.txt no existe o está vacío, el programa solicitará la expresión regular desde teclado.
Bibliografía importante: Guía de Estudio Construcción de Analizador con ANTLR4 + JavaScript.pdf
Caracteres válidos: letras (a–z, A–Z), dígitos (0–9) y los siguientes símbolos: _ ~ @ ? # % & = < > ! ; , /
Si desea probar el análisis léxico, puede ingresar un carácter inválido, como por ejemplo el símbolo "$".
No se permite el uso de secuencias de escape como \d, \w, etc., en esta versión básica.

Autor

Nombre y Apellido: Pía Cortes

Legajo: 51947

Año: 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

README

Descripción

Requisitos Previos

Instalación

Consideración importante al abrir el proyecto

Ejecución

Acerca de la Gramática

Notas Adicionales

Autor

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 41 Commits
antlr-regex-project		antlr-regex-project
README.md		README.md
Reglas.pdf		Reglas.pdf
input_correcto_1.txt		input_correcto_1.txt
input_correcto_2.txt		input_correcto_2.txt
input_incorrecto_1.txt		input_incorrecto_1.txt
input_incorrecto_2.txt		input_incorrecto_2.txt

piacts/51947

Folders and files

Latest commit

History

Repository files navigation

README

Descripción

Requisitos Previos

Instalación

Consideración importante al abrir el proyecto

Ejecución

Acerca de la Gramática

Notas Adicionales

Autor

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages