Se trataría de generar un proyecto de Big data en donde se extraiga información relevante de la gran cantidad de tesis realizadas a lo largo de la historia de @filosunam. Ello implicaría conocer tendencias históricas -temas, problemas circunstancias- en la producción del conocimiento en la @filosunam.
La Biblioteca “Samuel Ramos” (BSM) cuenta con el respaldo de archivos .pdf de las tesis entregadas desde el 2009. La DGB cuenta con la base histórica de datos de la @filosunam. Otras más antiguas deben ser escaneadas.
Objetivos
- Generar un proceso de conversión del formato pdf en que se encuentra el acervo de tesis digitalizadas de la BSM a formato xml-tei
- Producir una biblioteca xml-tei con las tesis digitalizadas
- Generar un plataforma para editar y marcar los archivos xml-tei de las tesis digitalizadas
- Planear la manera de extraer y mostrar los datos y la información de la biblioteca xml-tei de las tesis digitalizadas
- Producir visualizaciones con los datos y la información extraída de la biblioteca xml-tei
(La imagen es tomada de acá)
Desarrollo
- Generación de equipo de trabajo
- Planificación del proceso de conversión
- Planificación y construcción de plataforma para editar y marcar los archivos xml-tei
- Planeación de extracción de datos de los archivos xml-tei
- Generación de visualizaciones
- Servicio social para el proyecto
Productos
- Proceso de conversión
- Biblioteca de archivos xml-tei
- Plataforma y procedimiento de marcado
- Proceso de extracción de datos
- Visualizaciones
*La propuesta de proyecto se planeó en relación con las labores que realizo en la Secretaría Académica de la Facultad de Filosofía y Letras, UNAM. La pongo aquí como una muestra de lo que se podría realizar como proyecto final de dos años del seminario.
Comparte este artículo
Comentarios recientes