Implementación de una técnica de estadística multivariada a una base de datos sobre la prueba SABER 11.

dc.contributor.advisorRendón Mayorga, César Guillermospa
dc.contributor.authorBorda Muñoz, Andrés Hernando
dc.date.accessioned2025-08-29T19:51:59Z
dc.date.available2025-08-29T19:51:59Z
dc.date.issued2025
dc.description.abstractEn este trabajo de grado se presentan los resultados de la implementación de las técnicas multivariadas análisis de componentes principales (PCA por sus siglas en inglés) y análisis de clusters (k-means) a una base de datos de las pruebas educativas SABER-11. Las técnicas implementadas en Python mediante el entorno de desarrollo de Google Colab, identificarón tres clusters de estudiantes (Bajo, Medio y Alto rendimiento) definidos por sus puntajes y características socioeconómicas como el acceso a internet y el estrato. Se concluye que estas técnicas son efectivas para segmentar y comprender la estructura de los datos de pruebas estandarizadas, revelando perfiles de rendimiento diferenciados.spa
dc.description.abstractenglishIn this thesis, the results of implementing multivariate techniques of principal component analysis (PCA) and cluster analysis (k-means) on a database of SABER-11 educational tests are presented. The techniques implemented in Python using the Google Colab development environment, identified three student clusters (Low, Medium, and High performance) defined by their scores and socioeconomic characteristics such as internet access and socioeconomic stratum. It is concluded that these techniques are effective for segmenting and understanding the structure of standardized test data, revealing differentiated performance profiles.eng
dc.description.degreelevelPregradospa
dc.description.degreenameLicenciado en Matemáticasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameinstname:Universidad Pedagógica Nacionalspa
dc.identifier.reponamereponame: Repositorio Institucional UPNspa
dc.identifier.repourlrepourl: http://repositorio.pedagogica.edu.co/
dc.identifier.urihttp://hdl.handle.net/20.500.12209/21426
dc.language.isospaspa
dc.publisherUniversidad Pedagógica Nacionalspa
dc.publisher.facultyFacultad de Ciencia y Tecnologíaspa
dc.publisher.programLicenciatura en Matemáticasspa
dc.relation.referencesAlbornoz, M., Cotes, D., & Rivera, D. (2022). Informe N3 Análisis de componente principal. RPubs. https://rpubs.com/MikeyVega/Informe3spa
dc.relation.referencesBolaños, L. (2020). Anális Factorial. RPubs. https://rpubs.com/luis_bolanos/FAspa
dc.relation.referencesCattell, R. B. (1966). The scree test for the number of factors. Multivariate Behavioral Research, 1(2), 245–276. https://doi.org/10.1207/s15327906mbr0102_10spa
dc.relation.referencesChica, S., Galvis, D., Ramírez, A. (2012, May 30). Determinantes del rendimiento académico en Colombia. Pruebas ICFES - Saber 11o, 2009*. Revista Universidad EAFIT. https://publicaciones.eafit.edu.co/index.php/revista-universidad-eafit/article/view/754spa
dc.relation.referencesDavies, D. L., Bouldin, D. W. (1979). A cluster separation measure. IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-1(2), 224–227. https://doi.org/10.1109/tpami.1979.4766909spa
dc.relation.referencesDiaz Monroy, L. G. (2007). Estadística multivariada: Inferencia y métodos. Departamento de Estadística, Facultad de Ciencias, Universidad Nacional de Colombia.spa
dc.relation.referencesDiaz Monroy, L. G., Morales Rivera, M. A. (2012). Análisis Estadístico de Datos Multivariados. Universidad Nacional de Colombia.spa
dc.relation.referencesFacultad de de Ciencias UNAL-MED. (2014). Clase 16. Parte 1. Valores y vectores propios. Universidad Nacional de Colombia - Sede Medellín. https://ciencias.medellin.unal.edu.co/cursos/algebra-lineal/clases/8-clases/121-clase-16- parte1.htmlspa
dc.relation.referencesGallardo. (2011). Métodos Jerárquicos de Análisis Cluster. Universidad de Granada. http://www.ugr.es/gallardo/pdf/cluster-3.pdfspa
dc.relation.referencesGeeksforGeeks. (2025, April 2). Elbow method for optimal value of K in kmeans. https://www.geeksforgeeks.org/machine-learning/elbow-method-for-optimal-value-of-k-in- kmeans/spa
dc.relation.referencesHastie, T., Tibshirani, R., Friedman, J. (2009). The elements of statistical learning data mining, Inference, and prediction (2nd ed.). Springer New York.spa
dc.relation.referencesHotelling, H. (1933). Analysis of a complex of statistical variables into principal compo- nents. Journal of Educational Psychology, 24(6), 417–441. https://doi.org/10.1037/h0071325spa
dc.relation.referencesICFES. (2025, March 27). Acerca del examen Saber 11°. Instituto Colombiano para la Evaluación de la Educación - ICFES. https://www.icfes.gov.co/spa
dc.relation.referencesJolliffe, I. T., Cadima, J. (2016). Principal component analysis: A review and recent developments. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 374(2065), 20150202. https://doi.org/10.1098/rsta.2015.0202spa
dc.relation.referencesKaiser, H. F. (1960). The application of electronic computers to Factor Analysis. Edu- cational and Psychological Measurement, 20(1), 141–151. https://doi.org/10.1177/001316446002000116spa
dc.relation.referencesLEE. (2024). Informe 92: Pruebas Saber 11: una década de análisis (Abril 2024). La- boratorio de Economía de la Educación (LEE) de la Pontificia Universidad Javeriana. https://lee.javeriana.edu.co/w/lee-informe-92spa
dc.relation.referencesMacQueen, J. (1967). Some methods for classification and analysis of multivariate observations. Semantic Scholar. https://www.semanticscholar.org/paper/Some-methods-for-classification-and-analysis- of-MacQueen/ac8ab51a86f1a9ae74dd0e4576d1a019f5e654edspa
dc.relation.referencesMarden, J. I. (2015). Multivariate statistics: Old school. https://people.stat.sc.edu/hansont/stat730/Marden2013.pdfspa
dc.relation.referencesMardia, K. V., Kent, J. T., & Bibby, J. M. (1980). Multivariate analysis. Academic Press.spa
dc.relation.referencesMicrosoft. (2025). ¿Qué es la ciencia de datos? cómo convertirte en un científico de datos. Microsoft Azure. https://azure.microsoft.com/es-es/resources/cloud-computing-dictionary/what-is-data- sciencespa
dc.relation.referencesMin-Educación. (2022). Pruebas saber. Portal MEN. https://www.mineducacion.gov.co/spa
dc.relation.referencesMIN-TIC. (2025). Datos Abiertos Colombia. Ministerio de Tecnologías de la Informa- ción y las Comunicaciones. https://www.datos.gov.co/spa
dc.relation.referencesPoole, D. (2006). Algebra Lineal - Una Introduccion Moderna. Cengage Learning Edi- tores S.A.spa
dc.relation.referencesRamírez, L. (2024). Algoritmo K-means: ¿Qué es y cómo funciona?. IEBS Biztech School. https://www.iebschool.com/hub/algoritmo-k-means-que-es-y-como-funciona-big-data/spa
dc.relation.referencesRencher, A. C., Christensen, W. F. (2012). Methods of multivariate analysis. Wiley.spa
dc.relation.referencesRousseeuw, P. J. (1987). Silhouettes: A graphical aid to the interpretation and valida- tion of cluster analysis. Journal of Computational and Applied Mathematics, 20, 53–65. https://doi.org/10.1016/0377-0427(87)90125-7spa
dc.relation.referencesTryon, R. C. (1939). Cluster Analysis: Correlation Profile and Orthometric (factor) Analysis for the Isolation of Unities in Mind and Personality. Edwards brother, Incorporated.spa
dc.relation.referencesUNESCO. (2024). El impacto de la pandemia en los aprendizajes de los estudiantes de América Latina y el Caribe. UNESCO - UNESDOC Digital Library. https://unesdoc.unesco.org/ark:/48223/pf0000390609 Corporate author: UNESCO Office Santiago and Regional Bureau for Education in Latin America and the Caribbean [810] Latin American Laboratory for the Assessment of Quality in Education [172]spa
dc.relation.referencesUniversidad de los Andes. (2024). ¿Crisis en la educación media en Colombia?. Universidad de los Andes - Noticias. https://www.uniandes.edu.co/es/noticias/educacion/las-razones-de-la-crisis-en-la-educacionmedia-en-colombiaspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightshttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAttribution-NonCommercial-NoDerivatives 4.0 International
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectEstadística Multivariadaspa
dc.subjectPrueba SABER 11spa
dc.subjectAnálisis de componentes principalesspa
dc.subjectAnálisis de clustersspa
dc.subject.keywordsMultivariate statisticseng
dc.subject.keywordsSABER 11 Testeng
dc.subject.keywordsPrincipal component analysiseng
dc.subject.keywordsCluster analysiseng
dc.titleImplementación de una técnica de estadística multivariada a una base de datos sobre la prueba SABER 11.spa
dc.title.translatedImplementation of a multivariate statistics technique to a database about the SABER 11 test.eng
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1feng
dc.type.driverinfo:eu-repo/semantics/bachelorThesiseng
dc.type.hasVersioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTesis/Trabajo de grado - Monografía - Pregradospa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Estadística Multivariada VF.pdf
Tamaño:
3.53 MB
Formato:
Adobe Portable Document Format
Descripción:

Bloque de licencias

Mostrando 1 - 2 de 2
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descripción:
No hay miniatura disponible
Nombre:
202535520154743-19 AGO 25 ANDRES BORDA.pdf
Tamaño:
321.93 KB
Formato:
Adobe Portable Document Format
Descripción:
LICENCIA APROBADA