Implementación de una técnica de estadística multivariada a una base de datos sobre la prueba SABER 11.
| dc.contributor.advisor | Rendón Mayorga, César Guillermo | spa |
| dc.contributor.author | Borda Muñoz, Andrés Hernando | |
| dc.date.accessioned | 2025-08-29T19:51:59Z | |
| dc.date.available | 2025-08-29T19:51:59Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | En este trabajo de grado se presentan los resultados de la implementación de las técnicas multivariadas análisis de componentes principales (PCA por sus siglas en inglés) y análisis de clusters (k-means) a una base de datos de las pruebas educativas SABER-11. Las técnicas implementadas en Python mediante el entorno de desarrollo de Google Colab, identificarón tres clusters de estudiantes (Bajo, Medio y Alto rendimiento) definidos por sus puntajes y características socioeconómicas como el acceso a internet y el estrato. Se concluye que estas técnicas son efectivas para segmentar y comprender la estructura de los datos de pruebas estandarizadas, revelando perfiles de rendimiento diferenciados. | spa |
| dc.description.abstractenglish | In this thesis, the results of implementing multivariate techniques of principal component analysis (PCA) and cluster analysis (k-means) on a database of SABER-11 educational tests are presented. The techniques implemented in Python using the Google Colab development environment, identified three student clusters (Low, Medium, and High performance) defined by their scores and socioeconomic characteristics such as internet access and socioeconomic stratum. It is concluded that these techniques are effective for segmenting and understanding the structure of standardized test data, revealing differentiated performance profiles. | eng |
| dc.description.degreelevel | Pregrado | spa |
| dc.description.degreename | Licenciado en Matemáticas | spa |
| dc.format.mimetype | application/pdf | spa |
| dc.identifier.instname | instname:Universidad Pedagógica Nacional | spa |
| dc.identifier.reponame | reponame: Repositorio Institucional UPN | spa |
| dc.identifier.repourl | repourl: http://repositorio.pedagogica.edu.co/ | |
| dc.identifier.uri | http://hdl.handle.net/20.500.12209/21426 | |
| dc.language.iso | spa | spa |
| dc.publisher | Universidad Pedagógica Nacional | spa |
| dc.publisher.faculty | Facultad de Ciencia y Tecnología | spa |
| dc.publisher.program | Licenciatura en Matemáticas | spa |
| dc.relation.references | Albornoz, M., Cotes, D., & Rivera, D. (2022). Informe N3 Análisis de componente principal. RPubs. https://rpubs.com/MikeyVega/Informe3 | spa |
| dc.relation.references | Bolaños, L. (2020). Anális Factorial. RPubs. https://rpubs.com/luis_bolanos/FA | spa |
| dc.relation.references | Cattell, R. B. (1966). The scree test for the number of factors. Multivariate Behavioral Research, 1(2), 245–276. https://doi.org/10.1207/s15327906mbr0102_10 | spa |
| dc.relation.references | Chica, S., Galvis, D., Ramírez, A. (2012, May 30). Determinantes del rendimiento académico en Colombia. Pruebas ICFES - Saber 11o, 2009*. Revista Universidad EAFIT. https://publicaciones.eafit.edu.co/index.php/revista-universidad-eafit/article/view/754 | spa |
| dc.relation.references | Davies, D. L., Bouldin, D. W. (1979). A cluster separation measure. IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-1(2), 224–227. https://doi.org/10.1109/tpami.1979.4766909 | spa |
| dc.relation.references | Diaz Monroy, L. G. (2007). Estadística multivariada: Inferencia y métodos. Departamento de Estadística, Facultad de Ciencias, Universidad Nacional de Colombia. | spa |
| dc.relation.references | Diaz Monroy, L. G., Morales Rivera, M. A. (2012). Análisis Estadístico de Datos Multivariados. Universidad Nacional de Colombia. | spa |
| dc.relation.references | Facultad de de Ciencias UNAL-MED. (2014). Clase 16. Parte 1. Valores y vectores propios. Universidad Nacional de Colombia - Sede Medellín. https://ciencias.medellin.unal.edu.co/cursos/algebra-lineal/clases/8-clases/121-clase-16- parte1.html | spa |
| dc.relation.references | Gallardo. (2011). Métodos Jerárquicos de Análisis Cluster. Universidad de Granada. http://www.ugr.es/gallardo/pdf/cluster-3.pdf | spa |
| dc.relation.references | GeeksforGeeks. (2025, April 2). Elbow method for optimal value of K in kmeans. https://www.geeksforgeeks.org/machine-learning/elbow-method-for-optimal-value-of-k-in- kmeans/ | spa |
| dc.relation.references | Hastie, T., Tibshirani, R., Friedman, J. (2009). The elements of statistical learning data mining, Inference, and prediction (2nd ed.). Springer New York. | spa |
| dc.relation.references | Hotelling, H. (1933). Analysis of a complex of statistical variables into principal compo- nents. Journal of Educational Psychology, 24(6), 417–441. https://doi.org/10.1037/h0071325 | spa |
| dc.relation.references | ICFES. (2025, March 27). Acerca del examen Saber 11°. Instituto Colombiano para la Evaluación de la Educación - ICFES. https://www.icfes.gov.co/ | spa |
| dc.relation.references | Jolliffe, I. T., Cadima, J. (2016). Principal component analysis: A review and recent developments. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 374(2065), 20150202. https://doi.org/10.1098/rsta.2015.0202 | spa |
| dc.relation.references | Kaiser, H. F. (1960). The application of electronic computers to Factor Analysis. Edu- cational and Psychological Measurement, 20(1), 141–151. https://doi.org/10.1177/001316446002000116 | spa |
| dc.relation.references | LEE. (2024). Informe 92: Pruebas Saber 11: una década de análisis (Abril 2024). La- boratorio de Economía de la Educación (LEE) de la Pontificia Universidad Javeriana. https://lee.javeriana.edu.co/w/lee-informe-92 | spa |
| dc.relation.references | MacQueen, J. (1967). Some methods for classification and analysis of multivariate observations. Semantic Scholar. https://www.semanticscholar.org/paper/Some-methods-for-classification-and-analysis- of-MacQueen/ac8ab51a86f1a9ae74dd0e4576d1a019f5e654ed | spa |
| dc.relation.references | Marden, J. I. (2015). Multivariate statistics: Old school. https://people.stat.sc.edu/hansont/stat730/Marden2013.pdf | spa |
| dc.relation.references | Mardia, K. V., Kent, J. T., & Bibby, J. M. (1980). Multivariate analysis. Academic Press. | spa |
| dc.relation.references | Microsoft. (2025). ¿Qué es la ciencia de datos? cómo convertirte en un científico de datos. Microsoft Azure. https://azure.microsoft.com/es-es/resources/cloud-computing-dictionary/what-is-data- science | spa |
| dc.relation.references | Min-Educación. (2022). Pruebas saber. Portal MEN. https://www.mineducacion.gov.co/ | spa |
| dc.relation.references | MIN-TIC. (2025). Datos Abiertos Colombia. Ministerio de Tecnologías de la Informa- ción y las Comunicaciones. https://www.datos.gov.co/ | spa |
| dc.relation.references | Poole, D. (2006). Algebra Lineal - Una Introduccion Moderna. Cengage Learning Edi- tores S.A. | spa |
| dc.relation.references | Ramírez, L. (2024). Algoritmo K-means: ¿Qué es y cómo funciona?. IEBS Biztech School. https://www.iebschool.com/hub/algoritmo-k-means-que-es-y-como-funciona-big-data/ | spa |
| dc.relation.references | Rencher, A. C., Christensen, W. F. (2012). Methods of multivariate analysis. Wiley. | spa |
| dc.relation.references | Rousseeuw, P. J. (1987). Silhouettes: A graphical aid to the interpretation and valida- tion of cluster analysis. Journal of Computational and Applied Mathematics, 20, 53–65. https://doi.org/10.1016/0377-0427(87)90125-7 | spa |
| dc.relation.references | Tryon, R. C. (1939). Cluster Analysis: Correlation Profile and Orthometric (factor) Analysis for the Isolation of Unities in Mind and Personality. Edwards brother, Incorporated. | spa |
| dc.relation.references | UNESCO. (2024). El impacto de la pandemia en los aprendizajes de los estudiantes de América Latina y el Caribe. UNESCO - UNESDOC Digital Library. https://unesdoc.unesco.org/ark:/48223/pf0000390609 Corporate author: UNESCO Office Santiago and Regional Bureau for Education in Latin America and the Caribbean [810] Latin American Laboratory for the Assessment of Quality in Education [172] | spa |
| dc.relation.references | Universidad de los Andes. (2024). ¿Crisis en la educación media en Colombia?. Universidad de los Andes - Noticias. https://www.uniandes.edu.co/es/noticias/educacion/las-razones-de-la-crisis-en-la-educacionmedia-en-colombia | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.accessrights | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.creativecommons | Attribution-NonCommercial-NoDerivatives 4.0 International | |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Estadística Multivariada | spa |
| dc.subject | Prueba SABER 11 | spa |
| dc.subject | Análisis de componentes principales | spa |
| dc.subject | Análisis de clusters | spa |
| dc.subject.keywords | Multivariate statistics | eng |
| dc.subject.keywords | SABER 11 Test | eng |
| dc.subject.keywords | Principal component analysis | eng |
| dc.subject.keywords | Cluster analysis | eng |
| dc.title | Implementación de una técnica de estadística multivariada a una base de datos sobre la prueba SABER 11. | spa |
| dc.title.translated | Implementation of a multivariate statistics technique to a database about the SABER 11 test. | eng |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | eng |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | eng |
| dc.type.hasVersion | info:eu-repo/semantics/acceptedVersion | |
| dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | spa |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- Estadística Multivariada VF.pdf
- Tamaño:
- 3.53 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
Bloque de licencias
1 - 2 de 2
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
No hay miniatura disponible
- Nombre:
- 202535520154743-19 AGO 25 ANDRES BORDA.pdf
- Tamaño:
- 321.93 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
- LICENCIA APROBADA
