Bienvenidos al Repositorio Institucional de la Universidad Nacional de Piura
 

Modelo de regresión logística aplicado con técnicas de balanceo de datos para clasificar el ingreso de los postulantes a la Facultad de Ciencias de la Universidad Nacional de Piura

dc.contributor.advisorCorrea Becerra, Ramón Cosmees_PE
dc.contributor.authorPanta Ipanaqué, Juan Camiloes_PE
dc.date.accessioned2021-07-17T23:19:19Z
dc.date.available2021-07-17T23:19:19Z
dc.date.issued2021
dc.description.abstractEn la actualidad los clasificadores predictivos están siendo muy utilizados, por lo cual existen varios métodos que nos ofrecen resultados buenos para solucionar esta tarea, sin embargo, es probable encontrarse con conjuntos de datos desbalanceados, (que una categoría de la variable a predecir, este sobrerrepresentada que la otra), que harán que la calidad de nuestras medidas de desempeño se vea afectadas o sesgadas. Por lo que, se hizo uso de las técnicas de balanceo de datos para solucionar este problema. En este contexto la presente investigación tiene como propósito comparar el modelo de Regresión logística aplicados con técnicas de balanceo de datos y sin ella, para conocer quien brinda una mejor clasificación. El presente estudio es de tipo aplicada y transversal y se usó los datos de los postulantes a la Facultad de Ciencias de la UNP, para predecir la obtención de una vacante de ingreso. Este conjunto de datos se dividió en el 75% para entrenar y el 25% para la prueba de los modelos. Para equilibrar el conjunto de datos, se hizo uso de las técnicas de muestreo para el balanceo de datos, solo en los datos de entrenamiento. Con estos datos se entrenó el algoritmo de clasificación de Regresión Logística. Se utilizó la técnica de la validación cruzada de k=5 folios, para obtener resultados eficientes. En esta el conjunto de datos se divide en cinco partes iguales, utilizamos el primer folio para prueba y los cuatro restantes para entrenamiento, así se repite el procedimiento cuatro veces más utilizando el siguiente folio como conjunto de prueba. Se usaron 3 modelos de Regresión Logística, el primero haciendo caso omiso al problema de los datos desbalanceados, el segundo balanceando mediante sobremuestreo y el ultimo mediante la técnica de sobremuestreo de minoría sintética, Smote. Los resultados nos mostraron que el modelo trabajado con el conjunto de datos equilibrado con la técnica smote, proporciona mejores resultados que los otros modelos, con respecto a las métricas de clasificación utilizadas, para clasificar el ingreso de los postulantes a la Facultad de Ciencias de la UNP.es_PE
dc.formatapplication/pdfes_PE
dc.identifier.urihttps://repositorio.unp.edu.pe/handle/20.500.12676/2689
dc.language.isospaes_PE
dc.publisherUniversidad Nacional de Piuraes_PE
dc.publisher.countryPEes_PE
dc.rightsinfo:eu-repo/semantics/openAccesses_PE
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.sourceUniversidad Nacional de Piuraes_PE
dc.sourceRepositorio Institucional Digital - UNPes_PE
dc.subjectAUCes_PE
dc.subjectRegresión logísticaes_PE
dc.subjectSMOTEes_PE
dc.subjectDatos desbalanceadoses_PE
dc.subject.ocdehttp://purl.org/pe-repo/ocde/ford#1.01.03es_PE
dc.titleModelo de regresión logística aplicado con técnicas de balanceo de datos para clasificar el ingreso de los postulantes a la Facultad de Ciencias de la Universidad Nacional de Piuraes_PE
dc.typeinfo:eu-repo/semantics/bachelorThesises_PE
dc.type.versioninfo:eu-repo/semantics/publishedVersiones_PE
renati.advisor.dni19199852
renati.advisor.orcidhttps://orcid.org/0000-0002-3656-1788es_PE
renati.author.dni73695711
renati.discipline542016es_PE
renati.jurorAlva Alva, Walter Gastónes_PE
renati.jurorAbanto Cerna, Lemines_PE
renati.jurorQuiroz Calderón, Marcos Victorianoes_PE
renati.levelhttp://purl.org/pe-repo/renati/nivel#tituloProfesionales_PE
renati.typehttp://purl.org/pe-repo/renati/type#tesises_PE
thesis.degree.disciplineEstadísticaes_PE
thesis.degree.grantorUniversidad Nacional de Piura. Facultad de Cienciases_PE
thesis.degree.nameLicenciado en Estadísticaes_PE

Archivos

Bloque original
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
ESTA-PAN-IPA-2021.pdf
Tamaño:
1.87 MB
Formato:
Adobe Portable Document Format
Descripción:
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descripción:
Urb. Miraflores s/n, Castilla-Piura, Apartado Postal 295
Copyright © 2024 Universidad Nacional de Piura | Oficina de Tecnologías de Información