Digital repository


 

Maestria en Ciencias de Datos

Permanent URI for this collection

Browse

Latest publications

Now showing 1 - 14 of 14
  • ItemOpen Access
    Aprendizaje automático para el análisis de tráfico de datos en la detección de fallas en redes de telecomunicaciones, 2024
    (Quevedo: UTEQ, 2025) Vaca Vargas, David Adrián; Mora Secaira, Janeth Inés
    Este estudio aplica aprendizaje automático para anticipar fallas en enlaces de telecomunicaciones a partir del tráfico entre Ventanas y otras localidades de la provincia de Los Ríos durante 2024. Se construyó una etiqueta de “falla inminente” con una ventana futura de 30 minutos, basada en registros de Link Downs o, cuando no estuvieron disponibles, en caídas pronunciadas del caudal (total_bps). Se seleccionaron variables numéricas sin fuga y se normalizaron con RobustScaler. Para exploración y priorización de eventos se usaron métodos no supervisados (Isolation Forest, One-Class SVM, LOF, elipse de covarianza y error de reconstrucción con PCA), junto con un ensamblado por promedio z. La predicción binaria se abordó con regresión logística, Random Forest, Gradient Boosting y LinearSVC, entrenados con cortes temporales y una ventana de prueba reciente. La evaluación consideró ROC-AUC, PR-AUC, precisión, recall y F1; además, se revisó la tasa de falsas alarmas por hora y el tiempo medio de detección. Los resultados indican que el esquema ayuda a priorizar incidentes y a orientar acciones del centro de control para reducir la indisponibilidad.
  • ItemOpen Access
    Integración de algoritmos de satisfacción booleana en redes bayesianas para reducir la complejidad computacional
    (Quevedo: UTEQ, 2025) Cordero Bazurto, José Steven; Díaz Macías, Efraín Evaristo
    En el ámbito digital la sociedad genera enormes cantidades de datos cada segundo, los usuarios acuden a dispositivos como computadoras, teléfonos y tabletas para resolver sus necesidades cotidianas. Ya sea que el procesamiento se realice localmente o en servidores externos, se debe evitar la saturación del sistema, de lo contrario la aplicación responderá con lentitud a los ojos del consumidor. El presente escrito propone una solución a esta problemática, específicamente en escenarios donde la resolución de problemas hace uso de las redes bayesianas, técnica efectiva pero el tiempo de resolución varía dependiendo de la cantidad de variables a considerar. Mediante pruebas en entornos simulados, se implementaron y evaluaron configuraciones específicas donde mezclando la resolución de redes bayesianas con el uso de algoritmos de satisfacción booleana (SAT) que se basan en decisiones, lo cual permite reducir los tiempos de espera. Fue necesario realizar recolección, preparación y análisis de datos, mismos que se obtuvieron de un repositorio en línea, los resultados muestran mejoras en el tiempo de ejecución y cantidad de procesos necesarios. Con el presente proyecto se da una solución práctica y replicable en diferentes áreas, gracias a su capacidad de realizar inferencias rápidas, reduciendo considerablemente los tiempos de espera.
  • ItemOpen Access
    Modelo predictivo aplicado a la deserción de clientes de la corporación nacional de telecomunicaciones en la ciudad de Quevedo 2020 -2024
    (Quevedo: UTEQ, 2025) Sánchez Carranza , Juan Carlos; Torres Quijije, Ángel Iván
    El presente trabajo analizó la deserción de clientes en los servicios de telecomunicaciones de la Corporación Nacional de Telecomunicaciones (CNT) en la ciudad de Quevedo, considerando el periodo 2020–2024. El conjunto de datos original contenía 19.000 registros, tras los procesos de depuración, imputación y validación de calidad, se consolidaron en 18.484 observaciones útiles para el modelado. Se aplicaron técnicas de ciencia de datos siguiendo la metodología CRISP-DM, que incluyó fases de comprensión del negocio, exploración de la información, preparación, modelado y evaluación. Los algoritmos implementados abarcaron regresión logística, árboles de decisión, Random Forest, XGBoost y redes neuronales. La validación de los modelos se realizó con métricas como AUC, precisión, sensibilidad y curvas de calibración, lo que permitió seleccionar configuraciones óptimas para estimar la probabilidad de abandono por cliente. Los resultados evidenciaron factores asociados a la salida de usuarios como infraestructura técnica, fallas de equipo, percepción de tarifas, historial de pagos y nivel de servicio. Además, se identificaron patrones de riesgo en zonas específicas y se construyeron perfiles de clientes con mayor propensión a cancelar el servicio.
  • ItemOpen Access
    Servicio web basado en analítica de datos en la nube para instituciones de educación superior
    (Quevedo: UTEQ, 2025) Brito Casanova , Geovanny José; Erazo Moreta, Orlando Ramiro
    El proyecto desarrolla un servicio web basado en analítica de datos en la nube, orientado a interpretar información académica proveniente de sistemas digitales. En su estado actual, las herramientas de analítica de datos suelen operar de forma aislada, lo que complica la integración de datos clave y dificulta tomar decisiones pedagógicas y administrativas basadas en evidencia. El trabajo partió con la definición de una estructura que permita la consolidación de datos dispersos, su procesamiento mediante técnicas de aprendizaje automático y la devolución de información para facilitar su interpretación. Luego, se integró un modelo de lenguaje a gran escala, preentrenado, para ofrecer la interpretación de los análisis de manera que resulten comprensibles para los usuarios finales (docentes y gestores académicos), fomentando decisiones informadas. Por último, el desarrollo del servicio contempló etapas de diseño, desarrollo y validación, enfocándose en garantizar su aplicabilidad en diferentes contextos educativos. Los resultados incluyen un formato de datos que permite la interoperabilidad junto con el mecanismo de procesamiento de datos. Además, se desarrolló una aplicación web que demuestra la forma de exponer las funcionalidades del servicio y permite su evaluación práctica a través de un estudio de caso. Así, este proyecto busca aportar una solución que integre el análisis de datos educativos en instituciones de educación superior, y permita a los usuarios desarrolladores consolidar información, automatizar procesos de interpretación para la toma de decisiones pedagógicas.
  • ItemOpen Access
    Modelo analítico para la optimización de servicios y recursos críticos en el área de emergencias del Hospital General Quevedo 2020 – 2024
    (Quevedo: UTEQ, 2025) Ramírez Vergara, Víctor Stiven; Samaniego Mena, Eduardo Amable
    Este estudio presenta un modelo analítico híbrido para optimizar la asignación de recursos críticos en el servicio de emergencias del Hospital General Quevedo (2020– 2024). A partir de 385.604 registros administrativos se realizó un proceso de preprocesamiento y limpieza de datos (fechas, horas, flags de transferencia y variables derivadas como edad y duración de estancia). Se exploraron patrones mediante análisis descriptivo, correlaciones y segmentación con MiniBatch K-Means. Se compararon cinco modelos supervisados (Regresión Logística, Random Forest, XGBoost, KNN y SVM) usando métricas multicriterio (Accuracy, F1-macro, sensibilidad, especificidad y AUC), identificando a XGBoost afinado como el más adecuado para discriminar prioridades clínicas. Las predicciones alimentaron un modelo de Programación Entera que asigna camas censables y no censables y considera médicos por turno; se evaluó su eficacia mediante cobertura por prioridad, utilización de camas y tiempo de espera. Los resultados muestran que, si bien la optimización prioriza adecuadamente los casos críticos, requiere incorporar restricciones de cobertura mínima o términos multi-objetivo para garantizar equidad frente a la alta demanda de casos moderados. Se discuten implicaciones operativas y recomendaciones para la implementación práctica en el hospital.
  • ItemOpen Access
    “Técnicas de ciencia de datos para la identificación de competencias profesionales a través del análisis de ofertas laborales. 2020 – 2024”
    (Quevedo: UTEQ, 2025) Bustamante Oleas, Jefferson Gustavo; Llerena Guevara, Lucrecia Alejandrina
    Esta investigación surge ante el problema del desempleo en Ecuador, agravado por el desconocimiento de las competencias profesionales que demanda el mercado laboral. En un contexto de transformación digital y alta informalidad, muchas personas no logran insertarse laboralmente debido a la falta de información clara y actualizada sobre las competencias requeridas por los empleadores. Para abordar esta problemática, se aplicaron técnicas de ciencia de datos sobre datos del Instituto Nacional de Estadísticas y Censo (INEC) y las ofertas laborales extraídas mediante raspado de portales en línea. El procesamiento se realizó con modelos de lenguaje natural (NLP), las técnicas random forest y máquina de vectores de soporte (SVM), y modelos no supervisados como K-means, permitiendo identificar con alta precisión las competencias solicitadas. El modelo de análisis de competencias laborales desarrollado ofrece una herramienta para orientar la formación profesional, actualizar mallas curriculares basadas en evidencia. Su arquitectura y capacidad de actualización continua lo convierten en un recurso estratégico para portales de empleo. Este trabajo aporta una base empírica para reducir el desajuste entre oferta y demanda laboral, mejorar la empleabilidad y promover el desarrollo económico inclusivo en Ecuador
  • ItemOpen Access
    Modelo predictivo para determinación de homicidios intencionales en Ecuador, 2020 - 2024
    (Quevedo: UTEQ, 2025) Sarmiento Fajardo, Manuel Fabrizzio; Zhuma Mera, Emilio Rodrigo
    Esta investigación aborda la escalada de homicidios intencionales en Ecuador (2020-2024) mediante un enfoque de pronóstico de series temporales. El estudio transforma los datos de incidentes individuales en series mensuales que representan cuatro patrones clave: el volumen total de casos, el tipo de arma predominante, el perfil sociodemográfico de las víctimas y la concentración geográfica. Posteriormente, se desarrolla un marco de evaluación comparativa de tres modelos predictivos Prophet, SARIMA y Holt-Winters para seleccionar el algoritmo más preciso para cada patrón. El resultado principal es una proyección a cinco años (2025-2029) que sugiere la cronificación de la crisis en niveles históricamente elevados, ofreciendo una perspectiva cuantitativa y basada en datos sobre la trayectoria futura del fenómeno.
  • ItemOpen Access
    Tendencias estacionales de productos farmacéuticos basadas en inteligencia artificial en la ciudad de Quevedo 2022-2024
    (Quevedo: UTEQ, 2025) Ordóñez Guerrero, Karina Michelle; Samaniego Mena, Eduardo Amable
    Este estudio examinó la demanda estacional de productos farmacéuticos en una farmacia ubicada en la ciudad de Quevedo, utilizando técnicas de análisis estadístico y modelos de aprendizaje automático. Se trabajó con un conjunto de 89.590 registros de ventas mensuales, comprendidos entre noviembre de 2022 y diciembre de 2024. El proceso incluyó limpieza de datos, imputación de registros incompletos y organización de las variables para su análisis. Se aplicó el método de descomposición estacional y de tendencia basado en loess (STL), así como Holt-Winters, SARIMA, Random Forest, XGBoost y redes neuronales LSTM. Entre ellos, el modelo LSTM obtuvo el mejor desempeño según la raíz del error cuadrático medio (RMSE), seguido por Holt-Winters. Estas técnicas permitieron proyectar la demanda de aproximadamente 3.800 productos, identificando patrones mensuales y trimestrales que pueden servir de guía para mejorar la gestión del inventario y anticipar necesidades de reposición. Para facilitar el uso práctico de los resultados, se desarrolló una aplicación interactiva con Streamlit, que presenta tablas comparativas, gráficas, métricas de rendimiento y una sección de predicción semestral. Además, incorpora indicadores de niveles elevados de stock o posibles quiebres, lo que permite planificar compras de manera más ordenada sin requerir conocimientos técnicos especializados.
  • ItemOpen Access
    Optimización de inventario en la gestión de la cadena de suministro en empresas de consumo masivo
    (Quevedo: UTEQ, 2024) Álvarez Carpio , Gilberto Germán; Díaz Macías , Efraín Evaristo
    En el contexto de la economía global, la gestión de inventarios y la cadena de suministro son esenciales para la competitividad y rentabilidad de las empresas, especialmente en el sector de productos de consumo masivo. Este trabajo se enfoca en la optimización del inventario mediante el uso de algoritmos de aprendizaje automático, buscando equilibrar los niveles de stock con la demanda y minimizar los costos de almacenamiento. El objetivo principal de la investigación es determinar los niveles óptimos de inventario aplicando algoritmos predictivos para minimizar los costos asociados al almacenamiento y asegurar la disponibilidad adecuada de productos. Los objetivos específicos incluyen realizar un análisis de segmentación para identificar los productos más significativos, diseñar un modelo predictivo para la demanda de productos y estimar los niveles mínimos y máximos de inventario. Los resultados obtenidos a través de métodos como K-means y Agglomerative Clustering revelaron una segmentación robusta de los productos en cuatro clusters, lo que facilitó una gestión de inventario más precisa. Además, el análisis de Pareto ayudó a identificar los productos que generan la mayor parte de las ventas y, por ende, requieren una gestión más cuidadosa. En el análisis predictivo, se aplicaron modelos ARIMA, Prophet, Exponential Smoothing y Random Forest. Aunque ARIMA mostró un buen desempeño en uno de los productos, el modelo Exponential Smoothing se destacó como el más eficaz en general, proporcionando las predicciones más precisas para la mayoría de los productos analizados. Finalmente, la predicción precisa de los niveles mínimos y máximos de inventario mediante Random Forest demostró ser la más efectiva, mejorando la eficiencia operativa y contribuyendo a la rentabilidad de la empresa. Esta investigación no solo aporta al conocimiento teórico en la gestión de inventarios, sino que también proporciona herramientas prácticas para que las empresas de consumo masivo optimicen sus operaciones en un mercado dinámico y competitivo.
  • ItemOpen Access
    Aprendizaje profundo para la detección de armas de fuego en sistemas de videovigilancia
    (Quevedo: UTEQ, 2024) Briones Montalvo , Cristhian Danilo; Zambrano Vega , Cristian Gabriel
    Ecuador enfrenta un desafío creciente de inseguridad, potenciado por el narcotráfico y la proliferación de armas de fuego, lo que exige soluciones inteligentes que combinen estrategias de seguridad pública y tecnológica. En este contexto, los sistemas de videovigilancia basados en circuitos cerrados de televisión (CCTV) se han convertido en herramientas cruciales para el monitoreo y registro de eventos en tiempo real. Sin embargo, para combatir eficazmente la amenaza de las armas de fuego, se requieren sistemas precisos de detección en tiempo real. Este proyecto aborda una necesidad urgente al explorar técnicas de aprendizaje profundo y visión por computadora para desarrollar un sistema de reconocimiento de armas en sistemas de CCTV, con el objetivo de proponer una herramienta informática que pueda contribuir a la lucha contra la proliferación de armas de fuego y la violencia en la sociedad ecuatoriana. Se analizaron diversas herramientas para la construcción de modelos de visión artificial: YOLOv8, Teacheable Machine (EfficientNet) y la metodología Haar-Cascade. Se evaluaron los rendimientos de los modelos de detección generados empleando varias métricas de precisión. Entre los modelos evaluados, se encontró que el modelo basado en YOLOv8 demostró ser el más eficaz en términos de precisión y rendimiento.
  • ItemOpen Access
    Análisis del comportamiento de los residuos sólidos no peligrosos en los cantones de la provincia de Los Ríos: Un enfoque de Ciencia de Datos
    (Quevedo: UTEQ, 2024) Alarcón Bermúdez, María Mercedes; Erazo Moreta, Orlando
    La gestión eficiente de los residuos sólidos es un desafío global que afecta la calidad de vida de las comunidades y del medio ambiente. El manejo inadecuado de los residuos sólidos ha generado preocupaciones debido al constante crecimiento de la población y la provincia de Los Ríos no se encuentra exenta de esta problemática. La Ciencia de Datos se ha hecho presente en diferentes áreas de trabajo, incluyendo la ambiental. Por ello, este proyecto tiene como objetivo principal analizar el comportamiento de los residuos, aplicando técnicas de Ciencia de Datos. Para identificar las principales variables influyentes en la generación y manejo de residuos, se realizaron análisis de Chi-Cuadrado y ANOVA, asegurando la independencia de las variables seleccionadas. Posteriormente, para agrupar los cantones según características similares, se aplicaron técnicas de clustering como K-means, DBSCAN y clustering jerárquico, donde se utilizó el Análisis de Componentes Principales (PCA) para reducir la dimensionalidad de los datos. En los resultados se identificaron 16 variables influyentes relacionadas con la generación y forma de eliminación de los residuos sólidos no peligrosos en los hogares. Al aplicar las técnicas de clustering, se identificaron cuatro grupos con características similares en eliminación y manejo de residuos. Las estrategias identificadas en cada cluster revelaron que ciertos cantones participan en voluntariado ambiental y que, en su mayoría, los residuos son depositados con los demás residuos del hogar. Estos resultados demuestran cómo la Ciencia de Datos puede contribuir en el beneficio ambiental.
  • ItemOpen Access
    Clasificación automática de coberturas del suelo con imágenes para el control del uso de área terrestre en agricultura
    (Quevedo:UTEQ, 2024) Muñoz Pisco, Jeanny Xavier; Tubay Vergara , José Luis
    ABSTRACT Agriculture plays a key role in global food security, but its sustainable management is facing increasing challenges due to population growth and climate change. Automatic land cover classification from satellite and aerial imagery has become an essential tool for land use monitoring in agriculture. This research focuses on training a land cover classification model from imagery. These images show different types of land cover, such as cocoa plantations, cocoa and others. The model was trained using Convolutional Neural Networks (CNN). Finally, a web interface was designed where images can be uploaded and automatically classified by the model. The original set consisted of TIFF images captured by drones, which were processed to create a set of training images in PNG format, each representing an area of 2500 square meters. In total, 5,809 training images were used, distributed in the following classes: 1,254 banana tree images, 1,535 cacao images, 1,321 grassland images, 589 secondary vegetation images, and 1,110 access road images. These images were used to train a classification model using a CNN. The dataset was split 80% for training and 20% for validation using the random split technique. The trained model was able to identify the land cover in an image with an accuracy of 96.56%.
  • ItemOpen Access
    Modelo predictivo de las tendencias de delitos en el Ecuador
    (Quevedo: UTEQ, 2024) Vera Alarcón , María José; Erazo Moreta, Orlando
    Durante años, en Ecuador se han observado variaciones significativas en las tasas de delincuencia, las cuales han tenido un impacto en el progreso económico y social del país. Estos actos delictivos ponen en peligro la seguridad y la serenidad de todos los habitantes. La Ciencia de Datos puede ser una herramienta valiosa para abordar esta problemática, al proporcionar a los investigadores metodologías analíticas para el análisis de grandes conjuntos de datos. A pesar de que la preocupación por la criminalidad es generalizada en Ecuador, hasta el momento ha habido escasos análisis destinados a identificar tendencias o patrones relacionados con este tema. Por ello, este proyecto analiza una base de datos del portal de datos abiertos del Ecuador, que contiene información sobre las denuncias realizadas en Ecuador, con los delitos que las motivaron durante el período 2016-2023. Se emplearon algoritmos de aprendizaje automático y técnicas de Ciencia de Datos para detectar pautas y tendencias delictivas. Previamente, se llevó a cabo un análisis exploratorio de los datos con el fin de comprender el comportamiento de las variables. Se desarrolló un modelo predictivo utilizando random forest. Los resultados revelaron una disminución en la incidencia delictiva reportada oficialmente desde 2017 hasta 2024. Al comparar los delitos ocurridos en 2023 con la predicción para ese mismo año, se observa una coincidencia que sugiere que el modelo es preciso. Así, se espera que este estudio constituya un aporte en el análisis y entendimientos de las tendencias delictivas, que coadyuven a los responsables a tomar las decisiones que sean pertinentes.
  • ItemOpen Access
    Patrones en incidentes de emergencia en Ecuador a través del Sistema ECU 911
    (Quevedo:UTEQ, 2024) Vergara Loor, Joselyn Aylin; Zambrano, Cristian
    This research project focuses on analyzing patterns of emergency incidents recorded in Ecuador's ECU 911 System using association rules. By studying data related to critical emergency situations like medical calls, disaster management, traffic incidents, mobility, and public safety, the goal is to understand how these incidents are distributed geographically and over time. The methodology used in this project follows a deductive approach, beginning with data exploration and then applying association rules to identify patterns. These methods have helped reveal temporal patterns in the data, the distribution of incidents is presented through interactive visualizations made in Tableau. The findings of this study could provide important strategic information to enhance emergency management in Ecuador. Additionally, this research could contribute valuable insights to the field of data science applied to societal safety and well-being, offering a practical and effective approach to analyzing emergency incidents in Ecuador.