Digital repository
Maestria en Ciencias de Datos
Permanent URI for this collection
Browse
Browsing Maestria en Ciencias de Datos by Subject "Aprendizaje automático"
Now showing 1 - 2 of 2
Results Per Page
Sort Options
Item Open Access Modelo de clasificación para la identificación de software malicioso ofuscado en sistemas operativos windows(Quevedo:UTEQ, 2024) Ponce Velez , Iván Darío; Zhuma Mera, Emilio RodrigoLa ofuscación es una técnica en la informática que dificulta la comprensión del código fuente para proteger la propiedad intelectual y evitar la ingeniería inversa; en el ámbito del presente estudio, se utiliza para complicar la detección de malware. Sin embargo, para abordar este problema se construyó un modelo basado en técnicas de aprendizaje automático para identificar amenazas que utilizan técnicas de ofuscación. Por lo consiguiente, en el desarrollo del presente estudio se utilizó la metodología “Descubrimiento de conocimiento en bases de datos” (KDD, del inglés Knowledge Discovery in Databases), que inició con la preparación del conjunto de datos, donde se aplicó la selección de atributos con base en la correlación. Mediante una revisión de la literatura, se seleccionaron y aplicaron técnicas supervisadas en la fase de minería de datos. Los algoritmos Random Forest, Decision Tree, SVM, KNN y Gradient Boosting se utilizaron para identificar correctamente los grupos principales de software malicioso, demostrando así el rendimiento del modelo en la identificación de malware. Por último, el principal aporte de esta investigación es un modelo basado en el algoritmo Random Forest que presentó una precisión del 99% en la clasificación de malware ofuscado, mejorando las capacidades de identificar amenazas cibernéticas en este ámbito.Item Open Access Pronóstico del rendimiento de cultivo de maíz forrajero basado en variables agronómicas en la ciudad de Quevedo(Quevedo: UTEQ, 2024) Villarroel Molina, Ricardo Rafael; Zambrano Vega, CristianEste proyecto de investigación se centró en la construcción de modelos predictivos para el rendimiento del maíz forrajero en Quevedo utilizando técnicas de aprendizaje automático supervisado. Se analizaron variables agronómicas como altura de la planta, diámetro del tallo, inserción de mazorca, variedad de semilla y distancia de siembra, destacando que mayores distancias entre plantas favorecen un aumento en el diámetro del tallo, correlacionándose positivamente con las variables de rendimiento estudiadas (peso total, peso de hojas, peso de tallo y peso de mazorcas). Se entrenaron y optimizaron modelos independientes para cada variable de rendimiento mediante el ajuste de hiperparámetros para minimizar el RMSE con los algoritmos de Linear Regression (LR), Random Forest (RF), Support Vector Machine (SVM), Multi-layer Perceptron (MLP), Deep Neural Network (DNN), Gradient Boosting Tree (GBT) y XGBoost (XGB). Se evaluó el desempeño de los modelos mediante las pruebas estadísticas de significancia de Friedman y la prueba post-hoc de Nemenyi, centradas en las métricas de RMSE y R². Los modelos construidos por el algoritmo de RF obtuvieron los mejores valores de RMSE y de R².