Tesis

Permanent URI for this communityhttps://scripta.up.edu.mx/handle/20.500.12552/4881

Browse

Search Results

Now showing 1 - 2 of 2
  • Some of the metrics are blocked by your 
    Item type:Publication,
    Predicting bitcoin price fluctuations using deep learning while leveraging the recurrent embedded topic model over text-based data
    (C. Vargas F., 2024)
    Vargas Fraga Carlos
    ;
    Ponce Espinosa, Hiram Eredín
    En esta tesis se aborda el problema de predecir las fluctuaciones de precios de Bitcoin utilizando modelos de procesamiento de lenguaje natural mediante el uso de noticias de criptomonedas para garantizar predicciones de mayor calidad. Dado que las noticias sobre criptomonedas contienen vocabularios muy extensos y hablan sobre diferentes temas, los modelos de tópicos actuales son estrictos en la forma en que calculan las distribuciones de temas, por lo que no permiten flexibilidad según el conjunto de datos sobre el que se ajustan. Por lo tanto, cuando se aplican las distribuciones como conjunto de datos para entrenar un algoritmo de aprendizaje automático o de aprendizaje profundo, tiende a no ajustarse a las variaciones de precios de Bitcoin. Este trabajo investiga el fenómeno de manera estructurada a través de una metodología de investigación académica inspirada en CRISP-DM (Cross Industry Standard Process for Data Mining), aportando un nuevo modelo de tópicos de última generación llamado: Recurrent Embedded Topic Model(RETM), cuya novedad deriva de su capacidad para superar a los modelos de temas actuales al brindar flexibilidad al calcular las distribuciones de los tópicos. El RETM se comparó con otros modelos basados en precios, modelos de tópicos, análisis de sentimientos y modelos de encaje (embeddings) para integrarlos en varios modelos de aprendizaje automático y aprendizaje profundo para predecir las variaciones en precio de Bitcoin. Hubo una clara diferencia con un modelo basado en aprendizaje profundo (predictor binario) frente a todas las demás técnicas (con una exactitud del 73%, una precisión del 85% y un AUC (Area Under the Curve) del 79%), asegurando así predicciones de mayor calidad sobre las variaciones de precios de Bitcoin. Dentrode la tesis, existe una discusión sobre las complejidades de implementación para poner en prácticala metodología propuesta, así como, algunos análisis sobre la validez, confiabilidad, errores y limitaciones que surgieron de esta investigación. Se ha demostrado que este modelo proporciona mejores distribuciones de tópicos que se pueden aplicar a cualquier problema basado en el procesamiento del lenguaje natural que se puedan resolver utilizando distribuciones de tópicos o palabras, tanto problemas descriptivos o predictivos
  • Some of the metrics are blocked by your 
    Item type:Publication,
    Reconocimiento de actividades humanas con grandes datos: algoritmo de festín de pirañas para escalabilidad y entrenamiento de redes de hidrocarburos artificiales
    (2020)
    González Mora, José Guillermo
    ;
    HIRAM EREDIN PONCE ESPINOSA;376768
    ;
    Ponce, Hiram
    ;
    Campus Ciudad de México
    En la actualidad el Reconocimiento de Actividades Humanas es un problema de investigación abierto con impacto en áreas médicas, de entretenimiento y seguridad, entre otras. Algunos de los mayores retos de este problema se encuentran en el manejo de conjuntos de datos con gran número de dimensiones y en la flexibilidad de los modelos de clasificación. Se han explorado soluciones utilizando aprendizaje automático, sobre los que destaca el algoritmo de Redes de Hidrocarburos Artificiales, por su robustez en la aproximación de soluciones para fenómenos con ruido presente y alta variación entre dimensiones. La solución propuesta en este documento pretende integrar un nuevo algoritmo metaheurístico y una estrategia de procesamiento paralelo para el entrenamiento de este modelo. El algoritmo presentado fue inspirado en el comportamiento de los cardúmenes de pirañas al momento de alimentarse, por lo que recibe el nombre de Algoritmo de Festín de Pirañas. El algoritmo incorpora dos funciones de actualización de movimiento, cuatro hiperparámetros ajustables entre los cuales existe un control de puntos de interés y una estrategia de incentivos y castigos para la política de exploración del algoritmo.
      20  83