Tesis
Permanent URI for this communityhttps://scripta.up.edu.mx/handle/20.500.12552/4881
Browse
1 results
Search Results
Now showing 1 - 1 of 1
- Some of the metrics are blocked by yourconsent settings
Item type:Publication, Predicting bitcoin price fluctuations using deep learning while leveraging the recurrent embedded topic model over text-based data(C. Vargas F., 2024) ;Vargas Fraga CarlosPonce Espinosa, Hiram EredínEn esta tesis se aborda el problema de predecir las fluctuaciones de precios de Bitcoin utilizando modelos de procesamiento de lenguaje natural mediante el uso de noticias de criptomonedas para garantizar predicciones de mayor calidad. Dado que las noticias sobre criptomonedas contienen vocabularios muy extensos y hablan sobre diferentes temas, los modelos de tópicos actuales son estrictos en la forma en que calculan las distribuciones de temas, por lo que no permiten flexibilidad según el conjunto de datos sobre el que se ajustan. Por lo tanto, cuando se aplican las distribuciones como conjunto de datos para entrenar un algoritmo de aprendizaje automático o de aprendizaje profundo, tiende a no ajustarse a las variaciones de precios de Bitcoin. Este trabajo investiga el fenómeno de manera estructurada a través de una metodología de investigación académica inspirada en CRISP-DM (Cross Industry Standard Process for Data Mining), aportando un nuevo modelo de tópicos de última generación llamado: Recurrent Embedded Topic Model(RETM), cuya novedad deriva de su capacidad para superar a los modelos de temas actuales al brindar flexibilidad al calcular las distribuciones de los tópicos. El RETM se comparó con otros modelos basados en precios, modelos de tópicos, análisis de sentimientos y modelos de encaje (embeddings) para integrarlos en varios modelos de aprendizaje automático y aprendizaje profundo para predecir las variaciones en precio de Bitcoin. Hubo una clara diferencia con un modelo basado en aprendizaje profundo (predictor binario) frente a todas las demás técnicas (con una exactitud del 73%, una precisión del 85% y un AUC (Area Under the Curve) del 79%), asegurando así predicciones de mayor calidad sobre las variaciones de precios de Bitcoin. Dentrode la tesis, existe una discusión sobre las complejidades de implementación para poner en prácticala metodología propuesta, así como, algunos análisis sobre la validez, confiabilidad, errores y limitaciones que surgieron de esta investigación. Se ha demostrado que este modelo proporciona mejores distribuciones de tópicos que se pueden aplicar a cualquier problema basado en el procesamiento del lenguaje natural que se puedan resolver utilizando distribuciones de tópicos o palabras, tanto problemas descriptivos o predictivos
