Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático
El mercado de acciones es uno que cuenta con cierta antigüedad, es por esto que se han desarrollado y probado una gran variedad técnicas para intentar predecir el comportamiento del valor del precio de las acciones. Sin embargo, para estas predicciones se tienen en cuenta, en mayor medida, variables...
- Autores:
-
Londoño Cárdenas, Jhon Sebastián
Ortiz Morales, Luis Alberto
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2023
- Institución:
- Pontificia Universidad Javeriana Cali
- Repositorio:
- Vitela
- Idioma:
- spa
- OAI Identifier:
- oai:vitela.javerianacali.edu.co:11522/2856
- Acceso en línea:
- https://vitela.javerianacali.edu.co/handle/11522/2856
- Palabra clave:
- Stock market
Machine learning
Sentiment analysis
Natural language processing
Semi-supervised learning
- Rights
- License
- https://creativecommons.org/licenses/by-nc-nd/4.0/
id |
Vitela2_9c60cf3ce52d07c5d2f05c0c20ef0351 |
---|---|
oai_identifier_str |
oai:vitela.javerianacali.edu.co:11522/2856 |
network_acronym_str |
Vitela2 |
network_name_str |
Vitela |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático |
title |
Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático |
spellingShingle |
Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático Stock market Machine learning Sentiment analysis Natural language processing Semi-supervised learning |
title_short |
Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático |
title_full |
Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático |
title_fullStr |
Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático |
title_full_unstemmed |
Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático |
title_sort |
Análisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automático |
dc.creator.fl_str_mv |
Londoño Cárdenas, Jhon Sebastián Ortiz Morales, Luis Alberto |
dc.contributor.advisor.none.fl_str_mv |
Linares Ospina, Diego Luis Álvarez Vargas, Gloria Inés |
dc.contributor.author.none.fl_str_mv |
Londoño Cárdenas, Jhon Sebastián Ortiz Morales, Luis Alberto |
dc.subject.none.fl_str_mv |
Stock market Machine learning Sentiment analysis Natural language processing Semi-supervised learning |
topic |
Stock market Machine learning Sentiment analysis Natural language processing Semi-supervised learning |
description |
El mercado de acciones es uno que cuenta con cierta antigüedad, es por esto que se han desarrollado y probado una gran variedad técnicas para intentar predecir el comportamiento del valor del precio de las acciones. Sin embargo, para estas predicciones se tienen en cuenta, en mayor medida, variables como el histórico del precio, dejando de lado otro tipo de información como el análisis de sentimientos. En este proyecto se quiso contribuir a la investigación sobre el aporte que puede hacer este tipo de variable menos usada en la predicción del precio de las acciones, por este motivo, se llevó a cabo una integración entre dos técnicas con diferente grado de exploración. Para la parte del análisis de sentimientos se usó un dataset de tweets de la empresa Apple al cual se le aplicó técnicas de Procesamiento de Lenguaje Natural para el preprocesa miento, 2 algoritmos de aprendizaje semi-supervisado para ayudar a etiquetar los sentimientos de todos los tweets y 3 modelos de aprendizaje automático para que pudieran etiquetar tweets nuevos, siendo este la Máquina de Soporte Vectorial. Para la parte del histórico del precio se usó un dataset de diferentes valores de las acciones de la empresa Apple, gracias al cual se en traron 3 modelos de aprendizaje automático de los cuales la LSTM tuvo los mejores resultados. Posteriormente, se integraron los sentimientos obtenidos al histórico del precio, obteniendo que el mejor modelo era el Random Forest, sin embargo, no conseguía superar al mejor modelo que únicamente usaba el histórico del precio. Con dicho modelo de Random Forest se realizaron pruebas en un mercado simulado, determinando que el uso tanto del histórico del precio como del análisis de sentimientos es posible y tiene resultados aceptables, no obstante, la estrategia de compra y venta debe examinarse con mayor rigurosidad para darle un uso a estos modelos en el mundo real. |
publishDate |
2023 |
dc.date.issued.none.fl_str_mv |
2023 |
dc.date.accessioned.none.fl_str_mv |
2024-06-18T01:02:12Z |
dc.date.available.none.fl_str_mv |
2024-06-18T01:02:12Z |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.local.none.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Pregrado |
dc.type.redcol.none.fl_str_mv |
https://purl.org/redcol/resource_type/TP |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
https://vitela.javerianacali.edu.co/handle/11522/2856 |
url |
https://vitela.javerianacali.edu.co/handle/11522/2856 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.creativecommons.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.accessrights.none.fl_str_mv |
http://purl.org/coar/access_right/c_14cb |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_14cb |
dc.format.extent.none.fl_str_mv |
75 p. |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontificia Univerisdad Javeriana Cali |
publisher.none.fl_str_mv |
Pontificia Univerisdad Javeriana Cali |
institution |
Pontificia Universidad Javeriana Cali |
bitstream.url.fl_str_mv |
https://vitela.javerianacali.edu.co/bitstreams/2df54dbb-498a-497f-a94f-718686aceedd/download https://vitela.javerianacali.edu.co/bitstreams/fe15455f-914f-4bad-8e14-c510f4d1fa87/download https://vitela.javerianacali.edu.co/bitstreams/9d3ccc27-1526-412e-985f-4cdf3a040f47/download https://vitela.javerianacali.edu.co/bitstreams/af3dc4dc-2f8b-4df7-a6c1-4910e884601e/download https://vitela.javerianacali.edu.co/bitstreams/64f8088f-c907-4399-808e-f1969b148cdf/download https://vitela.javerianacali.edu.co/bitstreams/33ea64c8-2281-4071-9b48-79f9fa501247/download https://vitela.javerianacali.edu.co/bitstreams/5ecce179-c9f5-4697-8fe1-8335af8bb385/download https://vitela.javerianacali.edu.co/bitstreams/d09e48ac-f154-4c0c-812b-b2ba8f63f525/download https://vitela.javerianacali.edu.co/bitstreams/5ccc1cb2-9a86-41b2-8d2e-63cb5cbc09b0/download https://vitela.javerianacali.edu.co/bitstreams/4419df09-910d-4553-bea8-d85c7ff61b55/download |
bitstream.checksum.fl_str_mv |
1053364f92107eb1b0d2a53a04d2b8c9 75dbd9eab80d629fedaf841f55f059f2 90fb6da69c22d0e89c988809177c859c 8a4605be74aa9ea9d79846c1fba20a33 9218895ae32089eab3c5e0e7ceca48c4 6beda011b81f6b8f56721b3694913a7b a3fae535b692dda5fcf5ef7d8a05c4cc de62981f3cbcc4f2d28f046608216945 b86de14219b42d2a98e5e91f9ad39998 25d2bb9bbc8efcda074e5848ba7269ef |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Vitela |
repository.mail.fl_str_mv |
vitela.mail@javerianacali.edu.co |
_version_ |
1812095063028662272 |
spelling |
Linares Ospina, Diego LuisÁlvarez Vargas, Gloria InésLondoño Cárdenas, Jhon SebastiánOrtiz Morales, Luis Alberto2024-06-18T01:02:12Z2024-06-18T01:02:12Z2023https://vitela.javerianacali.edu.co/handle/11522/2856El mercado de acciones es uno que cuenta con cierta antigüedad, es por esto que se han desarrollado y probado una gran variedad técnicas para intentar predecir el comportamiento del valor del precio de las acciones. Sin embargo, para estas predicciones se tienen en cuenta, en mayor medida, variables como el histórico del precio, dejando de lado otro tipo de información como el análisis de sentimientos. En este proyecto se quiso contribuir a la investigación sobre el aporte que puede hacer este tipo de variable menos usada en la predicción del precio de las acciones, por este motivo, se llevó a cabo una integración entre dos técnicas con diferente grado de exploración. Para la parte del análisis de sentimientos se usó un dataset de tweets de la empresa Apple al cual se le aplicó técnicas de Procesamiento de Lenguaje Natural para el preprocesa miento, 2 algoritmos de aprendizaje semi-supervisado para ayudar a etiquetar los sentimientos de todos los tweets y 3 modelos de aprendizaje automático para que pudieran etiquetar tweets nuevos, siendo este la Máquina de Soporte Vectorial. Para la parte del histórico del precio se usó un dataset de diferentes valores de las acciones de la empresa Apple, gracias al cual se en traron 3 modelos de aprendizaje automático de los cuales la LSTM tuvo los mejores resultados. Posteriormente, se integraron los sentimientos obtenidos al histórico del precio, obteniendo que el mejor modelo era el Random Forest, sin embargo, no conseguía superar al mejor modelo que únicamente usaba el histórico del precio. Con dicho modelo de Random Forest se realizaron pruebas en un mercado simulado, determinando que el uso tanto del histórico del precio como del análisis de sentimientos es posible y tiene resultados aceptables, no obstante, la estrategia de compra y venta debe examinarse con mayor rigurosidad para darle un uso a estos modelos en el mundo real.The stock market is one that has a certain antiquity, for this reason, over the years techniques have been tested and designed to predict the behavior of the value of stocks. Some of these use only the historical price as a basis, while others include indices associated with the companies of the stock. All of the above is done to obtain a trend with which to decide whether it is a good time to buy or sell shares in the market. In the literature, the application of machine learning in the field of the stock market has been explored to a greater extent using price history. However, there are other methods that have been less employed, being sentiment analysis an example of these. For this reason, in this project we sought to integrate two techniques with different degrees of exploration such as price history and sentiment analysis. In order to develop the sentiment analysis section, Natural Language Processing techniques we re used for data processing. In addition to the above, semi-supervised learning algorithms such as Label Propagation and Label Spreading were explored in order to label all records in the dataset based on only a few known sentiment data. In addition, three machine learning models were trained and evaluated with the aim of finding the best one to subsequently use for sentiment classification of current tweets, finding that the one with the best results was the Support Vector Machine model. To test the performance of the models used in this project, the R2-score, Mean Square Error, F1-score and Accuracy metrics were used. In addition, tests were performed with the help of a broker platform to interact with a simulated market using a buy/sell strategy. Prior to integration with sentiment analysis, the best model was found to be the LSTM and once sentiment analysis was integrated, the best model was found to be the Random Forest. From the tests with the broker platform, it could be observed how one of the models with sen timent analysis had acceptable results. However, the weaknesses of the selected buy/sell strategy were also evidenced, so that even having a model with good results, a further review of buy and sell strategies is needed, to give a practical use in real life to the models.75 p.application/pdfspaPontificia Univerisdad Javeriana Calihttps://creativecommons.org/licenses/by-nc-nd/4.0/https://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_14cbStock marketMachine learningSentiment analysisNatural language processingSemi-supervised learningAnálisis de sentimientos integrado en un modelo de predicción del precio de las acciones, utilizando técnicas de aprendizaje automáticohttp://purl.org/coar/resource_type/c_7a1fTesis/Trabajo de grado - Monografía - Pregradohttps://purl.org/redcol/resource_type/TPFacultad de Ingeniería y Ciencias. Ingeniería de Sistemas y ComputaciónPregradoIngeniero(a)de Sistemas y ComputaciónORIGINALAnálisis_sentimientos_modelo_prediccion.pdf.pdfAnálisis_sentimientos_modelo_prediccion.pdf.pdfapplication/pdf2015046https://vitela.javerianacali.edu.co/bitstreams/2df54dbb-498a-497f-a94f-718686aceedd/download1053364f92107eb1b0d2a53a04d2b8c9MD53Artículo_científico.pdfArtículo_científico.pdfapplication/pdf51858https://vitela.javerianacali.edu.co/bitstreams/fe15455f-914f-4bad-8e14-c510f4d1fa87/download75dbd9eab80d629fedaf841f55f059f2MD52Licencia_autorización.pdfLicencia_autorización.pdfapplication/pdf467747https://vitela.javerianacali.edu.co/bitstreams/9d3ccc27-1526-412e-985f-4cdf3a040f47/download90fb6da69c22d0e89c988809177c859cMD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://vitela.javerianacali.edu.co/bitstreams/af3dc4dc-2f8b-4df7-a6c1-4910e884601e/download8a4605be74aa9ea9d79846c1fba20a33MD51TEXTAnálisis_sentimientos_modelo_prediccion.pdf.pdf.txtAnálisis_sentimientos_modelo_prediccion.pdf.pdf.txtExtracted texttext/plain102417https://vitela.javerianacali.edu.co/bitstreams/64f8088f-c907-4399-808e-f1969b148cdf/download9218895ae32089eab3c5e0e7ceca48c4MD55Artículo_científico.pdf.txtArtículo_científico.pdf.txtExtracted texttext/plain16262https://vitela.javerianacali.edu.co/bitstreams/33ea64c8-2281-4071-9b48-79f9fa501247/download6beda011b81f6b8f56721b3694913a7bMD57Licencia_autorización.pdf.txtLicencia_autorización.pdf.txtExtracted texttext/plain5072https://vitela.javerianacali.edu.co/bitstreams/5ecce179-c9f5-4697-8fe1-8335af8bb385/downloada3fae535b692dda5fcf5ef7d8a05c4ccMD510THUMBNAILAnálisis_sentimientos_modelo_prediccion.pdf.pdf.jpgAnálisis_sentimientos_modelo_prediccion.pdf.pdf.jpgGenerated Thumbnailimage/jpeg3908https://vitela.javerianacali.edu.co/bitstreams/d09e48ac-f154-4c0c-812b-b2ba8f63f525/downloadde62981f3cbcc4f2d28f046608216945MD56Artículo_científico.pdf.jpgArtículo_científico.pdf.jpgGenerated Thumbnailimage/jpeg4421https://vitela.javerianacali.edu.co/bitstreams/5ccc1cb2-9a86-41b2-8d2e-63cb5cbc09b0/downloadb86de14219b42d2a98e5e91f9ad39998MD58Licencia_autorización.pdf.jpgLicencia_autorización.pdf.jpgGenerated Thumbnailimage/jpeg5335https://vitela.javerianacali.edu.co/bitstreams/4419df09-910d-4553-bea8-d85c7ff61b55/download25d2bb9bbc8efcda074e5848ba7269efMD5911522/2856oai:vitela.javerianacali.edu.co:11522/28562024-06-25 05:15:39.889https://creativecommons.org/licenses/by-nc-nd/4.0/restrictedhttps://vitela.javerianacali.edu.coRepositorio Vitelavitela.mail@javerianacali.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |