Skip to content

Final degree project. The goal is to scrap info from amazon and process it with the aim of using it for a marketing study.

License

Notifications You must be signed in to change notification settings

daniarnaizg/TFG-Amazon-Scraper

Repository files navigation

Code Smells Zenhub Shield GitHub license made-with-python made-with-latex

Extracción y procesamiento de datos de Amazon para su utilización en un estudio de marketing

TFG del Grado en Ingeniería Informática en la Universidad de Burgos. Curso 2018-19

Realizado por:

  • Daniel Arnaiz Gutierrez

Tutores:

  • José Franciso Díez Pastor
  • César Ignacio Garcıa Osorio

Resumen

El principal objetivo de este proyecto es la recolección de datos de determinados productos del sitio web Amazon.com para después procesar y almacenar los resultados de forma relacional. Además, parte de este proceso consiste en, dada una imagen del producto, etiquetarla de forma automática según las características de esta.

Para realizar la parte de la recolección de datos se utilizará una técnica de minería de datos llamada web scraping y para el procesado y etiquetado de las imágenes se harán uso de redes neuronales, otra rama de la minería de datos.

Los resultados, tanto del scraper como del clasificador de imágenes, serán almacenados en una base de datos para su posterior uso en estudios de marketing.

Abstract

The main objective of this project is the data collection of certain products in the website Amazon.com to later on process and store the result in a relational way. In addition to this, part of this process consists of, given a product image, label it automatically depending of its characteristics.

To perform the part in which the data is collected, a data mining technique called web scraping will be used. Also, for the processing and labeling of the images, neuronal networks will be used, which is another branch of data mining.

The results, both of the scraper and the image classifier, will be stored in a database for later use in marketing studies.

About

Final degree project. The goal is to scrap info from amazon and process it with the aim of using it for a marketing study.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published