Skip to content

amandalucasp/nlp

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

NLP - Sentiment Analysis in Portuguese Tweets

Repositório contém dois arquivos referente a dois projetos realisados em cima do mesmo conjunto de dados: "Portuguese Tweets for Sentiment Analysis". A ideia foi explorar o problema considerando 2 e 3 classes.

Etapas dos Projetos

Em ambos os projetos, as etapas foram as seguintes:

  1. Pré-processamento dos dados
  2. Visualização dos dados
  3. Limpeza dos dados
  4. Tokenização
  5. Extração de features. Dois métodos foram testados:
  • BOW (bag of words)
  • TF-IDF (term frequency-inverse document frequency)
  1. Fit dos modelos
  • Regressão Logística
  • Naive Bayes

Notebooks

Nesse contexto, consideramos os tweets como pertencentes a uma das duas classes: "Positivo" ou "Negativo", com relação ao sentimento expresso pelo tweet.

Já nessa abordagem, consideramos uma terceira classe. Logo, um tweet pode ser "Positivo", "Negativo", ou "Neutro.

Releases

No releases published

Packages

No packages published