NLP - Sentiment Analysis in Portuguese Tweets

Repositório contém dois arquivos referente a dois projetos realisados em cima do mesmo conjunto de dados: "Portuguese Tweets for Sentiment Analysis". A ideia foi explorar o problema considerando 2 e 3 classes.

Etapas dos Projetos

Em ambos os projetos, as etapas foram as seguintes:

Pré-processamento dos dados
Visualização dos dados
Limpeza dos dados
Tokenização
Extração de features. Dois métodos foram testados:

BOW (bag of words)
TF-IDF (term frequency-inverse document frequency)

Fit dos modelos

Regressão Logística
Naive Bayes

Notebooks

Abordagem Binária

Nesse contexto, consideramos os tweets como pertencentes a uma das duas classes: "Positivo" ou "Negativo", com relação ao sentimento expresso pelo tweet.

Abordagem Multi-classe

Já nessa abordagem, consideramos uma terceira classe. Logo, um tweet pode ser "Positivo", "Negativo", ou "Neutro.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
README.md		README.md
nlp-3-classes.ipynb		nlp-3-classes.ipynb
nlp.ipynb		nlp.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

nlp-3-classes.ipynb

nlp-3-classes.ipynb

nlp.ipynb

nlp.ipynb

Repository files navigation

NLP - Sentiment Analysis in Portuguese Tweets

Etapas dos Projetos

Notebooks

About

Releases

Packages

Contributors 2

Languages

amandalucasp/nlp

Folders and files

Latest commit

History

Repository files navigation

NLP - Sentiment Analysis in Portuguese Tweets

Etapas dos Projetos

Notebooks

About

Resources

Stars

Watchers

Forks

Languages