🚀 Repositório dedicado ao estudo sobre análise de dados usando a biblioteca NLTK - Natural Language Toolkit, que possui ferramentas para realizar processamento simbólico e estatístico de linguagem natural. O objetivo deste estudo é obter o conhecimento necessário para desenvolver um projeto onde será possível apresentar as principais técnicas de processamento de linguagem natural para identificar padrões de escrita e realizar classificações categóricas sobre um determinado tema.
Para mais detalhes sobre a biblioteca, favor acessar o link: 🔎 NLTK :: Natural Language Toolkit - Documentation
Principais tópicos abordados durante o desenvolvimento do projeto:
- Implementação da biblioteca NLTK;
- Principais funcionalidades;
- Leitura de livros;
- Identificar padrões de escrita;
- Tokenização de texto - Tokenização de Texto - Sample usage for tokenize ;
- Análise estatística - Sample usage for probability ;
- Processamento de texto - Processing Raw Text ;
- Modulos da bilioteca NLTK - Example usage of NLTK modules .