Somos um capítulo estudantil vinculado à IEEE, a maior organização profissional do mundo dedicada ao avanço da tecnologia em benefício da humanidade. Nosso objetivo é capacitar estudantes na área de inteligência computacional e inteligência artificial e democratizar o conhecimento. 🎯
Sejam bem vindos, aqui estarão presentes todos os arquivos referentes aos períodos do processo Trainee do CIS!
- 1º Período — Regressão e Classificação
- 2º Período — Clusterização
- 3º Período — Redes Neurais
- 4º Período — Visão Computacional
- 5º Período — Apresentações
- Objetivo: prever valores contínuos.
- MSE 🟦: erro médio ao quadrado, sensível a outliers.
- MAE 🟩: erro médio absoluto, menos sensível a outliers.
- Uso: MSE penaliza mais erros grandes; MAE mostra erro médio real.
- Definição: prever categorias a partir de dados.
- Exemplo: e-mails spam ou não spam.
- Lazy Learners 🐢: memorizam dados; adaptação rápida; predição lenta.
- Eager Learners 🚀: criam modelo; predição rápida; menos adaptáveis.
- Acurácia 📊: % de acertos (bom p/ dados balanceados).
- Precisão 🎯: positivos corretos / previstos positivos.
- Recall 🔍: positivos encontrados / positivos reais.
- F1-score ⚖️: equilíbrio entre precisão e recall.
- Objetivo: Criar um modelo de regressão para prever a qualidade do vinho verde (variedade vermelha ou branca) com base em dados químicos (ex.: acidez, pH, álcool).
- Dados: 11 atributos químicos; variável alvo: qualidade (score 0-10).
- Entrega: Individual, no GitHub pessoal.
- Atividade Completa
- Objetivo: Construir modelos de classificação binária para prever se a renda anual de um indivíduo é maior que US$ 50.000.
- Dados: 48.842 registros com 14 atributos demográficos e socioeconômicos (idade, educação, ocupação, etc.).
- Tarefas obrigatórias: Treinar Árvore de Decisão e Random Forest; avaliar com acurácia, precisão, recall e F1; gerar matriz de confusão e gráfico de importância.
- Tarefas opcionais: Análise exploratória, validação cruzada e redução de dimensionalidade.
- Atividade Completa
- Supervisionado: Prever classe (classificação) ou valor contínuo (regressão) usando dados rotulados.
- Não Supervisionado: Descobrir padrões e agrupar dados não rotulados, como em clusterização.
- Técnica de aprendizado não supervisionado que agrupa dados semelhantes em clusters.
- 🎯 Objetivo: Maximizar a similaridade dentro dos grupos e minimizar entre grupos diferentes.
- 🔍 Identificação automática de padrões sem necessidade de supervisão.
- 📉 Redução de dimensionalidade e simplificação dos dados.
- 🧩 Auxilia na tomada de decisão baseada em agrupamentos.
- 🚀 Inicialização: Escolha K centróides aleatórios.
- 🎯 Atribuição: Associe cada ponto ao centróide mais próximo.
- 🔄 Recalcular centróides: Média dos pontos em cada grupo.
- 🔁 Repetir: Até os centróides não mudarem (convergência).
- 📊 Inércia: Mede a qualidade dos clusters; valores menores indicam clusters mais compactos.
- 🔢 Número ideal de clusters: Determinado por análise da inércia ou métodos específicos.
- ⚙️ Existem outros modelos de clusterização além do K-means.
- 🚀 Implementar K-Means do zero em Python.
- 📊 Analisar Student Habits vs Academic Performance: levantar hipóteses, fazer EDA e revisar com resultados.
- 🔢 Justificar o número de clusters (K).
- 📚 Opcional: pesquisar DBSCAN, Hierarchical Clustering e algoritmo avançado.
💡 Dica: “Se você torturar os dados por tempo suficiente, eles confessarão.”
- Inspiradas no cérebro humano para aprender padrões complexos.
- Usadas em reconhecimento de imagem, tradução, previsão, entre outros.
- Não "pensam", mas capturam relações complexas nos dados.
- Perceptron, funções de ativação, pesos e bias.
- Feedforward, backpropagation e gradiente descendente.
- Função de custo, métricas de avaliação.
- Overfitting, underfitting, regularização e otimização.
- Implementação prática com TensorFlow e PyTorch.
- Stellar Classification Dataset (galáxias, quasares e estrelas) do Kaggle.
- 🛠️ Construir uma rede neural para classificar galáxias, quasares e estrelas.
- ⚙️ Testar variações na arquitetura, épocas e learning rate.
- 🔎 Identificar overfitting e underfitting, aplicando regularização.
- 💡 Opcional: criar rede neural “from scratch” em Python e testar outros datasets via Keras.
- Algoritmos de aprendizado profundo especializados em reconhecimento de objetos.
- Aplicações: classificação de imagens, detecção de objetos, segmentação, veículos autônomos, sistemas de segurança, etc.
- Inspiradas no córtex visual humano, com arquitetura hierárquica e conectividade local.
- Camadas Convolucionais: Aplicam filtros (kernels) para extrair padrões locais (bordas, formas).
- Função de Ativação (ReLU): Introduz não-linearidade e ajuda a aprender padrões complexos.
- Camadas de Pooling: Reduzem a dimensionalidade, destacando características importantes e ajudando a evitar overfitting.
- Camadas Totalmente Conectadas: Realizam a classificação final, geralmente usando Softmax para gerar probabilidades.
- Overfitting: Quando o modelo decora os dados de treino, mas falha em generalizar.
- Técnicas para mitigar:
- Dropout
- Batch Normalization
- Early Stopping
- Data Augmentation
- Regularização L1 e L2
- Classificação e organização automática de imagens.
- Detecção e localização de objetos em imagens.
- Reconhecimento facial para segurança.
- Veículos autônomos e diagnóstico médico.
- TensorFlow: Ferramenta completa para desenvolvimento e deploy.
- Keras: Interface simples para prototipagem rápida, roda sobre TensorFlow.
- PyTorch: Popular por seu grafo dinâmico e uso em pesquisa.
- Slides Redes Neurais Convolucionais
- Notebook Aplicação Multiclasse
- Extras sobre Utilização
- Notebook Extras
-
Implementar e treinar CNN para tarefas de visão computacional.
-
Explorar camadas convolucionais, pooling, ativação e regularização.
-
Aplicar técnicas para evitar overfitting.
-
Utilizar frameworks como TensorFlow, Keras ou PyTorch.
Nesta etapa, os grupos apresentam um modelo de IA, mostrando todo o aprendizado adquirido nos períodos anteriores. É o momento de compartilhar conhecimento, resultados e experiências.
- Comunicar ideias com clareza: Explicar conceitos e processos de forma objetiva e compreensível.
- Demonstrar aplicações práticas: Mostrar como os modelos estudados podem ser aplicados em situações reais.
- Analisar criticamente: Apontar pontos fortes, limitações e possíveis melhorias do modelo ou abordagem.
- Engajar o público: Incentivar perguntas, reflexões e discussões construtivas.
O 5º período é o clímax do ciclo de aprendizado, permitindo que cada grupo sintetize e compartilhe todo o conhecimento adquirido, além de exercitar habilidades essenciais de comunicação, trabalho em equipe e análise crítica de modelos de Inteligência Artificial e aprendizado de máquina.