Данный репозиторий содержит выполненную лабораторную работу по теме "Поиск ассоциативных правил и выявление скрытых структур в данных."
Мне было интересно поработать над задачей анализа покупательской корзины, ведь это очень актуальная задача как в бизнесе, так и во многих других сферах нашей жизни. В ходе проекта я освоил ассоциативный анализ с FP-growth и правилами ассоциации, визуализацию транзакций и меры центральности, а также методы NMF и TSNE для проекции многомерных данных на плоскость и поиска независимых товаров.
Анализ покупательской корзины является довольно важной задачей, ведь она позволяет бизнесу увеличивать продажи и удерживать клиентов, путем выявления интересных правил в предпочтениях клиентов при выборе товаров/услуг. Машинное обучение позволяет автоматизировать и масштабировать этот процесс.
Выявление скрытых структур в данных позволяет уменьшать их размерность, сохраняя суть, создавать интерпретируемые проекции многомерных данных на простые структуры. Это позволяет решать практические задачи выявления невидимых связей между товарами и покупателями, предсказания спроса, выявления рисков и мошенничества, а также создания персональных рекомендаций
- Pandas
- Mlxtend
- NetworkX
- Matplotlib
- Scikit-learn
- VarClusHi
Searching for associative rules and identifying hidden structures in data
This repository contains completed laboratory work on the topic “Searching for associative rules and identifying hidden structures in data.”
I was interested in working on the task of analyzing shopping carts, as this is a very relevant task both in business and in many other areas of our lives. During the project, I mastered associative analysis with FP-growth and association rules, transaction visualization and centrality measures, as well as NMF and TSNE methods for projecting multidimensional data onto a plane and searching for independent products.
Shopping cart analysis is a rather important task, as it allows businesses to increase sales and retain customers by identifying interesting patterns in customer preferences when choosing goods/services. Machine learning allows this process to be automated and scaled.
Why is it necessary to identify hidden data structures?
Identifying hidden structures in data allows you to reduce its dimensionality while preserving its essence, creating interpretable projections of multidimensional data onto simple structures. This allows you to solve practical problems of identifying invisible connections between products and customers, predicting demand, identifying risks and fraud, and creating personalized recommendations.
- Pandas
- Mlxtend
- NetworkX
- Matplotlib
- Scikit-learn
- VarClusHi


