Skip to content

Task description and first architecture#3

Open
vladiprof wants to merge 6 commits into
konev-artem:masterfrom
vladiprof:features/basic_docs
Open

Task description and first architecture#3
vladiprof wants to merge 6 commits into
konev-artem:masterfrom
vladiprof:features/basic_docs

Conversation

@vladiprof

Copy link
Copy Markdown

No description provided.

Comment thread docs/draft.md
В статье [1] рассматриваются два типа алгоритмов: Baseline/Baseline++ и Meta-learning.
Для работы требуется разделить датасет на два **Base** и **Novel**, так, что множество классов в Base и Novel не пересекаются. Далее обучение происходит на Base датасете, а тестирование на Novel. Так же можно в качестве Base и Novel использовать множества примеров из разных датасетов.

Алгоритмы настраивают классисификатор над вложениями(эмбединги) которые выдает базовая сетка. В статьях базовая сетка называется **Basenet** или **BackboneNet**. Классификатор на вложениях называют **Classifier** .

Copy link
Copy Markdown
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

ни разу не встречал слово "вложение" в таком контексте, оно действительно существует?

Comment thread docs/draft.md
### Fine-tuning/Meta-testing stage
На этой стадии происходит замер средней точности и стандартного отклонения на некотором количестве эпизодов, данные для эпизодов берутся из Novel датасета.
Из статей не ясно:
1. Нужно ли изменять веса базовой сетки во время обучения в эпизоде Baseline/Baseline++ модели?

Copy link
Copy Markdown
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Во время тестирования веса не меняют:
To adapt the model to recognize novel classes in the fine-tuning stage, we fix the pre-trained network parameter θ in our feature extractor fθ and train a new classifier C(.|Wn) (parametrized by the weight matrix Wn)

Comment thread docs/draft.md
На этой стадии происходит замер средней точности и стандартного отклонения на некотором количестве эпизодов, данные для эпизодов берутся из Novel датасета.
Из статей не ясно:
1. Нужно ли изменять веса базовой сетки во время обучения в эпизоде Baseline/Baseline++ модели?
1. Нужно ли "сбрасывать" параметры классификатора/классификационной модели между эпизодами?

Copy link
Copy Markdown
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Да, эпизоды обрабатываются независимо

Comment thread docs/draft.md
@@ -0,0 +1,125 @@
## Введение

Copy link
Copy Markdown
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Давай назовем файл draft_rus.md

Comment thread docs/draft.md

### Обучение базовой сетки
Про обучение базовой сетки ничего не нашел в данных статьях. Возможны следующие сценарии:
1. Инициализация сетки случайными весами

Copy link
Copy Markdown
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

имеется в виду использвоать feature extractor'ор со случайными весами? такого не встречал

Comment thread docs/draft.md
1. Инициализация сетки случайными весами
1. Использовать предобученные параметры. Здесь надо удостоверится, что мы не используем веса полученные на ImageNet, и, затем тестируемся на tinyImagenet.
1. Обучить сетку на Base датасете как классификатор. Обучение базовой сетки нужно провести на TrainSet, предварительно разделив его на Train и **Validation**, при этом данные множества могут пересекаться по классам.
В результате получаем веса для сетки.

Copy link
Copy Markdown
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

не совсем понял, как ты задумаывал этот документ, но, кажется, было бы проще воспринимать, если бы последовательность действий была описана для каждой статьи по отдельности

Comment thread docs/draft.md

#### prepare_datasets.py
*Вход*. Путь к папке в которую необходимо скачать и разложить датасеты
*Выход*. Папка с датасетами со следующей структурой:

Copy link
Copy Markdown
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

от такого строения мы вроде бы отказались

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants