Task description and first architecture#3
Conversation
| В статье [1] рассматриваются два типа алгоритмов: Baseline/Baseline++ и Meta-learning. | ||
| Для работы требуется разделить датасет на два **Base** и **Novel**, так, что множество классов в Base и Novel не пересекаются. Далее обучение происходит на Base датасете, а тестирование на Novel. Так же можно в качестве Base и Novel использовать множества примеров из разных датасетов. | ||
|
|
||
| Алгоритмы настраивают классисификатор над вложениями(эмбединги) которые выдает базовая сетка. В статьях базовая сетка называется **Basenet** или **BackboneNet**. Классификатор на вложениях называют **Classifier** . |
There was a problem hiding this comment.
ни разу не встречал слово "вложение" в таком контексте, оно действительно существует?
| ### Fine-tuning/Meta-testing stage | ||
| На этой стадии происходит замер средней точности и стандартного отклонения на некотором количестве эпизодов, данные для эпизодов берутся из Novel датасета. | ||
| Из статей не ясно: | ||
| 1. Нужно ли изменять веса базовой сетки во время обучения в эпизоде Baseline/Baseline++ модели? |
There was a problem hiding this comment.
Во время тестирования веса не меняют:
To adapt the model to recognize novel classes in the fine-tuning stage, we fix the pre-trained network parameter θ in our feature extractor fθ and train a new classifier C(.|Wn) (parametrized by the weight matrix Wn)
| На этой стадии происходит замер средней точности и стандартного отклонения на некотором количестве эпизодов, данные для эпизодов берутся из Novel датасета. | ||
| Из статей не ясно: | ||
| 1. Нужно ли изменять веса базовой сетки во время обучения в эпизоде Baseline/Baseline++ модели? | ||
| 1. Нужно ли "сбрасывать" параметры классификатора/классификационной модели между эпизодами? |
There was a problem hiding this comment.
Да, эпизоды обрабатываются независимо
| @@ -0,0 +1,125 @@ | |||
| ## Введение | |||
There was a problem hiding this comment.
Давай назовем файл draft_rus.md
|
|
||
| ### Обучение базовой сетки | ||
| Про обучение базовой сетки ничего не нашел в данных статьях. Возможны следующие сценарии: | ||
| 1. Инициализация сетки случайными весами |
There was a problem hiding this comment.
имеется в виду использвоать feature extractor'ор со случайными весами? такого не встречал
| 1. Инициализация сетки случайными весами | ||
| 1. Использовать предобученные параметры. Здесь надо удостоверится, что мы не используем веса полученные на ImageNet, и, затем тестируемся на tinyImagenet. | ||
| 1. Обучить сетку на Base датасете как классификатор. Обучение базовой сетки нужно провести на TrainSet, предварительно разделив его на Train и **Validation**, при этом данные множества могут пересекаться по классам. | ||
| В результате получаем веса для сетки. |
There was a problem hiding this comment.
не совсем понял, как ты задумаывал этот документ, но, кажется, было бы проще воспринимать, если бы последовательность действий была описана для каждой статьи по отдельности
|
|
||
| #### prepare_datasets.py | ||
| *Вход*. Путь к папке в которую необходимо скачать и разложить датасеты | ||
| *Выход*. Папка с датасетами со следующей структурой: |
There was a problem hiding this comment.
от такого строения мы вроде бы отказались
No description provided.