Homework 5 by zmitserbio · Pull Request #1 · zmitserbio/BI_toolkit

zmitserbio · 2023-10-11T18:04:16Z

No description provided.

nvaulin

Привет!

Хорошая работа

Классный README, спасибо
Неплохая структура коммитов:)
Очень крутые изменения по прошлым ДЗ. На самом деле, не совсем все исправлено, но то что исправлено - оно прям основательно. Только смущает что одна из белковых функций так и не работает - отметил в коде.
По фильтратору - отличная работа. Мне понравилось что как ты структурировал модуль. С отдельными проверками, отдельными местами для хранения констант. Логика довольно хорошо разбита. Были некоторые комментарии. Из общих и самых частны выделю пожалуй следующее:

Константы называют капсом
Проверки типов делают функцией isinstance
У тебя оно конечно все работает и ок, но так просто принято.

Много мелких комментов по качеству кода, не везде уже их отмечал. Будь чуть аккуратнее с такими вещами как нейминги аннотации типов, следи за пробелами и пустыми строками. В этом плане любая IDE в помощь. Оно не критично, но тут вот чуть-чуть не хватило чтобы совсем идеально было.

Баллы

За модуль и качество кода 2.9/3
За работу над ДЗ 3 и 4 0.9/1
Функция падает с ошибкой::(( Но объем исправлений на самом деле поражает
README 2/2
За главную функцию фильтрации 1/1
За 3 фильтратора 3/3

Итого: 9.8

Виден очень большой прогресс, ты молодец! Продолжаем в том же духе 💪🏻

nvaulin · 2023-10-16T06:02:02Z

Очень основательное ридми, круто! Отдельный лайк за секцию Contacts and acknowledgements.

nvaulin · 2023-10-16T06:03:27Z

+    return
+    - no return
+    """
+    from modules.dna_rna_constants import dna_rna_alphabet


Импорты все таки лучше делать в начале скрипта вне функций. А то так каждый раз при вызове функции будет повторяться импорт

nvaulin · 2023-10-16T06:04:05Z

+    """
+    from modules.dna_rna_constants import dna_rna_alphabet
+    for seq in seqs:
+        if type(seq) != str:


Чаще принято все таки делать проверку через if isinstance(seq, str), хотя так тоже работает

Ты же кстати вроде в ДЗ 3 и использовал её уже

nvaulin · 2023-10-16T06:05:46Z

+            if i == 'T' or i == 't':
+                t_present = True
+            if i == 'U' or i == 'u':
+                u_present = True
+        if t_present and u_present:


В целом валидное решение с двумя флагами. Я лично чуть меньше люблю флаги, потому что за ними надо следить (а код иногда бывает очень большой). Но тут кажется это ок.

nvaulin · 2023-10-16T06:06:13Z

+            raise ValueError('Invalid input: all sequences must be of type str!')
+        t_present = False
+        u_present = False
+        for i in seq:


Тут все таки лучше не i, это же не счетчик какой-то или индекс, это нуклеотид.

Suggested change

for i in seq:

for nucl in seq:

nvaulin · 2023-10-16T08:54:43Z

+        for i in seqs[seq_name][0]:
+            if i not in fastq_dna_code:


Тут лучше было бы сделать проверку на множествах:)

nvaulin · 2023-10-16T08:54:56Z

@@ -0,0 +1,87 @@
+def check_fastq(seqs: dict):


Очень хорошая глубокая система проверок:)

nvaulin · 2023-10-16T10:43:12Z

+        for i in seqs[seq_name][0]:
+            if i not in fastq_dna_code:
+                raise ValueError('Invalid input: sequences must contain only letters "A", "T", "G", "C" in upper case!')
+        if seq_name[0] != '@':


Мб кстати тут лучше было бы не [0] а seq_name.startswith('@'). По сути одно и то же, но читается имхо сильно понятнее

nvaulin · 2023-10-16T10:44:27Z

+    for nucleotide in seq:
+        if nucleotide == 'G' or nucleotide == 'C':
+            gc_sum += 1
+    return gc_bounds[0] <= gc_sum/len(seq)*100 <= gc_bounds[1]


Хех, компактность огонь:)
Мб деление на длину и умножение на 100 стоило бы даже на отдельную строчку вынести, все таки отдельный шаг логики

nvaulin · 2023-10-16T10:44:45Z

+    return:
+    - (bool): whether length of a sequence is in the range provided
+    """
+    return length_bounds[0] <= len(seq) <= length_bounds[1]


zmitserbio added 17 commits October 11, 2023 15:07

Create file for dna_rna_constants

f981ca9

Create file for dna_rna_tools

f468451

Create file for protein_tools

8dabc17

Create file for protein_constants

12dfcc1

Create file for fastq_filtration_tool

6fc8f0a

Create file for fastq_constants

4ace5e0

Add description of dna_rna_tools toolkit in README.md

6e7d0b3

Add description of protein_tools toolkit in README.md

d6d024f

Add description of fastq_filtration toolkit in README.md

c24d68d

Add revised code to dna_rna_tools.py

474cdfd

Add constants to dna_rna_constants.py

3ee2705

Remove blank line at end of file in dna_rna_tools.py

4fecad5

Add constant to fastq_constants.py

cefbd5f

Add subfunctions for run_fastq_filtration to fastq_filtration_tools.py

3632c7f

Add constants to protein_constants.py

b98fe39

Add revised code to protein_tools.py

407c777

Create main function and subfunctions in beginner_bioinf_tools.py

027829b

nvaulin reviewed Oct 16, 2023

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Homework 5#1

Homework 5#1
zmitserbio wants to merge 17 commits into
mainfrom
development

zmitserbio commented Oct 11, 2023

Uh oh!

nvaulin left a comment •

edited

Loading

Uh oh!

nvaulin Oct 16, 2023

Uh oh!

nvaulin Oct 16, 2023

Uh oh!

nvaulin Oct 16, 2023

Uh oh!

nvaulin Oct 16, 2023

Uh oh!

nvaulin Oct 16, 2023

Uh oh!

nvaulin Oct 16, 2023

Uh oh!

nvaulin Oct 16, 2023

Uh oh!

nvaulin Oct 16, 2023

Uh oh!

nvaulin Oct 16, 2023

Uh oh!

nvaulin Oct 16, 2023

Uh oh!

nvaulin Oct 16, 2023

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

zmitserbio commented Oct 11, 2023

Uh oh!

nvaulin left a comment • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Баллы

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

nvaulin left a comment •

edited

Loading