Skip to content

Develop#1

Open
CaptnClementine wants to merge 34 commits into
mainfrom
develop
Open

Develop#1
CaptnClementine wants to merge 34 commits into
mainfrom
develop

Conversation

@CaptnClementine
Copy link
Copy Markdown
Owner

This branch was done for 5's homework

CaptnClementine and others added 30 commits October 6, 2023 22:11
 This function counts sulphur-containing amino acids (Cysteine and Methionine) in a protein sequence.
Copy link
Copy Markdown

@albidgy albidgy left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Хорошая работа!

Плюсы:

  • Отличные комментарии к коммитам.
  • Подробный и понятный README.
  • Код по работе с FASTQ выглядит очень хорошо. Работает все верно, за исключением того, что не учтена возможность подачи gc_bounds числа с плавающей точкой.
  • Здесь как раз можно было посмотреть прогресс студента, у тебя очень хорошие успехи:)
  • Стилистика кода, нейминг в последней части домашнего задания - отлично.

Замечания:

  • Недостаточно внимания уделила прошлым заданиям. В основном это касается стилистики кода (см. комментарии).
  • Главный скрипт не в формате .py
  • Не убран import в середине главного скрипта
  • В dna_rna_tools_utils.py нет импорта Typing

Баллы:

  • 3 фильтрации FASTQ 3/3
  • Главная функция 0.2/1 (нет формата .py, забыла убрать import в середине скрипта, нельзя подать float в gc_bounds)
  • README 2/2
  • Структура репозитория и качество кода 2.5/3. Нет импорта Typing, пробелы, нейминг (i), отступы, лишние скобки в if. По большей части это все штрафы с прошлых ДЗ, которые нужно было бы поправить.
  • Улучшение кода ДНК/РНК и белковых тулов 0.5/1

Итого: 8.2 балла

Comment on lines +1 to +2
DNA = set ('ATGCatgc')
RNA = set ('AUGCaugc')
Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Здорово, что учла комметарий от Никиты.
Есть недочет: между функцией (в данном случае у тебя функция преобразования типа) и аргументом пробел не ставится.

Suggested change
DNA = set ('ATGCatgc')
RNA = set ('AUGCaugc')
DNA = set('ATGCatgc')
RNA = set('AUGCaugc')

Comment on lines +4 to +8
"a": "a", "A": "A",
"t": "u", "T": "U",
"u": "t", "U": "T",
"g": "g", "G": "G",
"c": "c", "C": "C"
Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Просто на будущее: обычно используют или одинарные, или двойные кавычки. Лучше выбрать один стиль.

return unique_chars <= RNA


def type_rna_or_dna(seqs: List[str]) -> str:
Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Нет импорта List, код не запустится.

counter_rna = 0
ambigiuos = 0
for i in seqs:
if is_dna(i) and is_rna(i):
Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Не хватает отступов.

Suggested change
if is_dna(i) and is_rna(i):
if is_dna(i) and is_rna(i):

ambigiuos = 0
for i in seqs:
if is_dna(i) and is_rna(i):
ambigiuos = ambigiuos+1
Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Не хватает пробелов.

Suggested change
ambigiuos = ambigiuos+1
ambigiuos = ambigiuos + 1

Comment thread gene_code_main_operations
return filtered_seqs


from amino_analyzer_utils import aa_weight, count_hydroaffinity, peptide_cutter, one_to_three_letter_code, sulphur_containing_aa_counter
Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

все импорты лучше выносить в начало файла. А этот спорт работать не будет, потому что скрипт amino_analyzer_utils находится в директории gene_code_utils. Видимо, ты забыла удалить эту строку, но с ней код работать не будет.

Comment thread gene_code_main_operations
@@ -0,0 +1,145 @@
from typing import Dict, Tuple, Union
Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Вообще ничего не будет работать, потому что этот файл не имеет расширения .py

Comment thread gene_code_main_operations
filtered_seqs = dict()
for fastq_name, (seq, quality) in seqs.items():
if is_dna(seq):
if type(gc_bounds) == int:
Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

а если ввести, например, gc_bound=44.4 работать не будет.

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Спасибо

Comment on lines +133 to +138
u_to_t = {'U': 'T', 'u': 't'}
for i in seq:
if i in u_to_t:
c_dna.append(u_to_t.get(i))
else:
c_dna.append(i)
Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Лучше было сделать также, как и функцию transcribe.

Comment thread gene_code_main_operations
"""

filtered_seqs = dict()
for fastq_name, (seq, quality) in seqs.items():
Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Здорово! 👍

Copy link
Copy Markdown
Owner Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Спасибо за проверку!

@CaptnClementine
Copy link
Copy Markdown
Owner Author

CaptnClementine commented Oct 17, 2023 via email

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants