Skip to content

Develop2 file hw#2

Open
CaptnClementine wants to merge 57 commits into
mainfrom
develop2_file_hw
Open

Develop2 file hw#2
CaptnClementine wants to merge 57 commits into
mainfrom
develop2_file_hw

Conversation

@CaptnClementine
Copy link
Copy Markdown
Owner

No description provided.

CaptnClementine and others added 30 commits October 6, 2023 22:11
 This function counts sulphur-containing amino acids (Cysteine and Methionine) in a protein sequence.
for nucl in seqs:
if is_dna(nucl) and is_rna(nucl):
ambigiuos = ambigiuos + 1
else:
Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Suggested change
else:
else:

Из-за отсутствия отступов основная функция не импортируется :(

Comment thread gene_code_utils/filter_dna_utils.py Outdated
None
"""
with open(input_fasta) as fasta_file:
data = fasta_file.readlines()
Copy link
Copy Markdown

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

если файл большой, то readlines() забьют оперативную память, лучше использовать readline()

@pavlovanadia
Copy link
Copy Markdown

pavlovanadia commented Oct 29, 2023

_ No description provided. _

Комментарии:

  • Хорошая логика и структура кода!
  • У файла gene_code_main_operations нет расширения, так из него ничего не сможет импортироваться
  • При записи файла результата фильтрации нет переноса строки в строках, относящихся к одному риду, в итоге на одну строку записываются и название, и последовательность, и комментарий, и качество
  • convert_multiline_fasta_to_oneline, если ей передать имя выходного файла без расширения (напр, 'test_res'), не добавляет к нему расширение
  • select_genes_from_gbk_to_fasta не записывает в файл имена белков, а только аминокислотную последовательность =(
  • change_fasta_start_pos при записи в файл выдает результат не на одной строке, а на двух из-за того, что в output_list попадает символ переноса строки
  • parse_blast_output - из файла вытаскиваются другие белки, чем ожидается, кажется, проблема в том, как задается условие

Итог:

  • Доработка FASTQ-модуля - 1.5 балла
  • convert_multiline_fasta_to_oneline - 3.8 балла (-0.2 за отсутствие расширения выходного файла)
  • select_genes_from_gbk_to_fasta - 3.8 балла (-0.2 за отсутствие имен генов)
  • change_fasta_start_pos - 1 доп. балл
  • parse_blast_output - 1 доп балл
  • -0.2 за незначительные ошибки (отступы, расширение файла - этого всего можно избежать, если тестировать свой код)
  • -0.2 за readlines()
  • -1 за отсутствие PR

Сумма: 7.9 балла + 2 дополнительных
Молодец, хорошая работа!)

CaptnClementine and others added 2 commits October 31, 2023 19:07
Co-authored-by: pavlovanadia <111665536+pavlovanadia@users.noreply.github.com>
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants