Hw6 files by Alisa411 · Pull Request #2 · Alisa411/fast_seqs

Alisa411 · 2023-10-19T12:11:45Z

No description provided.

…for cycle

…an_wunsch

…ctions

…'T' nucleotides

…_script.py

nvaulin

Привет!

README, хороший, но кажется не обновлен:)
Названия коммитов не забывай делать с загавной буквы) В остальном оу
По поводу FASTQ-модуля. Ты добавила чтение и запись, но таким образом что этим вообще невозможно воспользоваться. Кажется все части у тебя написаны правильно, поэтому ставлю 1/2, но к сожалению их надо еще соединить как надо.
Не нашел остальных функций. Если ты их и не писала - то ок. Если что сможешь потом сдать на половину баллов.
Обидные ошибки с импортами из-за который весь код падает с ошибкой:)

Баллы

Добработка FASTQ-модуля: 1/2 балла
convert_multiline_fasta_to_oneline: 0/4 балла
select_genes_from_gbk_to_fasta: 0/4 балла

Итого: 1 балл

nvaulin · 2023-10-22T17:20:31Z

+from data_processing_scripts.dna_rna_tools import transcribe, reverse, complement, reverse_complement
+from data_processing_scripts.das_protein_tools import get_pI, calculate_aa_freq, translate_protein_rna, convert_to_3L_code, protein_mass
+from data_processing_scripts.fastq_script import main_fastq_tools, parse_file, save_filtered_fastq
+import data_processing_scripts.dna_rna_dict as drd
+import data_processing_scripts.protein_dict as prd
+import os


Suggested change

from data_processing_scripts.dna_rna_tools import transcribe, reverse, complement, reverse_complement

from data_processing_scripts.das_protein_tools import get_pI, calculate_aa_freq, translate_protein_rna, convert_to_3L_code, protein_mass

from data_processing_scripts.fastq_script import main_fastq_tools, parse_file, save_filtered_fastq

import data_processing_scripts.dna_rna_dict as drd

import data_processing_scripts.protein_dict as prd

import os

import os

import data_processing_scripts.dna_rna_dict as drd

import data_processing_scripts.protein_dict as prd

from data_processing_scripts.dna_rna_tools import transcribe, reverse, complement, reverse_complement

from data_processing_scripts.das_protein_tools import get_pI, calculate_aa_freq, translate_protein_rna, convert_to_3L_code, protein_mass

from data_processing_scripts.fastq_script import main_fastq_tools, parse_file, save_filtered_fastq

nvaulin · 2023-10-22T17:21:11Z

+import os
+
+
+def main_dna_rna_tools(*args: str):


Функции должны называться глаголами

Ну че ж тут как то как будто мы студенты:))

Suggested change

def main_dna_rna_tools(*args: str):

def run_dna_rna_tools(*args: str):

nvaulin · 2023-10-22T17:21:19Z

+    return results if len(results) > 1 else results[0]
+
+
+def main_protein_tools(*args: str):


Suggested change

def main_protein_tools(*args: str):

def run_protein_tools(*args: str):

nvaulin · 2023-10-22T17:21:44Z

+    action = args[-1]
+    sequences = args[:-1]
+    action_list = {
+        "get_pI": get_pI,


В питоне названия функций - только в нижнем регистре:)

nvaulin · 2023-10-22T17:23:50Z

+
+    return result
+
+def main_fastq(input_path: str, output_filename: str = None):


Suggested change

def main_fastq(input_path: str, output_filename: str = None):

def run_fastq_filter(input_path: str, output_filename: str = None):

или

Suggested change

def main_fastq(input_path: str, output_filename: str = None):

def filter_fastqinput_path: str, output_filename: str = None):

Тем не менее, тут большая ключевая ошибка. Надо было в исходной функции заменить прием словаря на прием пути. Ты добавила по сути "функцию-обертку" снаружи (и это в цело ок), но которая не принимает никаких аргументов для фильтрации... Как я могу воспользоваться фильтром? В этой функции я не могу задать условия для фильтра, в функции из дз 5 я не могу передать файл.

nvaulin · 2023-10-22T17:35:23Z

+# Here should be a python script
+
+
+def parse_file(filename):


Ну тут же не просто файл:)

Suggested change

def parse_file(filename):

def read_fastq(path):

nvaulin · 2023-10-22T17:35:59Z

+
+def parse_file(filename):
+    with open(filename, 'r') as f:
+        lines = f.read().split('\n')


По сути ты сделала f.readlines, но в два притопа:)

В целом ок, но было бы круче написать это не читая весь файл за раз

nvaulin · 2023-10-22T17:36:43Z

+        # print(len(lines))
+        # print(*lines, sep="\nx\n")


Ну тут в продакшене такие отладки не надо оставлять

nvaulin · 2023-10-22T17:37:29Z

+            line = lines[i].strip()
+            # Parse 4 lines per 1 sequence
+            # The first line should contain '@' sign
+            if line.startswith('@'):


Все равно получается привязываешься к какому то содержанию. Тут оно нам не шибко в помощь, нельзя полагаться на то что нам не гарантировано в общем случае. Лучше просто по 4 читать независимо от символов.

nvaulin · 2023-10-22T17:48:02Z

+        for sequence_id, (sequence, quality) in filtered_data.items():
+            f.write(f"{sequence_id}\n{sequence}\n+\n{quality}\n")


В целом гуд, +- так и ожидалось. Но тут большая проблемка есть:)
Ты не стала читать строку с комментарием вместо неё тут записала "+". Ты получается услугу 2 по цене 1 тут продаешь:) Мы вам не только ваши данные отфильтруем, так еще и почистим от всяких комментариев которые вам могут быть нужны!

Не, коммент тут очень важно оставить как есть, не надо ничего делать из того что человек не просил (да и у вас нигде вроде не заявлено, ни в док стрингах ни в ридми, мол а еще вам в подарок удаляем треть информции)

Alisa411 and others added 30 commits October 8, 2023 15:26

Initial commit

0f4d9a9

add gc_content function

ed1312f

add seq_length function

d3316d0

add comment for seq_length function

4bafafa

add mean_encoding_offset function

a777063

fix return in seq_length function

862ae1a

fix var in gc_content function and add main function

b3e5d9f

delete example of usage

40e7678

move file from fast_seqs to data_processing_script folder

88c6097

fix bags in transcribe, complement, reverse_complement functions and …

bb73cd0

…for cycle

move fastq.py to the data_processing_script directory

2916b38

add das_protein_tools.py file

4029176

fix bugs in the functions and delete build_scoring_matrix and needlem…

d032f19

…an_wunsch

add dictionaries as protein_dict.py file

517c30f

add set of letters corresponding to amino acids

cea8cba

correct the name of AA_LETTERS set

63ce202

fix bugs corresponded to import protein_dict.py

939fa7b

create a new dictionary for dna/rna sequences

03d00be

add dictionaries for transcribe and complement functions

74c3c87

delete dictionaries

f5c0e56

add import of dna_rna_dict

477a767

add dictionaries for dna and rna letters

9f96328

delete function determining protein sequence

ede9207

add dockstrings to each function

f85eea1

correct input as only dna or rna sequences in main and transcribe fun…

bf40edd

…ctions

fix bug in main function: now cannot take sequence with both 'U' and …

6574845

…'T' nucleotides

add import of dna_rna_dict module

0ed9813

add main_script.py file for writing main functions

33526e0

correct the main function

d8918a2

change the name file to fastq_tools.py

b5cf7bd

Alisa411 added 23 commits October 8, 2023 15:26

change the name of the main function

678e3ed

change the name of the main function

65c162d

fix bugs

c5d152e

add a blank row at the end of file

43e5743

add dna_rna_dict.py in fast_seqs directory

d4cc9af

Update README.md file

5fe8b0f

Add 'with open' function parsing fastq file

587d33d

Add save file and main functions

bab64ab

Add comments to the functions

047179d

Add dockstring to the main function

6b9f4d8

delete unnecessary comments

d06527b

rename from test_script to fastq_script

96337fc

delete main function

3816326

add main function from fastq_script

22a07d7

move fastq_script to data_processing_scripts folder

3209330

delete fastq_script.py

ee2e3f9

delete test_script.py

735144e

delete fastq_tools.py

2f0861f

delete main_protein_tools function

a92a42c

delete main_dna_rna_tools function

d9135e5

add main functions from das_protein_tools.py, dna_rna_tools.py, fastq…

315727c

…_script.py

delete dna_rna_dict from fast_seqs directory

3decccf

rename function from main to main_fastq

6970ad3

nvaulin reviewed Oct 22, 2023

View reviewed changes

Alisa411 and others added 6 commits December 2, 2023 00:37

Edit function names

1099272

Add convert_multiline_fasta_to_oneline function

cc93537

Add example of multiline fasta

f05c1d3

Add shift_example.fasta file

aa94512

Fix sequence name line in shift function

c479b26

Update README.md

c7b609c

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Hw6 files#2

Hw6 files#2
Alisa411 wants to merge 60 commits into
mainfrom
HW6_Files

Alisa411 commented Oct 19, 2023

Uh oh!

nvaulin left a comment

Uh oh!

nvaulin Oct 22, 2023

Uh oh!

nvaulin Oct 22, 2023

Uh oh!

nvaulin Oct 22, 2023

Uh oh!

nvaulin Oct 22, 2023

Uh oh!

nvaulin Oct 22, 2023

Uh oh!

nvaulin Oct 22, 2023

Uh oh!

nvaulin Oct 22, 2023

Uh oh!

nvaulin Oct 22, 2023

Uh oh!

nvaulin Oct 22, 2023

Uh oh!

nvaulin Oct 22, 2023

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

	def main_dna_rna_tools(*args: str):
	def run_dna_rna_tools(*args: str):

		return results if len(results) > 1 else results[0]


		def main_protein_tools(*args: str):

	def main_protein_tools(*args: str):
	def run_protein_tools(*args: str):


		return result

		def main_fastq(input_path: str, output_filename: str = None):

	def main_fastq(input_path: str, output_filename: str = None):
	def run_fastq_filter(input_path: str, output_filename: str = None):

	def main_fastq(input_path: str, output_filename: str = None):
	def filter_fastqinput_path: str, output_filename: str = None):

		for sequence_id, (sequence, quality) in filtered_data.items():
		f.write(f"{sequence_id}\n{sequence}\n+\n{quality}\n")

Conversation

Alisa411 commented Oct 19, 2023

Uh oh!

nvaulin left a comment

Choose a reason for hiding this comment

Баллы

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants