ViralQC
Instalação
Pré-requisitos
Instalação via pip
Passo 1: Instalar Dependências
Passo 2: Instalar ViralQC
Passo 3: Verificar Instalação
Instalação a partir do código-fonte
Passo 1: Clonar o Repositório
Passo 2: Criar Ambiente Conda
Passo 3: Instalar ViralQC
Passo 4: Verificar Instalação
Configuração de Datasets
Estrutura do arquivo datasets.yml
Datasets do Nextclade
Datasets do GitHub
Parâmetros de Configuração
Lógica de Pontuação
Por Que Um Sistema Próprio?
Métricas de Qualidade
1. missingDataQuality - Qualidade de Dados Ausentes
2. privateMutationsQuality - Qualidade de Mutações Privadas
3. mixedSitesQuality - Qualidade de Sítios Mistos
4. snpClustersQuality - Qualidade de Clusters de SNPs
5. frameShiftsQuality - Qualidade de Frameshifts
6. stopCodonsQuality - Qualidade de Códons de Parada
Cálculo do genomeQuality
Extração de Regiões-Alvo
Comandos e Uso
get-nextclade-datasets
Uso
Parâmetros
Estrutura de Saída
get-blast-database
Uso
Parâmetros
Filtragem por Data de Release
Versão do Banco
Estrutura de Saída
run
Uso
Parâmetros Obrigatórios
Parâmetros de Saída
Parâmetros de Datasets
Parâmetros do Nextclade Sort
Parâmetros do BLAST
Tipos de Tarefa BLAST
Parâmetros de Sistema
Exemplo Completo
Fluxo de Análise
API
Uso
Atributos e Métodos
Como Adicionar Novos Datasets
Adicionando Dataset do Nextclade
Passo 1: Identificar o Dataset
Passo 2: Editar datasets.yml
Passo 3: Obter Informações Taxonômicas
Passo 4: Testar
Adicionando Dataset do GitHub
Passo 1: Preparar Repositório
Passo 2: Adicionar ao datasets.yml
Passo 3: Testar
Estrutura de Saída
Arquivo Principal: results.tsv (ou .csv, .json)
1. Identificação da Sequência
2. Métricas de Qualidade (Sistema A-D do ViralQC)
3. Métricas de Qualidade (Nextclade)
4. Cobertura e Regiões
5. Mutações Nucleotídicas
6. Mutações de Aminoácidos
7. Mutações Privadas (Detalhadas)
Arquivos de Regiões-Alvo
sequences_target_regions.bed
sequences_target_regions.fasta
Arquivos de Anotação
gff_files/
gff_files/per_sample/
tbl_files/
tbl_files/per_sample/
Exemplos Práticos
Exemplo 1: Análise Básica de Dengue
Exemplo 2: Influenza (Múltiplos Segmentos)
Exemplo 3: Análise Metagenômica
Exemplo 4: Banco de Dados Reproduzível
Exemplo 5: Saída em JSON
Exemplo 6: Busca BLAST Sensível
Solução de Problemas
Problema 1: Comando
vqc
não encontrado
Problema 2: Erro ao baixar datasets
Problema 3: Banco BLAST não encontrado
Problema 4: Nenhuma sequência mapeada
Problema 5: Erros de memória
Problema 6: Permissão negada
Problema 7: Datasets do GitHub não baixados
Obtendo Ajuda
Guia do Desenvolvedor
Gerenciamento de datasets (Datasets)
get_github_dataset.py
jsonl_to_gff.py
get_minimizer_index.py
Pipeline de Análise
format_nextclade_sort.py
blast_wrapper.py
reorder_cds.py
post_process_nextclade.py
extract_target_regions.py
ViralQC
Índice
Índice