Procedimentos

      Esse material apresenta uma explicação detalhada dos procedimentos de análise realizados no projeto de Iniciação Científica “Perfil alélico HLA-B em pacientes admitidos por COVID-19 na Unidade de Tratamento Intensivo (UTI) do Hospital Municipal Padre Germano Lauck (Foz do Iguaçu/PR, Brasil) entre 2020 e 2021”, realizado com apoio do CNPq e da Universidade Federal da Integração Latino-Americana (UNILA). O projeto foi conduzido pelo bolsista Samuel Chagas de Assis, graduando em Biotecnologia, e orientado pela Profa. Dra. Maria Cláudia Gross com co-orientação da Profa. Dra. Maria Leandra Terencio e do Prof. Dr. Carlos Henrique Schneider. O grupo controle está fora do escopo dessa parte do projeto, o objetivo desse trabalho foi identificar padrões clínicos e genéticos na UTI entre 2020 e 2021. Futuramente, o grupo controle (enfermaria 2020) será incluído.

Mais informações podem ser acessadas em:

Dados (Entrada e Resultados)

Descrição das Figuras e Tabelas:


Tabela 1

      A tabela com as variáveis clínicas foi processada a partir do pacote R gt_summary utilizando os dados coletados em data_final. Sendos todas as comparações de grupos independentes, os p-valores foram calculados por teste rank sum de Wilcoxon (ou Mann-Whitney U) para variáveis contínuas não-paramétricas, teste de qui-quadrado de Pearson ou teste exato de Fisher bicaudal para variáveis categóricas, aplicadas em amostras menores (alguma amostragem <10) ou maiores, respectivamente. Váriaveis paramétricas e não-paramétricas foram representadas como médias (DP - Desvio Padrão) e mediana (IQR - intervalo interquartil), respectivamente. As amostragens de 2020 e 2021 foram analisadas separadamente (2020 vs. 2021) e sub-agrupadas em relação ao desfecho de cada paciente (Alta20 vs. Obito20 e Alta21 vs. Obito21).


Figura 1 e Tabela 2

      As Figuras 1 e Tabela 2 apresentam a frequência dos alelos identificados a partir da genotipagem (descritos no relatório) dos grupos amostrais de 2020 e 2021, além da análise estatística.

Figura 1

      A Figura 1A foi obtida através do pacote R ggplot2 e apresenta a frequência dos alelos em ambos anos amostrais. Os alelos com menor frequência de ocorrência (<5% ou <5 ocorrências) de cada ano foram agrupados para reduzir a interferência de possíveis erros de sequenciamento e os níveis de variações de outliers presentes nas amostragens. A linha tracejada marca o limiar n = 5 e as anotações destacadas do eixo x representam os alelos não agrupados em binned, grupo de alelos com frequência <%5. A Figura 1B representa as frequências obtidas a partir de cada ano e sub-agrupadas nos desfechos.

Figura 1 - Frequência dos alelos identificados. (A) agrupados em ano de coleta e (B) desfecho por ano de coleta. A linha tracejada em (A), n = 5, identifica os alelos com menor e maior frequência; as anotações destacadas no eixo x representam os alelos de maior frequência, não agrupados em “binned”.

      Os testes foram conduzidos com significância estatística de 0.05 e realizados utilizando o pacote R rstatixcom a função row_wise_fisher_test(). As frequências de cada uma dos agrupamentos presente na Figura 1 foram testados pelo Teste Exato de Fisher bicaudal em tabela de contigência 2x2, inserindo o número de ocorrência dos alelos em cada estratificação (Grupo 1 (n) e Grupo 2 (n)) e o total de ocorrências em cada estratificação para outros alelos (Outros 1 (n) e Outros 2(n)). Nos quatro testes realizados, o p-valor foi corrigido para múltiplas comparações utilizando a abordagem de Bonferroni. Os p-valores não ajustados menores que 0.1 são apresentados na Tabela 2 e disponibilizados integralmente na Tabela S1.


Figura 2

      As variáveis e indicadores clínicos foram correlacionadas utilizando o pacote R correlation. As varíáveis independentes foram selecionadas considerando baixo percentual de dados ignorados/faltantes e em nível de significância comparado aos relatos da literatura. Além disso, variáveis dependentes, desfechou ou tempo de hospitalização, foram adicionadas buscando compreender a interação entre as variáveis para definição de potenciais preditores e confudidores que podem ser adicionados nos modelos de regressão. A função correlation() foi ajustada para função automática (“auto”), buscando selecionar os métodos mais relevantes para cada tipo de variável. Correlação policrônica foi conduzida quando valores ordinais estavam envolvidos (por exemplo, tabagismo, 1 - Não, 2 - Ex, 3 - Sim ), tetracrônica quando as variáveis possuem fatores binários, ponto-biserial para comparações entre binárias com valores contínuos e Pearson para testes contendo variáveis contínuas, etc. A função foi ajustada para executar correlações parciais condicionada a outras variáveis. Além disso, os p-valores foram corrigidos para múltiplas comparações utilizando a abordagem de Bonferroni.

Figura 2 - Correlação entre variáveis clínicas em (A) 2020, (B) 2021 e (c) ambos os anos. p < 0.05 (), p < 0.02 (), p < 0.01 ()


Tabela 3

      O modelo para avaliar a associação entre os grupos alélicos HLA-B foram conduzido por um modelo de associação aditivo (h/h vs h/- vs -/-). O desfecho (alta - 0, óbito - 1) ou ano de coleta ( 2020 - 0, 2021 - 1) foram utilizados como variáveis dependentes para avaliar a influcência dos alelos e alelos ajustados com a idade. O modelo de regressão logística foi implementado utilizando o pacote R HIBAG e as funções hlaAllele() e hlaAssociTest foram utilizados para calcular as estimativas de razão de chances (OR), intervalo de confiança (CI) e p-valores. Foram testados os sub-grupos em cada ano baseado no desfecho, os quais não apresentaram resultados significativos, mesmo ajustados para idade. Enquanto isso, avaliou-se a ocorrência de cada um dos grupos alélicos entre os dois ano de coleta, os quais apresentaram as seguintes significâncias:


Figura 3

      Após executar etapas de diagnóstico de diferentes modelos (Figura S3), um modelo de regressão negativa binomial (NB) foi conduzido para verificar o efeito de cada alelo na tempo de permanência na UTI. O modelo utiliza da variável ICU_days como variável dependente e os alelos (alelle) foram considerados como variáveis nomiais e independentes.

\[\hat{ICUdays_y} = e^{Intercept+ b_{1}I(X_{B_{08}})...+b_{j}I(X_{B_{binned}}) + b_{j+1}(X_c)}\]

      A análise foi conduzida com alelos com frequência superior a 0.05% (ou >5 ocorrências em cada coleta), sendo \(j\) o número de alelos selecionados, e o restante agrupados em binned, ajustando para variáveis clínicas \(X_c\). Como não houve um grupo controle/tratamento, a seguinte análise foi conduzida com caráter descritivo buscando a razão de efeito entre os alelos coletados de cada ano separadamente. Através do pacote R MASS, o modelo foi processado pela função glm.nb() e as médias marginais modeladas de cada alelo foram obtidas através do pacote R emmeans com a função emmeans(), onde o modelo em função de ligação logaritimica possuem efeito aditivo, ou seja, os expoentes dos coeficientes são as médias de cada alelo para o período na UTI. Devido a falta de um grupo controle, o alelo com a menor média de incidência foi utilizado como base para o cálculo da regressão (intercept), ou seja, o grupo alélico B*07. Os modelos foram separados em 2020 e 2021 (\(ICUdays_{2020}\) e \(ICUdays_{2021}\)), assim como testado com covariáveis de desfecho e idade, identificados na análise de correlação e com relevância clínica, respectivamente. No entanto, em uma ánalise post hoc das médias modeladas, a razão de efeito foi conduzida entre os grupos alélicos e o efeito de cada alelo em relação a média geral dos grupos analisados. O modelo não apresentou alteração significativa quando ajustado para idade (dados não apresentados).

Figura 3 - Razão de efeito a partir do modelo de regressão binomial negativa ajustado para idade para (A) 2020 e (B) 2021


Figura 4

\[\hat{ICUdays_y} = e^{Intercept + b_{interaction}(HLAB_{08}*Outcome) ... + b_{interaction}(HLAB_{binned}*Outcome)}\]

      A Figura 4 utiliza do mesmo procedimento utilizado na Figura 3, mas buscando avaliar a interação entre os grupos alélicos e desfecho no tempo de permanência na UTI.

Figura 3 - Razão de efeito a partir do modelo de regressão binomial negativa ajustado para idade para (A) 2020 e (B) 2021


Materiais Suplementares

Figura S1

      Os outliers foram retirados utilizando dplyr::filter(), excluindo pacientes com dias de internação superior a 65 dias.

Figura S1 - Filtragem de dados descripantes. Dados brutos de (A) 2020 e (B) 2021. Dados filtrados (<65 dias de Hospital) de (C) 2020 e (D) 2021.


Figura S2

      Os pacientes foram selecionados ao final de cada onda epidemiológica como descrito em (Bastos et al., 2021).

Figura S2 - Período de coleta das amostras. Amostras identificadas com seus respectivos números foram filtradas (>65 dias). Primeria onda: 8/2020 à 43/2020 semana; Segunda onda: 43/2020 à 21/2021.


Figura S3

      A Figura S3 foi obtida através do pacote R ggplot2 e apresenta a frequência relativa (%) dos alelos em ambos anos amostrais, em conjunto com as frequências alélicas disponibilizadas pelo Registro Nacional de Doadores de Médula Óssea (REDOME) e coletadas no Allele Frequency Net Database (AFND) para o Estado do Paraná, Brasil (Gonzalez-Galarza et al., 2020). O acesso ao AFND foi realizado por meio do pacote R immunotation com a função query_allele_frequencies(). A linha tracejada marca o limiar (Figura S1A), FR = %5, e as anotações destacadas do eixo x representam os alelos não agrupados em binned, grupo de alelos com frequência <%5. A Figura 1B representa as frequências obtidas a partir de cada ano e sub-agrupadas nos desfechos.

Figura S1 - Frequência relativa (%) dos alelos identificados e das frequências coletadas no REDOME. (A) agrupados em ano de coleta e desfecho total e (B) por ano de coleta e desfecho. A linha tracejada em (A), %5, identifica os alelos com menor e maior frequência; as anotações destacadas no eixo x representam os alelos de maior frequência, não agrupados em “binned”.


Models Check

ICU_days ~ allele + Age (2020)

ICU_days ~ allele + Age.

ICU_days ~ allele + Age (2021)

ICU_days ~ allele + Age.

ICU_days ~ allele*Outcome (2020)

ICU_days ~ allele*Outcome

ICU_days ~ allele*Outcome (2021)

ICU_days ~ allele*Outcome

REFERÊNCIAS


BASTOS, L. S. et al. COVID-19 hospital admissions: Brazil’s first and second waves compared. The Lancet Respiratory Medicine, v. 9, n. 8, p. e82–e83, ago. 2021. Disponível em: <https://www.thelancet.com/journals/lanres/article/PIIS2213-2600%2821%2900287-3/fulltext>. Acesso em: 16 set. 2022.https://doi.org/10.1016/S2213-2600(21)00287-3.
GONZALEZ-GALARZA, F. F. et al. Allele frequency net database (AFND) 2020 update: gold-standard data classification, open access genotype data and new query tools. Nucleic Acids Research, v. 48, n. D1, p. D783–D788, jan. 2020. Disponível em: <https://doi.org/10.1093/nar/gkz1029>. Acesso em: 16 jul. 2022.https://doi.org/10.1093/nar/gkz1029.