Avaliação dos métodos de correção do Julgamento

Relatório gerado: 10/04/2021, 15:22:05

Sistema: Petroles_2_udpipe.conllu

Sistema guia (pré-correções): Petroles_2_A.conllu

Golden (pós-correções): Petroles_2_golden.conllu

Características do corpus


ArquivosSentençasTokens
Sistema1665248
Sistema guia1665248
Golden1665248

Sentenças comparáveis166
Tokens corrigidos1349

Avaliação dos métodos


MétodoErros detectados (por token)Verdadeiro PositivoFalso PositivoPrecisãoAbrangênciaErros repetidosRepetidos VP
Nenhum método862
Erros de validação1731314275.72%9.71%Não se aplicaNão se aplica
Erros de validação + Matriz de confusão100347852547.66%35.43%10592
Erros de validação + N-grams gramaticais1731314275.72%9.71%00
Erros de validação + N-grams lexicais2071495871.98%11.05%11
Erros de validação + Matriz de confusão + N-grams gramaticais100347852547.66%35.43%00
Erros de validação + Matriz de confusão + N-grams lexicais102648753947.47%36.10%00
Erros de validação + N-grams gramaticais + N-grams lexicais2071495871.98%11.05%00
Erros de validação + Matriz de confusão + N-grams gramaticais + N-grams lexicais102648753947.47%36.10%00
Matriz de confusão93543949646.95%32.54%Não se aplicaNão se aplica
Matriz de confusão + N-grams gramaticais93543949646.95%32.54%00
Matriz de confusão + N-grams lexicais95944951046.82%33.28%119
Matriz de confusão + N-grams gramaticais + N-grams lexicais95944951046.82%33.28%00
N-grams gramaticais0000.00%0.00%Não se aplicaNão se aplica
N-grams gramaticais + N-grams lexicais35191654.29%1.41%00
N-grams lexicais35191654.29%1.41%Não se aplicaNão se aplica

Detalhe: matriz de confusão


ColunaDivergências (por coluna)sistema_guia estava correto (não é erro)Não é erro %sistema estava correto (erro de fato)Ninguém estava correto (erro de fato)Erro de fato %sistema estava correto %Precisa de correção cuidadosa (ninguém estava correto)
deprel55731256.01%13610943.99%24.42%19.57%
dephead61437861.56%13210438.44%21.50%16.94%
upos23022798.70%121.30%0.43%0.87%
Total140191765.45%26921534.55%19.20%15.35%

ColunaConvergências (por coluna)Convergência corretaConvergência incorretaConfiança das convergências
deprel5126476735993.00%
dephead5069466140891.95%
upos54535447699.89%
Total156481487577395.06%

Dos 404 tokens com erros de fato, o método encontrou:Dos 547 tokens com convergência incorreta, o método encontrou:
Nenhum método (apenas a matriz)308 (76.24%)490 (89.58%)
Erros de validação88 (21.78%)46 (8.41%)
N-grams gramaticais0 (0.00%)0 (0.00%)
N-grams lexicais8 (1.98%)12 (2.19%)

Detalhe: n-grams inconsistentes


TipoParesPares com pelo menos 1 token corrigidoPrecisãoPares em que o pai tem mesmo deprel (dependency context)Pares com pelo menos 1 token corrigido quando pai tem mesmo deprelPrecisão quando o pai nos pares tem mesmo deprelAbrangência do "dependency context" (comparando com os pares sem restrição de deprel no pai)
N-grams gramaticais000.00%000.00%0.00%
N-grams lexicais1212100.00%231773.91%141.67%