Avaliação dos métodos de correção do Julgamento

Relatório gerado: 10/04/2021, 15:22:55

Sistema: Petroles_2_udpipe.conllu

Sistema guia (pré-correções): Petroles_2_B.conllu

Golden (pós-correções): Petroles_2_golden.conllu

Características do corpus


ArquivosSentençasTokens
Sistema1665248
Sistema guia1665248
Golden1665248

Sentenças comparáveis166
Tokens corrigidos1272

Avaliação dos métodos


MétodoErros detectados (por token)Verdadeiro PositivoFalso PositivoPrecisãoAbrangênciaErros repetidosRepetidos VP
Nenhum método852
Erros de validação1671194871.26%9.36%Não se aplicaNão se aplica
Erros de validação + Matriz de confusão99841458441.48%32.55%9479
Erros de validação + N-grams gramaticais1671194871.26%9.36%00
Erros de validação + N-grams lexicais1951326367.69%10.38%11
Erros de validação + Matriz de confusão + N-grams gramaticais99841458441.48%32.55%00
Erros de validação + Matriz de confusão + N-grams lexicais101542059541.38%33.02%00
Erros de validação + N-grams gramaticais + N-grams lexicais1951326367.69%10.38%00
Erros de validação + Matriz de confusão + N-grams gramaticais + N-grams lexicais101542059541.38%33.02%00
Matriz de confusão92537455140.43%29.40%Não se aplicaNão se aplica
Matriz de confusão + N-grams gramaticais92537455140.43%29.40%00
Matriz de confusão + N-grams lexicais94338156240.40%29.95%117
Matriz de confusão + N-grams gramaticais + N-grams lexicais94338156240.40%29.95%00
N-grams gramaticais0000.00%0.00%Não se aplicaNão se aplica
N-grams gramaticais + N-grams lexicais29141548.28%1.10%00
N-grams lexicais29141548.28%1.10%Não se aplicaNão se aplica

Detalhe: matriz de confusão


ColunaDivergências (por coluna)sistema_guia estava correto (não é erro)Não é erro %sistema estava correto (erro de fato)Ninguém estava correto (erro de fato)Erro de fato %sistema estava correto %Precisa de correção cuidadosa (ninguém estava correto)
deprel54536166.24%1057933.76%19.27%14.50%
dephead62641666.45%1189233.55%18.85%14.70%
upos23022798.70%121.30%0.43%0.87%
Total1401100471.66%22417328.34%15.99%12.35%

ColunaConvergências (por coluna)Convergência corretaConvergência incorretaConfiança das convergências
deprel5138479834093.38%
dephead5057467538292.45%
upos54535447699.89%
Total156481492072895.35%

Dos 341 tokens com erros de fato, o método encontrou:Dos 519 tokens com convergência incorreta, o método encontrou:
Nenhum método (apenas a matriz)259 (75.95%)465 (89.60%)
Erros de validação76 (22.29%)46 (8.86%)
N-grams gramaticais0 (0.00%)0 (0.00%)
N-grams lexicais6 (1.76%)9 (1.73%)

Detalhe: n-grams inconsistentes


TipoParesPares com pelo menos 1 token corrigidoPrecisãoPares em que o pai tem mesmo deprel (dependency context)Pares com pelo menos 1 token corrigido quando pai tem mesmo deprelPrecisão quando o pai nos pares tem mesmo deprelAbrangência do "dependency context" (comparando com os pares sem restrição de deprel no pai)
N-grams gramaticais000.00%000.00%0.00%
N-grams lexicais111090.91%201365.00%118.18%