Avaliação dos métodos de correção do Julgamento

Relatório gerado: 10/04/2021, 15:23:31

Sistema: Petroles_2_udpipe.conllu

Sistema guia (pré-correções): Petroles_2_C.conllu

Golden (pós-correções): Petroles_2_golden.conllu

Características do corpus


ArquivosSentençasTokens
Sistema1665248
Sistema guia1665248
Golden1665248

Sentenças comparáveis166
Tokens corrigidos1327

Avaliação dos métodos


MétodoErros detectados (por token)Verdadeiro PositivoFalso PositivoPrecisãoAbrangênciaErros repetidosRepetidos VP
Nenhum método881
Erros de validação1561094769.87%8.21%Não se aplicaNão se aplica
Erros de validação + Matriz de confusão97344153245.32%33.23%8371
Erros de validação + N-grams gramaticais1561094769.87%8.21%00
Erros de validação + N-grams lexicais1871246366.31%9.34%00
Erros de validação + Matriz de confusão + N-grams gramaticais97344153245.32%33.23%00
Erros de validação + Matriz de confusão + N-grams lexicais99244654644.96%33.61%00
Erros de validação + N-grams gramaticais + N-grams lexicais1871246366.31%9.34%00
Erros de validação + Matriz de confusão + N-grams gramaticais + N-grams lexicais99244654644.96%33.61%00
Matriz de confusão90040349744.78%30.37%Não se aplicaNão se aplica
Matriz de confusão + N-grams gramaticais90040349744.78%30.37%00
Matriz de confusão + N-grams lexicais91940851144.40%30.75%1210
Matriz de confusão + N-grams gramaticais + N-grams lexicais91940851144.40%30.75%00
N-grams gramaticais0000.00%0.00%Não se aplicaNão se aplica
N-grams gramaticais + N-grams lexicais31151648.39%1.13%00
N-grams lexicais31151648.39%1.13%Não se aplicaNão se aplica

Detalhe: matriz de confusão


ColunaDivergências (por coluna)sistema_guia estava correto (não é erro)Não é erro %sistema estava correto (erro de fato)Ninguém estava correto (erro de fato)Erro de fato %sistema estava correto %Precisa de correção cuidadosa (ninguém estava correto)
deprel52731559.77%1169640.23%22.01%18.22%
dephead59536761.68%12310538.32%20.67%17.65%
upos23022798.70%121.30%0.43%0.87%
Total135290967.23%24020332.77%17.75%15.01%

ColunaConvergências (por coluna)Convergência corretaConvergência incorretaConfiança das convergências
deprel5156478736992.84%
dephead5088467041891.78%
upos54535447699.89%
Total156971490479394.95%

Dos 367 tokens com erros de fato, o método encontrou:Dos 559 tokens com convergência incorreta, o método encontrou:
Nenhum método (apenas a matriz)294 (80.11%)502 (89.80%)
Erros de validação65 (17.71%)49 (8.77%)
N-grams gramaticais0 (0.00%)0 (0.00%)
N-grams lexicais8 (2.18%)8 (1.43%)

Detalhe: n-grams inconsistentes


TipoParesPares com pelo menos 1 token corrigidoPrecisãoPares em que o pai tem mesmo deprel (dependency context)Pares com pelo menos 1 token corrigido quando pai tem mesmo deprelPrecisão quando o pai nos pares tem mesmo deprelAbrangência do "dependency context" (comparando com os pares sem restrição de deprel no pai)
N-grams gramaticais000.00%000.00%0.00%
N-grams lexicais111090.91%191263.16%109.09%