Avaliação dos métodos de correção do Julgamento

Relatório gerado: 28/10/2020, 15:20:35

Sistema: Petroles v1_udpipe.conllu

Sistema guia (pré-correções): Petroles v1_stanza.conllu

Golden (pós-correções): Petroles v1.conllu

Características do corpus


ArquivosSentençasTokens
Sistema65222288
Sistema guia65222288
Golden65222288

Sentenças comparáveis652
Tokens corrigidos4394

Avaliação dos métodos


MétodoErros detectados (por token)Verdadeiro PositivoFalso PositivoPrecisãoAbrangênciaErros repetidosRepetidos VP
Nenhum método1812
Erros de validação29816912956.71%3.85%Não se aplicaNão se aplica
Erros de validação + Matriz de confusão45182555196356.55%58.15%169110
Erros de validação + N-grams gramaticais29816912956.71%3.85%00
Erros de validação + N-grams lexicais48827121755.53%6.17%11
Erros de validação + Matriz de confusão + N-grams gramaticais45182555196356.55%58.15%00
Erros de validação + Matriz de confusão + N-grams lexicais46122582203055.98%58.76%11
Erros de validação + N-grams gramaticais + N-grams lexicais48827121755.53%6.17%00
Erros de validação + Matriz de confusão + N-grams gramaticais + N-grams lexicais46122582203055.98%58.76%00
Matriz de confusão43892496189356.87%56.80%Não se aplicaNão se aplica
Matriz de confusão + N-grams gramaticais43892496189356.87%56.80%00
Matriz de confusão + N-grams lexicais44832523196056.28%57.42%9776
Matriz de confusão + N-grams gramaticais + N-grams lexicais44832523196056.28%57.42%00
N-grams gramaticais0000.00%0.00%Não se aplicaNão se aplica
N-grams gramaticais + N-grams lexicais1911038853.93%2.34%00
N-grams lexicais1911038853.93%2.34%Não se aplicaNão se aplica

Detalhe: matriz de confusão


ColunaDivergências (por coluna)sistema_guia estava correto (não é erro)Não é erro %sistema estava correto (erro de fato)Ninguém estava correto (erro de fato)Erro de fato %sistema estava correto %Precisa de correção cuidadosa (ninguém estava correto)
dephead3433202158.87%61379941.13%17.86%23.27%
deprel2095120157.33%42347142.67%20.19%22.48%
upos81949960.93%18413639.07%22.47%16.61%
Total6347372158.63%1220140641.37%19.22%22.15%

ColunaConvergências (por coluna)Convergência corretaConvergência incorretaConfiança das convergências
dephead2044919374107594.74%
deprel2178720766102195.31%
upos230632270236198.43%
Total6529962842245796.24%

Dos 2058 tokens com erros de fato, o método encontrou:Dos 1826 tokens com convergência incorreta, o método encontrou:
Nenhum método (apenas a matriz)1896 (92.13%)1727 (94.58%)
Erros de validação94 (4.57%)70 (3.83%)
N-grams gramaticais0 (0.00%)0 (0.00%)
N-grams lexicais69 (3.35%)29 (1.59%)

Detalhe: n-grams inconsistentes


TipoParesPares com pelo menos 1 token corrigidoPrecisãoPares em que o pai tem mesmo deprel (dependency context)Pares com pelo menos 1 token corrigido quando pai tem mesmo deprelPrecisão quando o pai nos pares tem mesmo deprelAbrangência do "dependency context" (comparando com os pares sem restrição de deprel no pai)
N-grams gramaticais000.00%000.00%0.00%
N-grams lexicais705578.57%433274.42%45.71%