Avaliação dos métodos de correção do Julgamento

Relatório gerado: 28/10/2020, 15:22:08

Sistema: Petroles v1_udpipe.conllu

Sistema guia (pré-correções): Petroles v1_stanza.conllu

Golden (pós-correções): Petroles v1.conllu

Características do corpus


ArquivosSentençasTokens
Sistema65222288
Sistema guia65222288
Golden65222288

Sentenças comparáveis652
Tokens corrigidos4394

Avaliação dos métodos


MétodoErros detectados (por token)Verdadeiro PositivoFalso PositivoPrecisãoAbrangênciaErros repetidosRepetidos VP
Nenhum método1795
Erros de validação30717613157.33%4.01%Não se aplicaNão se aplica
Erros de validação + Matriz de confusão45212556196556.54%58.17%175116
Erros de validação + N-grams gramaticais30717613157.33%4.01%00
Erros de validação + N-grams lexicais61831630251.13%7.19%11
Erros de validação + Matriz de confusão + N-grams gramaticais45212556196556.54%58.17%00
Erros de validação + Matriz de confusão + N-grams lexicais47082599210955.20%59.15%11
Erros de validação + N-grams gramaticais + N-grams lexicais61831630251.13%7.19%00
Erros de validação + Matriz de confusão + N-grams gramaticais + N-grams lexicais47082599210955.20%59.15%00
Matriz de confusão43892496189356.87%56.80%Não se aplicaNão se aplica
Matriz de confusão + N-grams gramaticais43892496189356.87%56.80%00
Matriz de confusão + N-grams lexicais45762539203755.49%57.78%12598
Matriz de confusão + N-grams gramaticais + N-grams lexicais45762539203755.49%57.78%00
N-grams gramaticais0000.00%0.00%Não se aplicaNão se aplica
N-grams gramaticais + N-grams lexicais31214117145.19%3.21%00
N-grams lexicais31214117145.19%3.21%Não se aplicaNão se aplica

Detalhe: matriz de confusão


ColunaDivergências (por coluna)sistema_guia estava correto (não é erro)Não é erro %sistema estava correto (erro de fato)Ninguém estava correto (erro de fato)Erro de fato %sistema estava correto %Precisa de correção cuidadosa (ninguém estava correto)
dephead3433202158.87%61379941.13%17.86%23.27%
deprel2095120157.33%42347142.67%20.19%22.48%
upos81949960.93%18413639.07%22.47%16.61%
Total6347372158.63%1220140641.37%19.22%22.15%

ColunaConvergências (por coluna)Convergência corretaConvergência incorretaConfiança das convergências
dephead2044919374107594.74%
deprel2178720766102195.31%
upos230632270236198.43%
Total6529962842245796.24%

Dos 2058 tokens com erros de fato, o método encontrou:Dos 1826 tokens com convergência incorreta, o método encontrou:
Nenhum método (apenas a matriz)1874 (91.06%)1714 (93.87%)
Erros de validação100 (4.86%)73 (4.00%)
N-grams gramaticais0 (0.00%)0 (0.00%)
N-grams lexicais85 (4.13%)39 (2.14%)

Detalhe: n-grams inconsistentes


TipoParesPares com pelo menos 1 token corrigidoPrecisãoPares em que o pai tem mesmo deprel (dependency context)Pares com pelo menos 1 token corrigido quando pai tem mesmo deprelPrecisão quando o pai nos pares tem mesmo deprelAbrangência do "dependency context" (comparando com os pares sem restrição de deprel no pai)
N-grams gramaticais000.00%000.00%0.00%
N-grams lexicais1077771.96%714461.97%41.12%