Avaliação dos métodos de correção do Julgamento


Sistema: bosque-2.6-test/bosque-ud-2.6-test-udpipe.conllu

Sistema guia (pré-correções): bosque-2.6-test/bosque-ud-2.6-test-stanza.conllu

Golden (pós-correções): bosque-2.6-test/bosque-ud-2.6-test.conllu

Características do corpus


ArquivosSentençasTokens
Sistema47610202
Sistema guia47610202
Golden47610202

Sentenças comparáveis476
Tokens corrigidos1589

Avaliação dos métodos


MétodoErros detectados (por token)Verdadeiro PositivoFalso PositivoPrecisãoAbrangênciaErros repetidosRepetidos VP
Nenhum método750
Erros de validação1605910136.875%3.713027061044682%Não se aplicaNão se aplica
Erros de validação + Matriz de confusão1891836105544.209413008989955%52.6117054751416%8243
Erros de validação + N-grams gramaticais1605910136.875%3.713027061044682%00
Erros de validação + N-grams lexicais1806411635.55555555555556%4.027690371302706%00
Erros de validação + Matriz de confusão + N-grams gramaticais1891836105544.209413008989955%52.6117054751416%00
Erros de validação + Matriz de confusão + N-grams lexicais1908839106943.9727463312369%52.800503461296415%00
Erros de validação + N-grams gramaticais + N-grams lexicais1806411635.55555555555556%4.027690371302706%00
Erros de validação + Matriz de confusão + N-grams gramaticais + N-grams lexicais1908839106943.9727463312369%52.800503461296415%00
Matriz de confusão181382099345.22890237175952%51.604782882315924%Não se aplicaNão se aplica
Matriz de confusão + N-grams gramaticais181382099345.22890237175952%51.604782882315924%00
Matriz de confusão + N-grams lexicais1830823100744.97267759562842%51.793580868470734%32
Matriz de confusão + N-grams gramaticais + N-grams lexicais1830823100744.97267759562842%51.793580868470734%00
N-grams gramaticais0000%0.0%Não se aplicaNão se aplica
N-grams gramaticais + N-grams lexicais2051525.0%0.3146633102580239%00
N-grams lexicais2051525.0%0.3146633102580239%Não se aplicaNão se aplica

Detalhe: matriz de confusão


ColunaDivergências (por coluna)sistema_guia estava correto (não é erro)Não é erro %sistema estava correto (erro de fato)Ninguém estava correto (erro de fato)Erro de fato %sistema estava correto %Precisa de correção cuidadosa (ninguém estava correto)
deprel86855363.70967741935484%18013536.29032258064516%20.737327188940093%15.55299539170507%
dephead140791064.67661691542288%25624135.32338308457712%18.194740582800286%17.12864250177683%
upos29418863.945578231292515%911536.054421768707485%30.952380952380953%5.1020408163265305%
Total2569165164.26625145971195%52739135.73374854028805%20.51381860646166%15.219929933826391%

ColunaConvergências (por coluna)Convergência corretaConvergência incorretaConfiança das convergências
deprel10078971736196.41794006747371%
dephead9539914039995.81717161128%
upos106521048816498.46038302666166%
Total302692934592496.94737189864217

Dos 717 tokens com erros de fato, o método encontrou:Dos 709 tokens com convergência incorreta, o método encontrou:
Nenhum método (apenas a matriz)684 (95.39748953974896%)678 (95.62764456981664%)
Erros de validação31 (4.323570432357044%)27 (3.8081805359661494%)
N-grams gramaticais0 (0.0%)0 (0.0%)
N-grams lexicais2 (0.2789400278940028%)4 (0.5641748942172073%)