Avaliação dos métodos de correção do Julgamento


Sistema: ../50R/golden/50R_udpipe.conllu

Sistema guia (pré-correções): ../50R/golden/50R_stanza.conllu

Golden (pós-correções): ../50R/golden/50R_golden.conllu

Características do corpus


ArquivosSentençasTokens
Sistema37913293
Sistema guia37913293
Golden37913293

Sentenças comparáveis379
Tokens corrigidos2387

Avaliação dos métodos


MétodoErros detectados (por token)Verdadeiro PositivoFalso PositivoPrecisãoAbrangênciaErros repetidosRepetidos VP
Nenhum método1045
Erros de validação1941098556.18556701030928%4.566401340594889%Não se aplicaNão se aplica
Erros de validação + Matriz de confusão23631314104955.60727888277613%55.04817762882279%10677
Erros de validação + N-grams gramaticais1941098556.18556701030928%4.566401340594889%00
Erros de validação + N-grams lexicais32815317546.646341463414636%6.4097193129451195%00
Erros de validação + Matriz de confusão + N-grams gramaticais23631314104955.60727888277613%55.04817762882279%00
Erros de validação + Matriz de confusão + N-grams lexicais24741342113254.244139046079226%56.22119815668203%00
Erros de validação + N-grams gramaticais + N-grams lexicais32815317546.646341463414636%6.4097193129451195%00
Erros de validação + Matriz de confusão + N-grams gramaticais + N-grams lexicais24741342113254.244139046079226%56.22119815668203%00
Matriz de confusão2275128299356.35164835164835%53.7075827398408%Não se aplicaNão se aplica
Matriz de confusão + N-grams gramaticais2275128299356.35164835164835%53.7075827398408%00
Matriz de confusão + N-grams lexicais23861310107654.90360435875943%54.88060326770004%2316
Matriz de confusão + N-grams gramaticais + N-grams lexicais23861310107654.90360435875943%54.88060326770004%00
N-grams gramaticais0000%0.0%Não se aplicaNão se aplica
N-grams gramaticais + N-grams lexicais134449032.83582089552239%1.8433179723502304%00
N-grams lexicais134449032.83582089552239%1.8433179723502304%Não se aplicaNão se aplica

Detalhe: matriz de confusão


ColunaDivergências (por coluna)sistema_guia estava correto (não é erro)Não é erro %sistema estava correto (erro de fato)Ninguém estava correto (erro de fato)Erro de fato %sistema estava correto %Precisa de correção cuidadosa (ninguém estava correto)
deprel111061755.585585585585584%28920444.414414414414416%26.036036036036037%18.37837837837838%
dephead1815102956.69421487603306%38739943.30578512396694%21.322314049586776%21.983471074380166%
upos34918051.57593123209169%1155448.42406876790831%32.9512893982808%15.472779369627506%
Total3274182655.77275503970678%79165744.22724496029322%24.160048869883934%20.067196090409286%

ColunaConvergências (por coluna)Convergência corretaConvergência incorretaConfiança das convergências
deprel131881270947996.36791022141341%
dephead124831190058395.32964832171754%
upos139491371923098.35113628217077%
Total3962038328129296.73902069661787

Dos 1093 tokens com erros de fato, o método encontrou:Dos 986 tokens com convergência incorreta, o método encontrou:
Nenhum método (apenas a matriz)1015 (92.86367795059469%)914 (92.69776876267748%)
Erros de validação63 (5.763952424519671%)49 (4.9695740365111565%)
N-grams gramaticais0 (0.0%)0 (0.0%)
N-grams lexicais15 (1.3723696248856359%)23 (2.332657200811359%)