Avaliação dos métodos de correção do Julgamento

Relatório gerado: 10/14/2020, 13:02:11

Sistema: Petroles v1_udpipe.conllu

Sistema guia (pré-correções): Petroles v1_stanza.conllu

Golden (pós-correções): Petroles v1.conllu

Características do corpus


ArquivosSentençasTokens
Sistema65222288
Sistema guia65222288
Golden65222288

Sentenças comparáveis652
Tokens corrigidos4394

Avaliação dos métodos


MétodoErros detectados (por token)Verdadeiro PositivoFalso PositivoPrecisãoAbrangênciaErros repetidosRepetidos VP
Nenhum método1812
Erros de validação30117113056.81063122923588%3.891670459717797%Não se aplicaNão se aplica
Erros de validação + Matriz de confusão45192555196456.539057313564946%58.1474738279472%171112
Erros de validação + N-grams gramaticais30117113056.81063122923588%3.891670459717797%00
Erros de validação + N-grams lexicais49127321855.60081466395112%6.21301775147929%11
Erros de validação + Matriz de confusão + N-grams gramaticais45192555196456.539057313564946%58.1474738279472%00
Erros de validação + Matriz de confusão + N-grams lexicais46132582203155.972252330370694%58.76194811106054%11
Erros de validação + N-grams gramaticais + N-grams lexicais49127321855.60081466395112%6.21301775147929%00
Erros de validação + Matriz de confusão + N-grams gramaticais + N-grams lexicais46132582203155.972252330370694%58.76194811106054%00
Matriz de confusão43892496189356.869446343130555%56.80473372781065%Não se aplicaNão se aplica
Matriz de confusão + N-grams gramaticais43892496189356.869446343130555%56.80473372781065%00
Matriz de confusão + N-grams lexicais44832523196056.27927726968548%57.41920801092399%9776
Matriz de confusão + N-grams gramaticais + N-grams lexicais44832523196056.27927726968548%57.41920801092399%00
N-grams gramaticais0000%0.0%Não se aplicaNão se aplica
N-grams gramaticais + N-grams lexicais1911038853.92670157068063%2.3441055985434684%00
N-grams lexicais1911038853.92670157068063%2.3441055985434684%Não se aplicaNão se aplica

Detalhe: matriz de confusão


ColunaDivergências (por coluna)sistema_guia estava correto (não é erro)Não é erro %sistema estava correto (erro de fato)Ninguém estava correto (erro de fato)Erro de fato %sistema estava correto %Precisa de correção cuidadosa (ninguém estava correto)
dephead3433202158.869793183804255%61379941.130206816195745%17.856102534226626%23.274104281969123%
deprel2095120157.326968973747015%42347142.673031026252985%20.190930787589497%22.482100238663485%
upos81949960.927960927960925%18413639.072039072039075%22.466422466422465%16.605616605616607%
Total6347372158.626122577595716%1220140641.373877422404284%19.22167953363794%22.152197888766345%

ColunaConvergências (por coluna)Convergência corretaConvergência incorretaConfiança das convergências
dephead2044919374107594.7430192185437%
deprel2178720766102195.31371919034287%
upos230632270236198.43472228244374%
Total6529962842245796.23730838144535

Dos 2058 tokens com erros de fato, o método encontrou:Dos 1826 tokens com convergência incorreta, o método encontrou:
Nenhum método (apenas a matriz)1894 (92.03109815354713%)1726 (94.52354874041622%)
Erros de validação96 (4.664723032069971%)71 (3.888280394304491%)
N-grams gramaticais0 (0.0%)0 (0.0%)
N-grams lexicais69 (3.3527696793002915%)29 (1.588170865279299%)