Avaliação dos métodos de correção do Julgamento

Relatório gerado: 10/14/2020, 13:04:23

Sistema: Petroles v1_udpipe.conllu

Sistema guia (pré-correções): Petroles v1_stanza.conllu

Golden (pós-correções): Petroles v1.conllu

Características do corpus


ArquivosSentençasTokens
Sistema65222288
Sistema guia65222288
Golden65222288

Sentenças comparáveis652
Tokens corrigidos4394

Avaliação dos métodos


MétodoErros detectados (por token)Verdadeiro PositivoFalso PositivoPrecisãoAbrangênciaErros repetidosRepetidos VP
Nenhum método1797
Erros de validação29816813056.375838926174495%3.823395539371871%Não se aplicaNão se aplica
Erros de validação + Matriz de confusão45182554196456.5294378043382%58.12471552116523%169110
Erros de validação + N-grams gramaticais29816813056.375838926174495%3.823395539371871%00
Erros de validação + N-grams lexicais60930830150.57471264367816%7.0095584888484295%11
Erros de validação + Matriz de confusão + N-grams gramaticais45182554196456.5294378043382%58.12471552116523%00
Erros de validação + Matriz de confusão + N-grams lexicais47052597210855.19659936238045%59.10332271279017%11
Erros de validação + N-grams gramaticais + N-grams lexicais60930830150.57471264367816%7.0095584888484295%00
Erros de validação + Matriz de confusão + N-grams gramaticais + N-grams lexicais47052597210855.19659936238045%59.10332271279017%00
Matriz de confusão43892496189356.869446343130555%56.80473372781065%Não se aplicaNão se aplica
Matriz de confusão + N-grams gramaticais43892496189356.869446343130555%56.80473372781065%00
Matriz de confusão + N-grams lexicais45762539203755.48513986013986%57.783340919435595%12598
Matriz de confusão + N-grams gramaticais + N-grams lexicais45762539203755.48513986013986%57.783340919435595%00
N-grams gramaticais0000%0.0%Não se aplicaNão se aplica
N-grams gramaticais + N-grams lexicais31214117145.19230769230769%3.2089212562585345%00
N-grams lexicais31214117145.19230769230769%3.2089212562585345%Não se aplicaNão se aplica

Detalhe: matriz de confusão


ColunaDivergências (por coluna)sistema_guia estava correto (não é erro)Não é erro %sistema estava correto (erro de fato)Ninguém estava correto (erro de fato)Erro de fato %sistema estava correto %Precisa de correção cuidadosa (ninguém estava correto)
dephead3433202158.869793183804255%61379941.130206816195745%17.856102534226626%23.274104281969123%
deprel2095120157.326968973747015%42347142.673031026252985%20.190930787589497%22.482100238663485%
upos81949960.927960927960925%18413639.072039072039075%22.466422466422465%16.605616605616607%
Total6347372158.626122577595716%1220140641.373877422404284%19.22167953363794%22.152197888766345%

ColunaConvergências (por coluna)Convergência corretaConvergência incorretaConfiança das convergências
dephead2044919374107594.7430192185437%
deprel2178720766102195.31371919034287%
upos230632270236198.43472228244374%
Total6529962842245796.23730838144535

Dos 2058 tokens com erros de fato, o método encontrou:Dos 1826 tokens com convergência incorreta, o método encontrou:
Nenhum método (apenas a matriz)1879 (91.3022351797862%)1718 (94.08543263964951%)
Erros de validação95 (4.616132167152576%)69 (3.7787513691128147%)
N-grams gramaticais0 (0.0%)0 (0.0%)
N-grams lexicais85 (4.13022351797862%)39 (2.135815991237678%)