Saltar para o conteúdo

Wikilivros:AutoWikiBrowser/Typos/Guia

Origem: Wikilivros, livros abertos por um mundo aberto.

Estas são as expressões regulares para correção de erros (typos) do RegExTypoFix. O desenvolvimento é aberto ao público desde 2006 na Wikipédia inglesa, e desde 2011 na Wikipédia lusófona.

Por favor, acrescente ou melhore estas expressões regulares!

Estas expressões regulares encontram e corrigir erros comuns. A sintaxe das expressões é descrita na íntegra no site MSDN, embora para os fins desta página o sumário da Well House é provavelmente mais fácil de usar.

Embora o objetivo inicial deste projeto tenha sido o de obter 100% de precisão, a lista atual, que é menos precisa mas mais inclusiva, é melhor (pelo menos a da versão inglesa).

Todos os editores que usarem o RegExTypoFix devem fazê-lo de forma responsável. Verifique todas as edições antes de fazê-las. Em caso de dúvida, simplesmente pule.

Esta lista de erros de digitação também é usada pelo editor de texto e gadget da Wikipédia wikEd.

A correção de typos é impedida automaticamente nos nomes das imagens, nas predefinições, nos alvos dos links internos e nas citações (incluindo parágrafos recuados). Se uma regra de correção de erros corresponde ao alvo de um link interno, esta regra será ignorada na página inteira.

Acrescentando e alterando erros de ortografia

[editar código-fonte]

Antes de editar esta página

[editar código-fonte]
  • Teste a sua proposta de mudança por meio de uma pesquisa comum na página de buscas ou uma busca no Google através do AWB com uma regra "localizar e substituir" configurada. Isto pode revelar que a sua regra em alguns casos danifica textos corretos ou, em outras circunstâncias, faz a correção errada. Nestes casos, não adicione a regra aqui, em vez disso, considere adicioná-la a lista de erros comuns.
  • Se você não sabe como fazer uma mudança, é recomendado que utilize a página de discussão, para que um usuário mais experiente modifique para você.
  • Tenha em mente que cada adição ou possibilidade de uma palavra usa mais CPU e deixa o processamento mais lento.
  • Observe que apenas palavras fora da marcação wiki são corrigidas, portanto uma regra para corrigir, por exemplo, uma predefinição não vai funcionar.

Como escrever regras para corrigir erros de digitação

[editar código-fonte]
  • Procure ter uma regra única para cada palavra raiz, prefixo e sufixo.
  • Evite regras que detectem palavras com a ortografia correta (isto é, "falsos positivos": por exemplo, uma regra que corrige housa para house não deve detectar thousand, e nem deve detectar house).
  • Não crie uma regra em que a expressão regular não corresponde ao valor de captura da expressão regular, já que o AWB não pode mostrar tais substituições no sumário de edição. (Por exemplo, não use um lookahead no final de uma expressão regular).
  • Não suponha que as regras serão aplicadas na ordem em que aparecem na página.
  • Só use os quantificadores * e + para repetir um único caractere. Sempre que possível, evite repetições de expressões maiores, uma vez que elas exigem mais trabalho da CPU e são propensas a fazer coisas inesperadas.
  • Cada regra deve ser completamente independente das demais.
  • Na edição de uma regra, edite somente a menor seção desta página que for apropriada, em vez de editar a página toda, que exigiria mais CPU e largura de banda.
  • Atualize o nome da regra, se você mudar algo que o afeta.

Como testar as regras de correção dos erro de digitação

[editar código-fonte]

Antes de incluir uma regra, teste-a:

  • Com o testador de expressões regulares do AWB ou algo similar (exemplos: RegExPal, My Regex Tester, Rubular).
  • Com o AWB ou o WikiEd imediatamente depois de adicioná-las. Se não funcionar, primeiro remova-a e então analise-a.

Tarefas pendentes

[editar código-fonte]
  • Remover duplicatas.
  • Expandir regras para que aceitem mais sufixos (por exemplo, "-ing", "-ed", "-able", no caso dos verbos em inglês) e prefixos.
    • Note que algumas expressões regulares propositadamente corrigem apenas certas versões de uma palavra para evitar falsos positivos. Estas devem ser marcadas com um caractere sublinhado "_" no início ou no fim do campo word=.
  • Remova palavras raras. Note, no entanto, que não a ausência de ocorrências hoje não significa que uma regra se aplica em casos muito raros, pois pode ser que outro usuário tenha usado a regra ontem para corrigir muitos artigos.
  • Mantenha as listas ordenadas alfabeticamente pela palavra raiz, por exemplo, coloque "(Un)Equal" pouco antes "(In)Equality" entre as palavras da letra "E". Não ordene, digamos, pelo valor de caracteres ASCII.
  • Ignore palavras cercadas por "." como em www.harvard.edu.

Lista de erros

[editar código-fonte]

Todas as alterações a essa lista têm efeito na hora. O AWB obtém esta lista diretamente sempre que alguém invoca a opção Enable RegexTypoFix.