Wikilivros:AutoWikiBrowser/Typos/Guia
Estas são as expressões regulares para correção de erros (typos) do RegExTypoFix. O desenvolvimento é aberto ao público desde 2006 na Wikipédia inglesa, e desde 2011 na Wikipédia lusófona.
Por favor, acrescente ou melhore estas expressões regulares!
Descrição
[editar código-fonte]Estas expressões regulares encontram e corrigir erros comuns. A sintaxe das expressões é descrita na íntegra no site MSDN, embora para os fins desta página o sumário da Well House é provavelmente mais fácil de usar.
Embora o objetivo inicial deste projeto tenha sido o de obter 100% de precisão, a lista atual, que é menos precisa mas mais inclusiva, é melhor (pelo menos a da versão inglesa).
Todos os editores que usarem o RegExTypoFix devem fazê-lo de forma responsável. Verifique todas as edições antes de fazê-las. Em caso de dúvida, simplesmente pule.
Esta lista de erros de digitação também é usada pelo editor de texto e gadget da Wikipédia wikEd.
A correção de typos é impedida automaticamente nos nomes das imagens, nas predefinições, nos alvos dos links internos e nas citações (incluindo parágrafos recuados). Se uma regra de correção de erros corresponde ao alvo de um link interno, esta regra será ignorada na página inteira.
Acrescentando e alterando erros de ortografia
[editar código-fonte]Antes de editar esta página
[editar código-fonte]- Teste a sua proposta de mudança por meio de uma pesquisa comum na página de buscas ou uma busca no Google através do AWB com uma regra "localizar e substituir" configurada. Isto pode revelar que a sua regra em alguns casos danifica textos corretos ou, em outras circunstâncias, faz a correção errada. Nestes casos, não adicione a regra aqui, em vez disso, considere adicioná-la a lista de erros comuns.
- Se você não sabe como fazer uma mudança, é recomendado que utilize a página de discussão, para que um usuário mais experiente modifique para você.
- Tenha em mente que cada adição ou possibilidade de uma palavra usa mais CPU e deixa o processamento mais lento.
- Observe que apenas palavras fora da marcação wiki são corrigidas, portanto uma regra para corrigir, por exemplo, uma predefinição não vai funcionar.
Como escrever regras para corrigir erros de digitação
[editar código-fonte]- Procure ter uma regra única para cada palavra raiz, prefixo e sufixo.
- Evite regras que detectem palavras com a ortografia correta (isto é, "falsos positivos": por exemplo, uma regra que corrige housa para house não deve detectar thousand, e nem deve detectar house).
- Não crie uma regra em que a expressão regular não corresponde ao valor de captura da expressão regular, já que o AWB não pode mostrar tais substituições no sumário de edição. (Por exemplo, não use um lookahead no final de uma expressão regular).
- Não suponha que as regras serão aplicadas na ordem em que aparecem na página.
- Só use os quantificadores
*
e+
para repetir um único caractere. Sempre que possível, evite repetições de expressões maiores, uma vez que elas exigem mais trabalho da CPU e são propensas a fazer coisas inesperadas. - Cada regra deve ser completamente independente das demais.
- Na edição de uma regra, edite somente a menor seção desta página que for apropriada, em vez de editar a página toda, que exigiria mais CPU e largura de banda.
- Atualize o nome da regra, se você mudar algo que o afeta.
Como testar as regras de correção dos erro de digitação
[editar código-fonte]Antes de incluir uma regra, teste-a:
- Com o testador de expressões regulares do AWB ou algo similar (exemplos: RegExPal, My Regex Tester, Rubular).
- Com o AWB ou o WikiEd imediatamente depois de adicioná-las. Se não funcionar, primeiro remova-a e então analise-a.
Tarefas pendentes
[editar código-fonte]- Remover duplicatas.
- Expandir regras para que aceitem mais sufixos (por exemplo, "-ing", "-ed", "-able", no caso dos verbos em inglês) e prefixos.
- Note que algumas expressões regulares propositadamente corrigem apenas certas versões de uma palavra para evitar falsos positivos. Estas devem ser marcadas com um caractere sublinhado "_" no início ou no fim do campo
word=
.
- Note que algumas expressões regulares propositadamente corrigem apenas certas versões de uma palavra para evitar falsos positivos. Estas devem ser marcadas com um caractere sublinhado "_" no início ou no fim do campo
- Remova palavras raras. Note, no entanto, que não a ausência de ocorrências hoje não significa que uma regra se aplica em casos muito raros, pois pode ser que outro usuário tenha usado a regra ontem para corrigir muitos artigos.
- Mantenha as listas ordenadas alfabeticamente pela palavra raiz, por exemplo, coloque "(Un)Equal" pouco antes "(In)Equality" entre as palavras da letra "E". Não ordene, digamos, pelo valor de caracteres ASCII.
- Ignore palavras cercadas por "." como em www.harvard.edu.
Lista de erros
[editar código-fonte]Todas as alterações a essa lista têm efeito na hora. O AWB obtém esta lista diretamente sempre que alguém invoca a opção Enable RegexTypoFix.