Saltar para o conteúdo

Wikipédia:Coordenação robótica/Peixes/Checklist

Origem: Wikipédia, a enciclopédia livre.

Erros corrigidos

[editar código-fonte]

Taxocaixa: campo género

[editar código-fonte]

De:

| género = [[nome do género]]

Para:

| género = ''[[nome do género]]''

Descrição: colocar o nome do género em itálico, em artigos sobre espécies


  • ^ *\| *género *\= *(\[\[[^\]]*\]\]) *$ -------> | género = ''$1''
  • Funciona: Sim
  • Via editor texto antes de importação: Sim
  • Via AWB: Não

Taxocaixa: campo género (2)

[editar código-fonte]

De:

| género = nome do género

Para:

| género = '''''nome do género'''''

Descrição: Colocar nome do género em itálico e negrito, em artigos sobre géneros

  • ^ *\| *género *\= *([^\]]*) *$ -------> | género = '''''$1'''''
  • Funciona: Sim
  • Via editor texto antes de importação: Sim
  • Via AWB: Não

Espaços em branco: entre título de secção e conteúdo seguinte

[editar código-fonte]

Descrição: não deixar espaços em branco entre título de uma secção e o conteúdo que lhe segue

  • ^(=+[^=]+=+)\s*([^\s]) -------> $1\n$2
  • Funciona: Sim
  • Via editor texto antes de importação: Sim
  • Via AWB: Não

Espaços em branco: entre a última de uma secção e o título da seguinte

[editar código-fonte]

Descrição: retirar espaços em branco entre a última linha de conteúdo de uma secção e o título da secção seguinte

  • \s*\n(=+) -------> \n\n$1
  • Funciona: Sim
  • Via editor texto antes de importação: Sim
  • Via AWB: Não

Predefinição: esboço-peixe

[editar código-fonte]

Descrição: adicionar a marcação de esboço {{esboço-peixe}} antes da categoria (linha em branco a intervalar estes 2 e outra em branco entre a predefinição e o conteúdo antes da cat).

  • \n *\[\[ *categor -------> \n{{esboço-peixe}}\n\n[[Categor
  • Funciona: Sim
  • Via editor texto antes de importação: Sim
  • Via AWB: Não

Espaçamento a mais: categorias

[editar código-fonte]

Descrição: por vezes acontece em [[Categoria:XXXXXXXXXX|yyyyyyy ]] haver um espaço antes do fechamento da categoria (antes dos 2 parêntesis finais da categoria

  • \[\[ *Category?i?a? *\: *([^\]]*?[^ \|]) *\]\] -------> [[Categoria:$1]]

e

  • \[\[ *Category?i?a? *\: *([^\]\|]*) *(\| *\S+) *\]\] -------> [[Categoria:$1$2]]
  • Funciona: Sim
  • Via editor texto antes de importação: Sim
  • Via AWB: Não

Info/Taxonomia

[editar código-fonte]

Sugestões apontadas por Burmeister na página de discussão de Lijealso

  • Seria bom usar o {{Info/Taxonomia ao invés do {{taxocaixa, já que todas as infoboxes foram padronizadas para o modelo Info/XXXXX
  • Funciona: Sim
  • Via editor texto antes de importação: Sim feito por substituição normal
  • Via AWB: Não

Sugestões apontadas por Burmeister na página de discussão de Lijealso

*''==Ligações externas== para =={{Ligações externas}}== para evitar que bots e awbs tenham que mudar isso no futuro.

  • Funciona: Sim
  • Via editor texto antes de importação: Sim feito por substituição normal
  • Via AWB: Não

Taxocaixa: campo espécie

[editar código-fonte]

De:

| espécie = nome da espécie

Para:

| espécie = '''''nome da espécie'''''

Descrição: colocar o nome da espécie em itálico e negrito, em artigos sobre espécies

  • ^ *\| *espécie *\= *([^\n]+) *\r\n -------> | espécie = '''''$1'''''\n
  • Funciona: Sim
  • Via editor texto antes de importação: Sim
  • Via AWB: Não

Espaçamento a mais: secção espécies

[editar código-fonte]

Descrição: quando se trata de um artigo sobre género, ocorre espaçamento a mais na secção "Espécies", em cada linha com espécie listada, antes do fechamento do link: exemplo: ''[[Periophthalmodon chrysospilos ]]''


Funciona:

  • Funciona: Sim
  • Via editor texto antes de importação: Sim
  • Via AWB: ?

Sugestões apontadas por Burmeister na página de discussão de Lijealso

''== Referências== </references> poderia ser alterado para {{referências}} de acordo com as últimas discussões na esplanada e na padronização visual

  • Observação: Deverá ser fácil por regexp (?)

Com awb, pode usar \n== *Referências *==\r?\n</references> --> \n{{Referências}}. Rjclaudio msg 13h43min de 17 de fevereiro de 2010 (UTC)[responder]

Pequena correcção: \n== *Referências *==\r?\n<references/> --> \n{{Referências}}

Lijealso (discussão) 14h41min de 17 de fevereiro de 2010 (UTC)[responder]

  • Funciona: Sim
  • Via editor texto antes de importação: Sim
  • Via AWB: ?

---

Oi Lijealso e Rjclaudio está correta a RegEx para localizar uma tag referencia no verbete? ?\< *ref (ao menos 1, com ou sem name). - Elilopes DEBATE 14h58min de 12 de dezembro de 2018 (UTC)[responder]

Espaçamento no cabeçalho das seções

[editar código-fonte]

Alterar formatação das seções, de "==NomedaSeção==" para "== NomedaSeção ==" (basicamente inserir espaços antes e depois do nome, se não me engano os scriptsAWB inserem esses espaços por padrão, seria mais para economizar edições no futuro). Burmeister (discussão) 16h09min de 16 de fevereiro de 2010 (UTC)[responder]

  • Funciona: Sim
  • Via editor texto antes de importação: Sim substituição normal
  • Via AWB: ?

Ligações externas

[editar código-fonte]
  • Não fiz revisão exaustiva, mas parece-me que deu OK.
  • Só uma questão: o single line é quando se tem todo o conteúdo de uma linha até haver parágrafo? Num dos editores de texto que uso utilizo a opção "word Wrap". É isto. Ou seja, single line é quando tem que se usar a barra de rolamento horizontal para ir até ao fim da linha? Precisava de saber, tecnicamente qual a diferença entre isso e o multiline. Lijealso (discussão) 14h26min de 17 de fevereiro de 2010 (UTC)[responder]
  • Single Line: vai testar o regex até encontrar uma quebra de linha. Se chegou na quebra e não detectou o regex, ele pula a quebra e volta a testar a regex desde o início dela. Ou seja, só reconhece a regra se o texto q será reconhecido estiver em um único parágrafo. Se estiver em dois parágrafos ele não reconhece. Multi Line reconhece mesmo se estiver em várias linhas diferentes.
  • Não costumo usar isso, mas pelo q entendi, o Single Line seria como adicionar aos [^x]* um \n, ficando [^x\n]*. Ou seja, se tiver "http:asd\nasdf ", a regra não vai pegar. Eu sempre coloco o \n direto na regra, por via das dúvidas.
  • Multi Line nunca usei. Mas seria equivalente a, sei lá, talvez adicionar \n* entre cada caractere? Nem imagino.
  • Rjclaudio msg 23h53min de 17 de fevereiro de 2010 (UTC)[responder]

OK. Este também aparenta estar resolvido. Lijealso (discussão) 02h23min de 18 de fevereiro de 2010 (UTC)[responder]

  • Funciona: Sim
  • Via editor texto antes de importação: Sim
  • Via AWB: ?

Predefinição redimensionar

[editar código-fonte]

Tem efeitos na visualização do artigo: Sim prioritário

Redefinir esta regexp. No geral, mantém-se:

  • retirar os {{redimensionar|número%|blablabla}}
    • para aparecer só blablabla

com a seguinte excepção:

  • Nas taxocaixas com parâmetro "taxocaixa_autoridade" definido, retirar os parêntesis se os tiverem
    • {{redimensionar|número%|(blablabla)}} para (blablabla)

Funciona: reavaliar

  • É pra manter o () né?
  • if contain: (\| *\r?\n? *)taxocaixa_autoridade *\= *[^ \r\n]
A parte do primeiro parênteses é dispensável, se "taxocaixa_autoridade" só puder existir dentro da infobox. se puder, de algum jeito, estar fora da infobox, coloca para garantir que é campo de predef.

Acho que me enganei: "taxocaixa_autoridade" não existe, seria "género_autoridade". Confirmar. Lijealso (discussão) 20h22min de 16 de fevereiro de 2010 (UTC)[responder]

Portanto, é para retirar a predefinição de todos os artigos. E quando ela aparece no campo "género_autoridade", se tiver parêntesis no início e fim (a rodear o nome da pessoa e ano) é para retirar.

O código acima só serve para o AWB? Lijealso (discussão) 20h33min de 16 de fevereiro de 2010 (UTC)[responder]

Esqueci, vc quer pra bot né? Aí já não sirvo. Ainda tenho q aprender e fazer a transição. Rjclaudio msg 20h43min de 16 de fevereiro de 2010 (UTC)[responder]

De preferência, para evitar edições posteriores. Mas se tiver que ser. Lijealso (discussão) 20h48min de 16 de fevereiro de 2010 (UTC)[responder]

Pelo q entendi das respostas do Stabile lá no Café dos programadores (não garanto mt) ficaria assim:
Para o campo género_autoridade (single line)
^( *\| *género_autoridade *\= *)\{\{redimensionar\|[^\|\}]*\|\(([^\}]+)*\)}} *$ ------->$1$2
Seria passar essa regra antes da regra genérica
Rjclaudio msg 20h58min de 16 de fevereiro de 2010 (UTC)[responder]

Experimentei esse acima e deu um erro: excesso de um parêntesis curvo de fechamento (ou um de iniciação que não foi colocado). Lijealso (discussão) 13h12min de 17 de fevereiro de 2010 (UTC)[responder]

Detalhe. Vê agora. Rjclaudio msg 13h26min de 17 de fevereiro de 2010 (UTC)[responder]
Não detectou a regexp. Lijealso (discussão) 15h25min de 17 de fevereiro de 2010 (UTC)[responder]

Pelo menos para AWB funcionou. Testei em Argyrosomus hololepidotus. Coloquei essa regra acima (sem o ^ inicial e o $ final) e a genérica para todos os casos de redimensionar. Se aí não pegou, deve ser problema de conversão de regra, deixo pra outro. Rjclaudio msg 00h36min de 18 de fevereiro de 2010 (UTC)[responder]

Utilizei essa sem o ^ inicial e o $ final e parece-me que deu OK. Depois passei a genérica e também me pareceu OK. Aparentemente resolvido. Lijealso (discussão) 02h01min de 18 de fevereiro de 2010 (UTC)[responder]

  • Funciona: Sim
  • Via editor texto antes de importação: Sim
  • Via AWB: ?

Campo espécie

[editar código-fonte]
Prioritário

Sugestões apontadas por Burmeister na página de discussão de Lijealso

    • Observação: campo "espécie" deverá ter que ser acrescentado por via manual (?)

Pq não dá pra pra preencher o campo espécie? Qual a limitação pro bot? Não daria pra colocar nem mesmo um simples "espécie = \n" -> espécie = {{subst:PAGENAME}}\n" ? Rjclaudio msg 23h14min de 16 de fevereiro de 2010 (UTC)[responder]

Este coloquei como prioritário porque tem efeito na visualização e no preenchimento correcto da caixa.

Observação: o parâmetro tem que estar com 5 aspas (') de cada lado. O preenchimento não pode ser feito via PAGENAME visto que a formatação é "X. yyyyyy" (contracção do nome do género). Lijealso (discussão) 11h56min de 17 de fevereiro de 2010 (UTC)[responder]

Tem alguma regra de contração? Será sempre "X. yyy" ? Sempre a letra inicial do gênero, em maiúscula, ponto, espaço, segunda palavra do nome do artigo? Segunda palavra, ou nome do artigo sem a primeira palavra. Se tiver um padrão desse tipo dá pra fazer com awb. Rjclaudio msg 12h16min de 17 de fevereiro de 2010 (UTC)[responder]
A regra simples. Quando se trata de um artigo sobre espécie, o campo binomial é que leva o nome completo. O campo espécie leva a formatação com contracção que por vezes se utiliza para se referir a espécies: Assumindo "Xxxxxx yyyyy" como nome da espécie (reparar que começa sempre por maiúscula), a formatação no campo espécie deve ficar sempre como "X. yyyyy", ou seja, nome do género contraído para somente inicial (maiúscula), seguido de ponto, seguido de espaço, seguido do nome específico (yyyyy, neste caso). Lijealso (discussão) 12h26min de 17 de fevereiro de 2010 (UTC)[responder]
Sem esquecer que deverá ter sempre itálico e bold. Lijealso (discussão) 12h28min de 17 de fevereiro de 2010 (UTC)[responder]

Parece Ok. Lijealso (discussão) 14h02min de 17 de fevereiro de 2010 (UTC)[responder]

  • Funciona: Sim
  • Via editor texto antes de importação: Não
  • Via AWB: Sim

Espaçamento a mais em campo da taxocaixa

[editar código-fonte]

Espaçamento a mais: taxocaixa, campo nome

[editar código-fonte]

Descrição: por vezes acontece em | nome = ''nomedoartigo '' haver um espaço antes das 2 aspas ('') finais

Funciona:

Espaçamento a mais: taxocaixa, campo binomial

[editar código-fonte]

Descrição: por vezes acontece em | binomial = ''nomedoartigo '' haver um espaço antes das 2 aspas ('') finais


Funciona:

  • Juntei as duas seções, por serem quase iguais. Qualquer outro campo, só colocar (?:nome|binomial|campo2|campo3)
  • (regex para awb, já tinha escrito, salvando só pra não perder, depois passo pro correto)
  • Find: "(\| *(?:nome|binomial) *= *\'+[^'\n]+) (\'+)\r?\n"
  • Replace: "$1$2\n"
  • Rjclaudio msg 21h00min de 16 de fevereiro de 2010 (UTC)[responder]
^( *\| *(?:nome|binomial) *\= *\'+[^'\n]+) (\'+)$ -------> $1$2
se não pegar, pode ser pelo ?: (não sei se é específico do awb). tira o ?:, e na substituição fica $1$3.
Rjclaudio msg 13h31min de 17 de fevereiro de 2010 (UTC)[responder]

Só detectou o binomial. Lijealso (discussão) 15h01min de 17 de fevereiro de 2010 (UTC)[responder]

Espaçamento a mais: mesmo no início do texto corrido

[editar código-fonte]

Descrição: por vezes acontece em '''''nomedoartigo ''''' haver um espaço antes das 5 aspas (''''') finais


Funciona:

  • Estava pensando agora, em uma bem genérica. Não acontece de ter espaço entre as 5aspas iniciais e o nome do artigo, certo? Então " ''''' " só acontece nesse caso, certo? Então dá pra fazer essa regra específica para esse caso:
    • (regex para awb, já tinha escrito, salvando só pra não perder, depois passo pro correto)
    • Find: " (\'{5,5}) "
    • Replace: "$1 "
  • A regra genérica precisa ser melhorada, e mt. Pra fazer uma 100%, com uma única regra, acho meio difícil pq ficaria mt complicada. Usaria 3 regras de marcação: início do artigo, aspas iniciais, aspas finais. Senão tem risco de tirar espaçamento antes das aspas iniciais. Enfim, discussão pra outra hora. Pra agora essa basta.
  • Rjclaudio msg 21h00min de 16 de fevereiro de 2010 (UTC)[responder]
"^ ''''' $" -------> "''''' "
Rjclaudio msg 13h41min de 17 de fevereiro de 2010 (UTC)[responder]

Experimentei o código mais acima (o de baixo não deu) e deu para perceber:

  • O ficheiro em que trabalho em 979 artigos
  • O código detectou 913 vezes
  • Fiz uma busca rápida e encontrei artigos com espaço entre as 5 primeiras aspas e o nome do artigo.

Lijealso (discussão) 15h18min de 17 de fevereiro de 2010 (UTC)[responder]

  • Fiz uma regra (para awb) melhor, e mais geneérica, pegando 2, 3 e 5 aspas, não importa onde esteja. Serve para cá, e para o problema do espaço nos campos da infobox, lá em cima.
  • Funciona assim: de "espaço,aspas,espaço" até "não-espaço,aspas,espaço". "não-espaço,aspas,espaço" sinaliza q essas aspas são finais, e q estão corretas, logo arrumar espaço das iniciais. O inverso ... é o contrário =)
  • Find: "([ \r\n]'+) +([^'\n]*[^' \r\n]'+[ \r\n])"
  • Replace: "$1$2"
  • Find: "([ \r\n]'+[^' \r\n][^']+) +('+[ \r\n])"
  • Replace: "$1$2"
  • Pycnomma roosevelti e Pycnomma semisquamatum
  • Rjclaudio msg 00h16min de 18 de fevereiro de 2010 (UTC)[responder]

Quanto aos espaços parece-me que ficou OK, mas não foi capaz de detectar no campo nome. Lijealso (discussão) 01h45min de 18 de fevereiro de 2010 (UTC)[responder]

  • Estranhamente, tem uma tabulação (\t em regex) após as aspas finais do campo nome, e depois das chaves finais da infobox. Precisa de algumas regras de tratamento de caracteres. Trocando tab por espaço. E com isso aproveitando para regras de trim.
  • Caracteres
    • Find "\t' replace " " (espaço)
    • Find "\r\n" replace "\n"
  • Triming horizontal
    • Espaço duplo - Find " {2,}" replace " "
    • Final de parágrafo - Find " \n" recplace "\n"
    • Antes ref - Find "([^ ]) +(</ref>)" replace "$1$2"
    • Antes de pontuação = Find "([^ ]) +([\.\,])" replace "$1$2". Até agora só achei problema com vírgula, por isso não coloquei outras regras de pontuação.
  • Coloca os dois conjuntos de regras como as primeiras regras a serem executadas. Só depois da padronização de caracteres e triming horizontal e vertical que se começa a ver outras regras.
  • Rjclaudio msg 02h31min de 18 de fevereiro de 2010 (UTC)[responder]

Portanto, fiz 1º as 2 regras a seguir a "caracteres", em 2º as 4 regras a seguir a "Triming horizontal" e para finalizar as 2 regras abaixo da minha mensagem de 15h18min de 17 de fevereiro. É isso? Experimentei e o campo nome já foi detectado. No geral, pareceu-me que corrigiu aquilo que tinha que corrigir. Lijealso (discussão) 14h27min de 19 de fevereiro de 2010 (UTC)[responder]

Espaçamento em lista

[editar código-fonte]

Artigos Gênero na seção espécie inserir espaço ( de *''[[Chromogobius britoi]]'' para * ''[[Chromogobius britoi]]'' (convenção do AWB, só para evitar futuras mudanças) Burmeister (discussão) 16h09min de 16 de fevereiro de 2010 (UTC)[responder]

  • Funciona:

Referências duplicadas

[editar código-fonte]

Argyrosomus thorpei repetição da citação FishBase 7 e 10. Paratrypauchen microcephalus 5 e 7. Burmeister (discussão) 16h09min de 16 de fevereiro de 2010 (UTC)[responder]

  • Problema com as urls do FishBase. Podemos tratar isso. Retirar &lang=English do final das urls, e padronizar &SpeciesName= x &speciesname=.
  • Espero q o único motivo pra não ter juntado as refs seja pq elas são diferentes. Se o script não consegue juntar refs iguais, aí fica mais complicado.
  • Rjclaudio msg 23h27min de 16 de fevereiro de 2010 (UTC)[responder]
  • Achei outro caso: Paratrimma
  • Ref 2 e 4 são iguais, mas não foram unidas pelo bot com "ref name=". Estranhamente, nem o AWB juntou, e ele arruma isso sozinho. Deve ser bug, vou falar com os devs.
  • Padronizar a ref do "Hoese D. F."
  • "Hoese D. F." x "Hoese, D. F."
  • "(núm. n1). n2" -> "(núm. n1): n2" (esse parece ter tb em outras refs)
  • Rjclaudio msg 23h30min de 16 de fevereiro de 2010 (UTC)[responder]

Formatação das refs

[editar código-fonte]
  • Usar {{Citar web}} nas refs. É fácil fazer a regra.
    • Tem como usar {{Citar web}} nas refs? <ref>[http://www.biolib.cz/en/taxon/id151883/ BioLib] {{en}}</ref>. Podia ser <ref>{{Citar web |url=http://www.biolib.cz/en/taxon/id151883/ |título=BioLib |língua={{en}} |autor= |obra= |data= |acessodata=}}</ref>. Pensei em pedir um {{Citar livro}} tb, mas isso é meio difícil de fazer. Pelo menos ainda não consegui nenhuma boa regra genérica pra ela.
  • Usar {{Citar livro}} nas refs. É difícil fazer a regra. Meio impossível pra mim, até agora, pra acertar qual parte da ref vai pra qual parâmetro.
    • Mas como são milhares de artigos criados em massa, e as refs são quase q da mesma origem, e as refs da mesma origem seguem uma mesma ordem, deve dar pra criar regras de conversão. Vou pegar algum exemplo pra vc usar como teste nas próximas criações.
  • Rjclaudio msg 23h40min de 16 de fevereiro de 2010 (UTC)[responder]

Sugestões de Peixes

[editar código-fonte]

Categorização pela Família

[editar código-fonte]
Prioritário

Sugestões apontadas por Burmeister na página de discussão de Lijealso

a categorização poderia ser do tipo: artigos de espécie na categoria do gênero; artigo do gênero na categoria da família, assim fica fácil para o bot trabalhar (acho eu)
  • Observação: os artigos das espécies, no original, estão categorizados no género; os artigos dos géneros, segundo parece (confirmar) estão categorizados no próprio género
  • Observação: saber se há mecanismo de categorizar os géneros na categoria superior (da família)
  • Lijealso (discussão)
    • Com AWB eu usava os campos das infoboxes para fazer uma categorização básica e genérica das Especial:Páginas sem categorias. Teria q revisar essas regras pra ver se tá certo mesmo. Então tb deve poder, não sei se tem problema com o bot.
    • Primeiro marco com um símbolo onde a categoria vai ficar, exemplo de símbolo: ▓. Seria uma regra similar à que já tem, q adiciona {esboço}, {Defaultsort}.
    • Depois uso a regra abaixo (regex pra AWB, não sei se vale pro bot, moutra pessoa pega a ideia e converte)
    • Find: (\|família = ([^\n]*)\n[^▓]+)▓
    • Replace: $1[[Categoria:$2]]
    • Tem q testar um pouco pra saber se está boa, e se não vai dar erro.
    • Rjclaudio msg 23h11min de 16 de fevereiro de 2010 (UTC)[responder]

Coloquei como prioritário. Se puder ser feito irá poupar muito trabalho de categorização. Tem que se garantir que só fará isto nos artigos dos géneros. Alguma maneira? Acho que se pode indentificar se tiver o campo género com '''''XXXXXXXXXX''''' Lijealso (discussão) 12h12min de 17 de fevereiro de 2010 (UTC)[responder]

Coloquei isso no meu scriptAWB, nas regras temáticas. Veja Calamiana. Rjclaudio msg 13h35min de 17 de fevereiro de 2010 (UTC)[responder]
Acho que está OK. Lijealso (discussão) 13h59min de 17 de fevereiro de 2010 (UTC)[responder]
Pode-se testar este mais um pouco? Carregar alguns artigos de géneros para depois passar o AWB? Se sim, quantos? Lijealso (discussão) 02h10min de 18 de fevereiro de 2010 (UTC)[responder]
  • Esses testes q fiz até agora foram feitos depois das minhas regras normais do scriptAWBB, então pode acontecer do teste dar resultado positivo só pra mim por causa de alguma regra anterior. Vou passar a testar apenas as regras de teste.
  • Estou livre para fazer os testes. Só me passar a lista. De preferência em séries de no máximo 100 ok. E vou salvando os artigos ou não? Pensei em deixar pra passar mesmo o awb (salvando) só depois de resolvermos todas as correções pendentes, assim evita de salvar duas vezes.
  • Rjclaudio msg 02h38min de 18 de fevereiro de 2010 (UTC)[responder]

OK. Vamos então esperar mais um pouco. Lijealso (discussão) 02h47min de 18 de fevereiro de 2010 (UTC)[responder]

  • Testei agora só com essas regras abaixo ativadas. Tudo certo no awb.
  • Marca local - Find: "(\n|{{DEFAULTSORT:.*}})\r?\n(\[\[Categoria:)" Replace: "$1\n┼\n$2"
  • Coloca categoria - Find: "(\| *família = \[\[([^\n]*)\]\]\n[^┼]+)┼" Replace: "$1[[Categoria:$2]]├"
  • Retira segunda categoria - Find: "├\r?\n\[\[Categoria:.*]]" Replace: "" (em branco, só pra apagar)
  • Desmarca - Find: "(┼\n|├)" Replace: "" (em branco, apagar caso tenha dado erro em alguma das anteriores
  • Me parece bem correta. Usava bastante ela (uma variação dessa) qnd fiz as categorizações. 300+ artigos categorizados. Mas se quiser fazer mais testes, fico a espera da lista com o grupo de teste.
  • Rjclaudio msg 03h01min de 18 de fevereiro de 2010 (UTC)[responder]

Campos da infobox

[editar código-fonte]

Sugestões apontadas por Burmeister na página de discussão de Lijealso

  • não há necessidade do parâmetro |família_autoridade na infobox
    • Observação:
  • também não vejo a necessidade do imagem2, imagem_legenda2 e imagem_largura2 (quando não são utilizadas)
    • Observação:
  • acho que nem a imagem_largura1 é necessário
    • Observação:
Nos artigos das espécies
além das sugestões já citadas
  • | género_autoridade --> desnecessário
  • | subespécie= vazio --> desnecessário
    • Observação: aferir se realmente vale a pena retirar os campos "género_autoridade" e "subespécie"


Fora da minha área de conhecimento, mas: o campo "nome" sempre precisa de itálico, ou é só em alguns casos? Se for sempre, isso tem q passar pro código da infobox, e não ser escrito no artigo. Algo a ser arrumado agora. O mesmo pra "género". Será q tem outros casos? Rjclaudio msg 23h41min de 16 de fevereiro de 2010 (UTC)[responder]

O caso do itálico é especial e tem a ver com as convenções de nomenclatura biológica (regras externas à wiki). Em qualquer lado onde apareçam no artigo, géneros e espécies deverão levar itálico. Segundo me apercebi, e tendo em conta a caixa na wiki.en, de onde a nossa tem origem, no campo género é colocado o itálico (não está predefinido na própria caixa). Quanto ao nome, a questão é que se pode colocar ou o nome científico ou o nome comum (o científico leva itálico nos casos já citados, o comum não leva). Não tenho conhecimento elevado quanto ao funcionamentos das caixas, mas se não levar parâmetro nome ela assume o nome no título. Lijealso (discussão) 11h20min de 17 de fevereiro de 2010 (UTC)[responder]

  • Então sempre vai ter itálico em espécie e gênero? Eu prefiro colocar o itálico na própria predefinição, pra evitar pro caso de alguém esquecer de colocar. E é menos código para o artigo. Vou ver aqui como fazer pra predef colocar itálico se o campo não tiver itálico. Rjclaudio msg 11h44min de 17 de fevereiro de 2010 (UTC)[responder]
A regra é simples, em todo o lugar onde apareçam nomes científicos de espécies e géneros, leva itálico. Quanto às sugestões apontadas, na minha opinião, e também por já ter revisto algumas centenas dos artigos a importar, e também para poupar algum trabalho, retiraria somente os campos imagem_largura e imagem2_largura. Nas imagens, existe uma quantidade de artigos que tem imagem, até 2 alguns têm. Existem alguns artigos de subespécies e acho que não tem muito mal deixar as autoridades um ou dois níveis taxonómicos acima do que trata o artigo. Lijealso (discussão) 12h52min de 17 de fevereiro de 2010 (UTC)[responder]

Não consegui detectar se o campo já está em itálico ou não, então não dá pra predef colocar o itálico só qnd o campo não tiver. Então fica assim mesmo. Rjclaudio msg 13h40min de 17 de fevereiro de 2010 (UTC)[responder]

Retirei os campos de largura, por substituição normal. O resto, para mim, pode ficar como está. Lijealso (discussão) 10h39min de 19 de fevereiro de 2010 (UTC)[responder]

Outras sugestões para peixes

[editar código-fonte]

Outras sugestões: Burmeister (discussão) 16h09min de 16 de fevereiro de 2010 (UTC)[responder]

  • Chonophorus, "linkou" simplesmente Bleeker, na minha opinião ou insere o nome completo no estilo [[Pieter Bleeker|Bleeker]] ou deixa sem "linkar", não acho certo esse tipo de "linkagem"

Não sei se o AWB terá maneira de deixar lincado o ano, de maneira automática, só a 1ª aparição, mas acho que sim (confirmar). Quanto ao link dos nomes, pessoalmente não vejo grande problema, desde que o nome esteja correctamente escrito. Lijealso (discussão) 12h17min de 17 de fevereiro de 2010 (UTC)[responder]

Pros links dos anos, não sei como faz isso com awb. O AWB não consegue comparar dois trechos. Minha esperança é usar um módulo do AWB (tools -> make module) e usar C# 2.0 ou VB.NET 2.0 pra fazer isso. Está no meu To-Do, mas lá pra frente. Não sei programar nessas linguagens, então ainda teria q aprender pra tentar fazer isso. Deixo pra outro tentar essa. Rjclaudio msg 13h48min de 17 de fevereiro de 2010 (UTC)[responder]

Sugestões de sintaxe

[editar código-fonte]

Zebrus zebrus inseriu Defautsort, necessário? Burmeister (discussão) 16h09min de 16 de fevereiro de 2010 (UTC)[responder]

Zebrus zebrus é necessário defaultsort. Sempre q tem inicial minúscula em alguma palavra precisa de defaultsort pra não dar erro na ordenação das cats. Pelo menos essa é a regra geral. Não sei se nesse caso causaria erro. Mas não custa colocar, ajuda no checkwiki, e ensina os novatos a sempre fazerem isso. Rjclaudio msg 21h10min de 16 de fevereiro de 2010 (UTC)[responder]
Não sou especialista nas regras do defaultsource (ver se encontro a documentação para reler) mas vou tentar dar uma olhada geral pelos artigos para verificar alguma anomalia. Lijealso (discussão) 02h49min de 18 de fevereiro de 2010 (UTC)[responder]

Verifiquei um ficheiro inteiro e o DEFAULT só aparece em espécies e sempre nesse formato com maiúscula na 2ª palavra. Detectei que o DEFAULT, em alguns casos foi parar acima de {{Esboço-peixe}}. O AWB pode corrigir o posicionamento do DEFAULTSOURCE? Lijealso (discussão) 10h33min de 19 de fevereiro de 2010 (UTC)[responder]

  • Sim, o awb pode corrigir. Mas seria melhor o próprio programa. No awb uso:
  • Marca cat - Find: "\n\[\[Categoria:" - Replace "\n┼"
  • Ordem - Find: "({{DEFAULTSORT:[^}\n]+}}\r?\n)([^┼]+\n)(┼)" - Replace "$2$1$3"
  • Desmarca - Find: "" - Replace "[[Categoria:"
  • Talvez não precise de regra extra. Pode ser arrumar a regra q coloca o esboço, ou a regra q coloca o defaultsort.
  • Não sei como é sua regra de esboço, mas ao invés de detectar "\n\[\[Categoria:", detectar "\n(\[\[Categoria:|{{DEFAULTSORT:)".
  • Rjclaudio msg 12h39min de 19 de fevereiro de 2010 (UTC)[responder]
Não, no 2º passo não foi detectado. Lijealso (discussão) 14h07min de 19 de fevereiro de 2010 (UTC)[responder]

Lijealso (discussão) 15h08min de 19 de fevereiro de 2010 (UTC)[responder]

Testei o que estava e deu certo. Mudei um pouco pq colocava quebra de linha entre defaultsort e cat. Mas tá dando certo. Pelo menos o regex está ok. (Teste). Rjclaudio msg 16h24min de 19 de fevereiro de 2010 (UTC)[responder]

Alterar a formatação dos links externos para o sistema {{Link|1=|2=|3=}} (se não me engano os scriptsAWB também fazem essa alteração por padrão) Burmeister (discussão) 16h09min de 16 de fevereiro de 2010 (UTC)[responder]

Então este pode ser feito via AWB sem problemas? Lijealso (discussão) 10h42min de 19 de fevereiro de 2010 (UTC)[responder]

Pode-se tentar antes. Vejamos se dará. Lijealso (discussão) 14h08min de 19 de fevereiro de 2010 (UTC)[responder]

Outras sugestões de sintaxe

[editar código-fonte]

Sugestões apontadas por Burmeister na página de discussão de Lijealso

Voltando ao gênero as referências nas espécies me parece reduntante: exemplo Psammogobius --> BioLib (4) segue o AQUATAB; AQUATAB (5) segue o FishBase; Catalogue of Life (7) segue o FishBase.
  • Observações: Julgo complicado, provavelmente só por via manual


Vendo Psammogobius biocellatus achei várias coisas:

  • Tem uma tabulação (\t no awb) logo após o }} da infobox.
  • Tá faltando os iws. Sim são colocados aquando da exportação da wiki.ca ou aquando da importaçao da a wiki.pt
  • Iria propor mudar o | dos campos da infobox, de "\n| campo =", para "\n |campo =". O espaço antes do | fica mais destacado q depois. Não sei se é padrão/consenso, mas o scriptAWB q faço acabou mudando isso. Posso retirar a regra, mas sabe como é, gosto de padrões.
  • Tem um espaço logo após <ref>, no campo "género_autoridade"
  • Em unidades de medida (e possivelmente todas as unidades, não sei), trocar 12 cm -> 12 cm (tem q ver o código-fonte, senão não percebe a diferença). Evita q o cm fique na linha de baixo. Mesmo para "p. 112".
  • Espaço antes de </ref>. Procure por Micronesica 11(1):115-121. </ref>
  • Substituir == Bibliografia == por == {{Bibliografia}} == Sim pode ser feito via manual.
  • Espaço antes de vírgula. Procurar "History]], Central Park West , NY ". Regras de triming para pontuação. Meu scriptAWB tem umas 12 regras de pontuação (precisei fazer separado as regras, mt cuidado nesse ponto).
  • Tem como adicionar {{Portal3}} tb? {{Portal3|Biologia}}, se não tiver nehunm mais específico. Vai ajudar o scriptAWB a saber q o artigo é de Biologia, e fazer mudanças temáticas (regras temáticas estão no meu To-Do)
  • Falta um espaço antes do = no campo "mapa_legenda"
  • Daria pra colocar espaços após (ou antes, não sei) o = pra todos os campos ficassem alinhados, facilitando a edição? Já vi alguns artigos com infobox fazendo isso.
  • Colocar as predefs de correlatos no início da seção LE. E ao invés de {{commonscat}}, {{wikispecies}}, usar {{Correlatos}}
{{Correlatos
 |commonscat      = xxx
 |wikispecies     = xxx
}}

Rjclaudio msg 23h40min de 16 de fevereiro de 2010 (UTC)[responder]

Como colocar os títulos de secções, com espaços ou sem espaços? ex: ==Título== vs == Título ==

Nos artigos existe secção que é assim: ==[[Morfologia (biologia)|Morfologia]]==

Melhor retirar o link?

Lijealso (discussão) 14h53min de 17 de fevereiro de 2010 (UTC)[responder]

  • Como é padrão do awb, e de vários bots (como os bots de iws), melhor colocar espaço em == Título ==.
  • O link pode ajudar a quem não conheça a linguagem técnica. Embora imagino q quem não conhecer isso não vai ter interesse em ler a seção. Não faço questão de nada, mas tendo a incluir o link.
  • Rjclaudio msg 23h56min de 17 de fevereiro de 2010 (UTC)[responder]

OK então. Os espaços resolve-se rapidamente. Tópico encerrado, acho. Lijealso (discussão) 02h13min de 18 de fevereiro de 2010 (UTC)[responder]

Outras sugestões

[editar código-fonte]
  • Usar uma predefinição "vazia" para identificar todos os artigos
    • Será retirada após verificar-se que está tudo OK com o artigo
    • Fez-se algo semelhante, para parte dos artigos importados por bot, a partir da wiki.en (IUCN)