Classificação e categorização dos livros
Apenas para incrementar a discussão com o que já foi dito em outros lugares, vou deixar dois links:
- Discussão:Página principal proposta#Ciências Naturais x Ciências Biológicas e da Saúde; e
- v:Wikiversidade:Esplanada/Arquivo/2008/01#Novos paradigmas, novas concepções, novos modelos.
Assim que puder volto a comentar...
Algum tempo depois...
O Virgílio indicou alguns links com classificações que são usadas em Portugal. Aqui estão:
- Nomenclatura da UNESCO
- Nomenclatura UNESCO
- Classificação Nacional das Áreas de Educação e Formação (Portaria n.º 256/2005 de 16 de Março)
- Classificação de Domínios Científicos e Tecnológicos - 2007 (FOS) (D.R. nº 65/2008, de 2 de Abril, II Série) a 349.ª Deliberação do Conselho Superior de Estatística com este pdf:
Aqui no Brasil temos também:
- Tabela de Áreas de Conhecimento - No site da da CAPES
- Tabela de Áreas e Sub-Áreas do Conhecimento - No site da FAPESP
- Áreas do Conhecimento - No site do CNPq
- Nova Tabela das Áreas do Conhecimento - Versão preliminar proposta para discussão em setembro de 2005, pela Comissão Especial de Estudos CNPq, CAPES, FINEP.
Proposta...
Já se passou algum tempo desde que começamos a aprimorar a organização da biblioteca. Em janeiro de 2008, tínhamos apenas a classificação por assunto, que conforme dito na seção acima, foi construída aos poucos, sem critérios bem definidos... Agora, já temos alguns esquemas paralelos para a organização:
- Ordem alfabética
- Estágio de desenvolvimento (em andamento, conforme Wikilivros:Diálogos_comunitários#Biblioteca por estagio de desenvolvimento)
- Área do conhecimento (a ser estudada e aprimorada):
- Versão original da biblioteca (que ainda exige atualização manual por parte dos autores)
- Classificação Decimal de Dewey
- Biblioteca do Congresso dos Estados Unidos
- Nível educacional
Dada a variedade de tabelas de classificação por área do conhecimento, pode demorar um pouco até que sejamos capazes de estabelecer o esquema próprio do Wikilivros. Então, eu gostaria de implementar também a categorização pela Classificação Decimal de Dewey, da seguinte forma:
- Cada um de nossos quase 300 livros recebe uma das dez categorias principais da CDD, cujos nomes poderíam ser: "Generalidades (CDD 000)", "Filosofia (CDD 100)", "Religião (CDD 200)", "Ciências Sociais (CDD 300)", "Línguas (CDD 400)", "Ciências puras (CDD 500)", "Ciências aplicadas (CDD 600)", "Artes (CDD 700)", "Literatura (CDD 800)", "História e Geografia (CDD 900)".
- Conforme os autores desejarem, subcategorias correspondentes aos níveis mais específicos da CDD podem ser acrescentadas (mas o essencial é dispor do nível principal)
Isso garantiria pelo menos um esquema de classificação claramente definido segundo o qual os livros estariam organizados por assunto. Logo deixarei pronto o esboço da versão da biblioteca com listas automáticas conforme a CDD...
Completando...
A classificação, normalmente, usada nas bibliotecas, em Portugal, é a CDU. Esta é a classificação usada pela Biblioteca Nacional e para a quase totalidade das bibliotecas públicas. O Porbase, programa usado para catalogação dos livros usa, também usa a CDU. Creio que a Biblioteca Nacional do Brasil e as bibliotecas que com ela trabalham, também usam a CDU (é favor confirmar).
A CDD (Dewey) é usada, pontual e complementarmente, para ajudar a resolver algum caso complicado de catalogação.
O sistema do Congresso dos EUA também é utilizado em casos muito particulares. Um exemplo é a biblioteca da FCT/UNL, dado o grande número de livros provenientes dos EUA e que já trazem a classificação atribuída.
Nestas condições, parece não restarem muitas dúvidas quanto ao sistema de classificação que devia ser usado, em primeiro lugar, nos Wikilivros.
A grande vantagem de uma biblioteca virtual é não ter associado, a um livro, uma classificação e um local de arrumação, numa estante. Não há problema nenhum em atribuir mais do que uma classificação ao mesmo livro, permitindo a sua procura por vários sistemas, incluindo o dos domínios científicos. Esta última classificação, é ainda mais flexível, permitindo classificar um mesmo livro de conteúdo pluridisciplinar em mais do que uma área de conhecimento.
As classificações de áreas de conhecimento já existentes permitem a sua aplicação imediata, mas com todos os defeitos que têm, parece-me mais apropriado desenvolver um sistema referenciado adequadamente, à semelhança do que se começou a esboçar na discussão da Categoria Domínios e que poderia também ser útil aos outros projectos, nomeadamente, à Wikipédia.
Atenciosamente,
Virgílio A. P. Machado
Acho que essa é uma tarefa muito difícil, todas são boas em uns aspectos e ruis em outros.
Mas observando isto percebo que dizer que uma categoria pode ser chamada de área do conhecimento(como esta) e muito impreciso... minha sugestão é que reorganize-se a categoria área do conhecimento para que contenha todas as classificações (cdu, cdd,loc etc...), no entanto ainda assim precisaremos de uma classificação por assunto consistente... por isso deve-se tentar criar uma categoria adaptada para isso... vamos conversando...
Raylton, eu não entendi esta parte: Citação: Raylton escreveu: « dizer que uma categoria pode ser chamada de área do conhecimento(como esta) e muito impreciso»
"Como esta" qual? E onde se chama uma categoria de área do conhecimento?
Pergunta: considerando que o nome de uma categoria é o que se insere em um livro ao dizer a que área ele pertence, os nomes do tipo "Categoria:Filosofia (CDD 100)" (que seguem a sintaxe usada para desambiguação nos wikiprojetos) que sugeri acima não ficariam mais intuitivos do que usar a separação pela barra? Quando iniciei a categorização dos livros conforme a ordem alfabética eu escolhi usar "Categoria:Livros começando com D" em vez de adotar a barra como em "Categoria:Ordem alfabética/D" (o Wikilivros inglês adota algo neste estilo), mas não sei se era a melhor escolha a fazer (mas como é relativamente fácil alterar esse tipo de coisa em massa, não me importei muito na ocasião). Sei que a barra traz a vantagem de existirem palavras mágicas como {{BASEPAGENAME}} para algumas situações, mas o esquema "Nome (desambiguação)" tem a vantagem de ser mais intuitivo para os editores (na medida em que, por exemplo, o HotCat irá exibir sugestões com base nos primeiros caracteres do nome da categoria). O que pensam a respeito? Acho que o mais importante será manter a consistência entre os diversos esquemas, mas gostaria de saber se vêm outras vantagens/desvantagens em alguma das opções...
Obrigado, Virgílio, pelos links. Eu tinha visto que o wikibooks francês usa o CDU (fr:Catégorie:Recherche CDU)... Podemos começar por ele, em vez do CDD (ou ir implementando ambos ao mesmo tempo, já que não há grande acréscimo de esforço entre implementar um ou dois dos esquemas de classificação). O que sugerem?
Os sistemas CDU e CDD são muito parecidos. Para que todos possam trabalhar de acordo com as suas preferências, a participação na categorização de acordo com qualquer sistema deve ser aberta a todos (um mundo aberto). A «Categoria:Filosofia» continuaria a figurar na página como tal e não como «Categoria:Filosofia (CDD 100)». Os códigos são para ser usados em vez das descrições. São sistemas usados para «arrumar» livros nas estantes duma biblioteca. Na página de cada categoria é que devem ser incluídas referências e/ou a codificação e designação do(s) sistema(s) de classificação utilizados.
A Biblioteca pode, também, apresentar ou ter subpáginas com as várias classificações alternativas, para que os leitores possam usar a que for da sua preferência ou que conheçam melhor.
Acho que é tempo de passar à acção. Tudo o que se propõe parece estar devidamente fundamentado e nada do que se propõe é irreversível.
Atenciosamente,
Virgílio A. P. Machado
Digamos então que as categorias dos assuntos não levem nem "(CDD XXX)" nem "(CDU YYY)" em seus nomes e que, em vez disso, os nomes das categorias em cada um dos dois esquemas sejam somente "Categoria:CDD XXX" e "Categoria:CDU YYY". Então, cada livro será inserido:
- Em uma das 10 categorias da CDD (000, 100, ..., 900);
- Em uma das 9 categorias da CDU (0, 1, 2, 3,
4,5, 6, 7, 8, 9); - Em todas as categorias que indicam a área, subárea ou especialidade específica tratada no livro;
As categorias deste último item também seriam categorizadas conforme os dois primeiros itens (CDD e CDU).
Minha dúvida é: tanto na CDD quanto na CDU e nas tabelas para as quais foram colocados alguns links há um conjunto de categorias (cerca de 10) para representar o nível mais geral de classificação por área. Quais seriam as áreas mutuamente exclusivas segundo as quais nossos livros seriam particionados? Seriam as mesmas de algum dos esquemas já apresentados? Seriam outras? Qual seria o critério, caso não seja idêntica a uma das mais populares? Atualmente elas são "Línguas e linguística", "Ciências exatas e da terra", "Ciências da vida e da saúde", "Humanidades", "Computação e Engenharias" e "Variados", e como se pode notar, não existem estas áreas na forma de categorias, ou seja, não há consistência entre a biblioteca atual e a rede de categorias. A categoria principal da organização por áreas do conhecimento deveria reunir exatamente as mesmas categorias segundo as quais a biblioteca é dividida, e não misturar áreas e subáreas como acontece na Categoria:Principal atualmente.
Para facilitar (espero...) comecei a esboçar aqui a minha ideia. Estão convidados a escolher um livro e incluí-lo na classe apropriada de cada classificação. Podem editar à vontade nessa minha subpágina. Tive dúvidas sobre como classificar o livro que escolhi, por não ser da minha área, nem ser especialista em indexação. A classe pode ser expandida até incluir a subclasse mais apropriada para o livro, o que ainda não fiz.
Numa outra página, tenciono mostrar a rede de categorias do mesmo livro, a não ser que alguém o faça, entretanto.
Atenciosamente,
Virgílio A. P. Machado
Já iniciei a tentativa de mostrar a rede de categorias do mesmo livro. Quem quiser colaborar, esteja à vontade.
Atenciosamente,
Virgílio A. P. Machado
Só para deixar registrado, coloco abaixo uma tabela com a correspondência entre as classes principais] da CDD e da CDU, confirmando o que o Virgílio disse sobre os dois sistemas serem bastante parecidos.
CDD | CDU | Sugestão de nome para a Categoria: |
---|---|---|
000 Computer science, information & general works | 0 SCIENCE AND KNOWLEDGE. ORGANIZATION. COMPUTER SCIENCE. INFORMATION. DOCUMENTATION. LIBRARIANSHIP. INSTITUTIONS. PUBLICATIONS | Ciências da Computação, da Informação e Generalidades |
100 Philosophy & psychology | 1 PHILOSOPHY. PSYCHOLOGY | Filosofia e Psicologia |
200 Religion | 2 RELIGION. THEOLOGY | Religião e Teologia |
300 Social sciences | 3 SOCIAL SCIENCES. STATISTICS. POLITICS. ECONOMICS. TRADE. LAW. GOVERNMENT. MILITARY AFFAIRS. WELFARE. INSURANCE. EDUCATION. FOLKLORE | Ciências Sociais |
400 Language | 8 LANGUAGE (aparece abaixo novamente!). LINGUISTICS. LITERATURE | Separaremos "Idiomas" e "Literatura" como na CDD? Prefiro juntar em "Idiomas e Literatura"... |
500 Science | 5 MATHEMATICS. NATURAL SCIENCES | Ciências Puras |
600 Technology | 6 APPLIED SCIENCES. MEDICINE. TECHNOLOGY | Tecnologia e Ciências Aplicadas |
700 Arts & recreation | 7 THE ARTS. RECREATION. ENTERTAINMENT. SPORT | Artes e Recreação |
800 Literature | 8 LANGUAGE (já apareceu acima!). LINGUISTICS. LITERATURE | Separaremos "Idiomas" e "Literatura" como na CDD? Prefiro juntar em "Idiomas e Literatura"... |
900 History & geography | 9 GEOGRAPHY. BIOGRAPHY. HISTORY | História, Biografia e Geografia |
Seria adequado (?) usarmos 9 categorias principais (essencialmente como na CDU, com nomes como sugeri na tabela do link anterior) para classificar os wikilivros por tema, e colocar no conteúdo da página de cada categoria a indicação da CDD e CDU correspondente?
A minha opinião sobre os sistemas de classificação é a seguinte:
1) Sou a favor de se usarem as designações textuais das classes de todos os sistemas de classificação que alguém quiser implementar, desde que suportados por fontes fidedignas.
2) Por essa razão, sou contra a utilização de designações textuais de classes que não constem de nenhuma fonte fidedigna.
3) Sou contra a utilização dos códigos de qualquer classificação, pois representam um trabalho adicional, sem qualquer préstimo na «arrumação» dos Wikilivros em prateleiras. Como se vê, nos exemplos que dei, estão lá as classes todas e não se vê que falta lá fazem os códigos. Neste ambiente, é uma informação redundante e, por estar codificada, exige uma conversão, para a língua escrita e falada, para ser entendida.
Espero ter sido suficientemente claro, mas trata-se apenas da minha opinião.
Atenciosamente,
Virgílio A. P. Machado
E no caso de se adotarem esquemas em que determinadas classes (por exemplo, a de código CDD 900) recebem nomes (no exemplo, "História e Geografia") formados pela simples enumeração de uma ou mais de suas subclasses (no caso, "Geografia" e "História"), como deveríamos proceder para a escolha do nome da categoria correspondente? Criaríamos tanto "História e Geografia" quanto "Historia" e "Geografia", e colocaríamos estas duas últimas na primeira?
Sobre a minha edição em que adicionei as supercategorias, até onde vi não temos opção a não ser adicionar tanto as categorias quanto as supercategorias para poder exibir (de forma automática) tudo o que se enquadra em determinadas supercategorias. (Este aspecto da categorização é mencionado brevemente na seção Wikilivros:Nomenclaturas#Nos índices dos livros)
Não percebi a pergunta. Mesmo assim, o que se passa na classificação CDD é que existe a classe «História e geografia» que está subdividida em «História e geografia» (mesma designação), «Geografia e viagens», «Biografia, genealogia e insígnias», «História do mundo antigo até ca. 499», ...., «História de outras áreas».
A utilização de qualquer sistema de classificação e, ainda pior, de mais do que um, não é compatível com a disposição de que o índice deve conter todas as categorias (tanto a mestra como as especialidades) para facilitar o acesso a informação por parte de quem procura, mas o que a regra diz é: «O índice, geralmente, deve conter todas as categorias (tanto a mestra como as especialidades) para facilitar o acesso a informação por parte de quem procura.»
Se bem entendi, o livro sobre «Cadeias neurais» aparece listado três vezes: 1) na categoria «Medicina»; 2) na subcategoria de Medicina «Neurologia»; e 3) na sub-subcategoria de Medicina e subcategoria de Neurologia «Cadeias neurais».
Daí a indicação de nove categorias (três por cada sistema de classificação), em vez de três (uma para cada esquema de classificação), para o livro Hemingway. Um bom exemplo do que referi acima: «A utilização de qualquer sistema de classificação e, ainda pior, de mais do que um, não é compatível com a disposição de que o índice deve conter todas as categorias (tanto a mestra como as especialidades)».
Parece-me ter percebido um pouco melhor o dilema presente. Como sempre, não se pode ter tudo. Tem que se optar. Parece que o que vai ter que ser sacrificado, como já é previsto na regra, é que o índice contenha sempre todas as categorias (tanto a mestra como as especialidades). Se ele não pode conter sempre, não sei se não seria de evitar que umas vezes contivesse, outras não. Uma decisão sobre esta matéria facilita a sequência a dar a esta questão.
Será isto que está a causar a maior dificuldade?
Atenciosamente,
Virgílio A. P. Machado
Já depois de ter escrito a mensagem anterior, fiquei a pensar se o problema não seria outro e daí o interesse nos códigos numéricos. É claro que a automação da inclusão dos livros na «Biblioteca» é uma questão mais complexa que a classificação dos livros. Começo a perceber a ideia. Aí o problema fica muito parecido com a arrumação os livros nas prateleiras: há que os arrumar na «Biblioteca». Se assim for, é claro que a codificação numérica resolve. Todas as observações que fiz, anteriormente, diziam respeito ao texto que vai aparecer na caixa de «Categorias» do página do índice dos livros e nas páginas do domínio «Categoria». Acho que estamos entendidos e agradeço a paciência aqui com o «principiante» nos Wikilivros.
O que aparece agora na caixa de «Categorias» do página do índice dos livros está muito feio. Aquelas «novas» categorias não podiam ficar escondidas?
Atenciosamente,
Virgílio A. P. Machado
Já ocultei as principais categorias "organizacionais" (que não são usadas para indicar diretamente o tema dos livros). Se encontrarem outras que se devem ficar ocultas, podemos repetir o procedimento...
Acham que devemos ocultar também as categorias cujos nomes contém os códigos numéricos específicos de cada esquema de classificação? Eu acho que podem/devem ser mantidas, pois é uma informação a mais que os motores de buscas podem levar em consideração quando alguém faz uma pesquisa sobre determinado tema (vide discussões antigas entre o Jorge e eu, sobre SEO), e acho que não chegam a prejudicar visualmente a página, pois imagino que os livros não aparecerão em muito mais do que 5 categorias.
Este comboio dos dois pontos está a por-me nervoso... Muito bem, acho que assim a apresentação fica muito melhor. Quanto aos códigos (ver Hemingway), mantenho tudo o que disse acima. Se já consta na categoria escondida o código CDD correcto (920 - não confirmei), então o que se deve ver na caixa de categorias do índice é «Biografias da literatura». Não será essa descrição mais útil para quem faz uma pesquisa, do que CDD 900?
Atenciosamente,
Virgílio A. P. Machado
É impressão minha ou a LOC desapareceu da lista onde estão a CDU e CDD? Pode não ser boa ideia, dada a quantidade de livros publicados com essa classificação.
Visto no livro Hemingway: «Categorias: Livros na etapa 8 de 8». Esta categoria não pertence ao conjunto das que seria melhor ocultar?
Atenciosamente,
Virgílio A. P. Machado
Eu não lembrei de avisar, mas havia renomeado a Classificação da Biblioteca do Congresso de "LOC" para "CBC" para ficar consistente com as outras siglas (CDD e CDU), que abreviam o nome em Português. Helder 20h58min de 11 de Maio de 2010 (UTC)
E quanto ao exemplo do Hemingway, que se encaixa em CDD 920, note que ele é inserido na CDD 900 (pois toda área com "CDD 9**" é subárea da CDD 900). O comportamento atual pode ser modificado facilmente conforme as categorias "CDD *00" ficarem muito cheias, sem que seja preciso atualizar os índices dos livros (a conversão de 920 para 900 é feita pela predefinição).
Ah... Como temos um empate quanto a exibir ou esconder as categorias do tipo "CDD ***", "CDU ***", "CBC ***" nos índices dos livros, este ponto precisará de novas opiniões... (mas enquanto isso, o sistema já está funcionando e insere os livros nas seções adequadas da biblioteca, estando as categorias ocultas ou visíveis...)
OK. Entendido. Quem é o «empata» que quer aquelas categorias feionas à vista? Onde está essa discussão? Quais são os argumentos? É o Hélder? É o que está referido na mensagem de 11 de Abril, acima? Vou fazer-lhe uma oferta que não pode recusar para mudar de opinião. :-)
Atenciosamente,
Virgílio A. P. Machado
Era aquela mensagem sim... Mas não tenho nada muito convincente em favor de nenhuma das duas opções... (ocultando CDDs, CDUs, etc.. fica mais bonitinho, e exibindo "pode ser" que os buscadores encontrem mais facilmente as páginas do projeto...). Então sou neutro quanto a isso, preferia outras opiniões para ver se achava algum motivo forte para escolher uma das duas alternativas.
Tá desempatado. É tirar os códigos e substituir pelos textos o que vai aparecer na caixa de «Categorias» do página do índice dos livros e nas páginas do domínio «Categoria». Repetindo: «(ver Hemingway) Se já consta na categoria escondida o código CDD correcto (920 - não confirmei), então o que se deve ver na caixa de categorias do índice é «Biografias da literatura». Não será essa descrição mais útil para quem faz uma pesquisa, do que CDD 900?»
Atenciosamente,
Virgílio A. P. Machado