Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Agrupamento baseado em densidade: diferenças entre revisões
Processamento de Dados Massivos/Projeto e implementação de aplicações Big Data/Agrupamento baseado em densidade (editar)
Revisão das 13h10min de 15 de fevereiro de 2013
, 15 de fevereiro de 2013→Descrição
[edição não verificada] | [edição não verificada] |
Linha 56:
}
Quanto ao armazenamento, a implementação original do ''DBScan'' utiliza a estrutura ''R*-tree'' <ref name="
Linha 120:
Em é apresentado uma implementação paralela do ''DBScan'' com uma abordagem mestre-escravo: enquanto o núcleo mestre realiza a etapa de assimilação de grupos, os escravos respondem a consultas de vizinhança usando a estrutura ''R*-Tree'' para armazenamento.
Em ''P-DBSCAN'' <ref name="pdbscan">[http://bib.dbvis.de/uploadedFiles/17.pdf P-DBScan]
De forma similar ao ''P-DBSCAN'', o ''MR-DBSCAN'', proposto em , é uma implementação distribuída do ''DBScan'' com quatro estágios e que utiliza o paradigma ''Map-reduce'' . A primeira etapa consiste em dividir a base entre os nós de forma balanceada e de forma a deixar os registros mais próximos no mesmo nó. Em seguida, na fase ''map'', o ''DBScan'' é executado de forma independente dentro de cada nó. A terceira etapa é a fase ''reduce'': todos os nós são analisados para descobrir em quais situações o mesmo nó foi agrupado para diferentes grupos, ou seja, é feito um mapeamento da junção e remarcação dos grupos que é realizada na quarta e última etapa. Os resultados mostraram que a escalabilidade e a eficiência dessa abordagem são bastante satisfatórias.
|