Tag: informatica


Comparando Inteligência de Negócios e Integração de Dados por Fornecedores Best-of-Breed


Negócios

Para entender a relevância dos componentes de transformação e carga de extratos (ETL) e como eles se encaixam na inteligência de negócios (BI), primeiro deve apreciar a integração de dados e o significado de ter informações limpas e precisas que permitam decisões comerciais bem-sucedidas. No setor de Business Intelligence, a integração de dados é essencial. Ao capturar a informação certa, eles são capazes de realizar análises, criar relatórios e desenvolver estratégias que os ajudem a não apenas sobreviver, mas, mais importante ainda, para prosperar informatica.

A Informatica, fornecedora líder de software de integração de dados empresariais, define a integração de dados como “o processo de combinação de dois ou mais conjuntos de informações para compartilhamento e análise, de modo a apoiar o gerenciamento de informações em uma empresa”. Em termos de BI, isso significa que a informação é extraída em sua forma original e armazenada em um local interino, onde é transformado no formato que será usado no data warehouse. O processo de transformação inclui a informação de validação (por exemplo, preenchendo informações de código postal nulo no cliente do banco de dados) e os campos de informações de reformatação (por exemplo, separando os campos Nome e Primeiro Nome dos registros de clientes que são mesclados em um banco de dados, mas não em outros). O próximo passo é carregar a informação no data warehouse. Os perfis de processamento analítico (OLAP) e scorecard analisa. Em certo sentido, extrair os dados adequados, transformá-lo pela limpeza e fusão de registros, e carregá-lo no banco de dados de destino, o que permite que as soluções de BI criem ferramentas analíticas com sucesso. É também a essência da funcionalidade ETL.

Componentes de Integração de Dados

Para determinar a solução ETL mais apropriada para eles.

• Identificação. Que informações a organização precisa extrair e de onde ela vem? Qual resultado final, em termos de dados, a organização deseja analisar? Essencialmente, respondendo estas questões e identificando a origem dos dados, e o que é a relação entre as diferentes fontes de informação.

• Extração. Com que frequência a organização exige os dados? É mensal, semanal, diário ou por hora? Onde devem ocorrer as atividades de armazenamento e transformação de informações (ou seja, em um servidor dedicado ou no data warehouse, etc.)? Considerando esses fatores identifica as necessidades de freqüência de dados da organização. Por exemplo, a análise das informações de vendas pode exigir que a organização carregue informações mensalmente ou trimestralmente, enquanto algumas outras transferências de informações podem ser realizadas várias vezes ao dia. Ao determinar a frequência do carregamento e transformação de informações no data warehouse ou no servidor dedicado, a organização também deve considerar a quantidade de informação a ser transferida e seu efeito no desempenho do produto.

• Padronização. Qual é o formato das informações da organização e é compatível com os elementos de dados em outros sistemas? Por exemplo, se o cliente quiser analisar a informação e os serviços do cliente, deve saber se o cliente está identificado da mesma maneira em ambos os locais (por exemplo, por identificação do cliente [ID], número de telefone, ou primeiro e último nome). Isso é crucial para garantir que os dados sejam anexados ao cliente certo através do processo de padronização de dados. Outra questão de padronização de dados que a organização deve lidar é identificar como gerenciará a limpeza de dados e as funções de integridade de dados no data warehouse ao longo do tempo.

• Transformação. A organização deve considerar os requisitos de transformação de dados e a interação entre os componentes de dados transformados. As perguntas críticas são como os dados serão refletidos no novo banco de dados, e como os dados serão mesclados em linha por linha? Responder a estas questões envolve a identificação das regras comerciais e de dados associadas à precisão dos dados em cargas de dados.

• Carregando. Onde os dados serão carregados? Que atividades de monitoramento de dados são necessárias? Outras preocupações de carregamento de dados são identificação de transferência de dados com falha, como as transferências falhadas são tratadas e como ocorrem as atualizações. Por exemplo, cada carga envolverá o recarregamento de todo o conjunto de dados ou a atualização será criada usando apenas campos atualizados nas fontes de dados?

ETL tradicional