Data Lake
Na Tail CDP, suas bases de dados serão inseridas em um repositório com alta capacidade de processamento, apto a receber arquivos de fontes e estruturas distintas que poderão ser mesclados, segmentados, enriquecidos, analisados e disponibilizados em outras ferramentas e plataformas.
Para saber mais sobre os conceitos envolvidos no tratamento de dados via CDP, confira os conteúdos introdutórios ao tema em CDP (Módulo 1), da Tail Academy.
Configuração de Datastore
Para começar a popular a CDP com os dados que deseja trabalhar, acesse a sessão Data Lake no menu lateral esquerdo e, em seguida, crie um datastore para armazená-los.
Caso seja a primeira vez que esse processo é realizado em sua conta CDP, selecione "Criar meu primeiro datastore".
Agora, se já houver datastore criado em sua conta, apenas selecione "Criar novo datastore".
ETAPA 1
- Dê nome ao seu datastore;
- Selecione a origem* de sua base: Upload de arquivo (dados podem ser manipulados) ou BigQuery externa (apenas leitura);
- Determine o tamanho de sua base entre: Smalldata (até 1GB; permite consultas avançadas online) ou Bigdata (tamanho ilimitado; só permite consultas avançadas via pipelines).
Neste processo, serão disponibilizadas as opções de ingestão de dados por meio de upload de arquivo e BigQuery, o que significa que plataformas com registros possíveis de serem exportados em formato CSV/XLS ou que tenham conexão com BigQuery, podem ter seus dados disponibilizados na Tail CDP. Estes são os casos de, por exemplo, RD Station, AWS, Salesforce, Google Analytics, platafomas de mídia, DMPs terceiras, etc.
Tail DMP - Se a origem dos seus dados for a Tail DMP, confira o processo de Integração via token e comunique a seu contato de atendimento na Tail.
Veja exemplos de dados que podem ser disponibilizados na CDP via conexão com a Tail DMP:
- Dados de campanhas monitoradas;
- Audiências customizadas de propriedades online;
- CRM onboard enriquecido com dados comportamentais Tail.
A sincronização desses dados vindos da Tail DMP acontecem uma vez ao dia.
Todo o processo de configuração consiste em 8 etapas, que estarão visíveis no cabeçalho da CDP na criação de seu datastore. Estas etapas podem ser categorizadas nos seguintes pilares:
- Origem e composição da base que será disponibilizada;
- Base legal relacionada aos dados em questão;
- Anonimização de dados pessoais;
- Incremento de informações à base via dados Tail ou data providers.
Indicamos que, para seguir com a configuração, verifique se já possui as informações necessárias para as definições citadas acima. Além disso, na primeira etapa será utilizada uma amostra da base em caso de upload de arquivo, portanto, providencie previamente um arquivo de formato CSV, XLS ou XLSX com estrutura de colunas correspondente à base original, em tamanho de até 25Mb.
Você poderá acompanhar seu avanço por meio das etapas que aparecerão no cabeçalho da CDP ao longo da configuração de seu datastore:
ETAPA 2 - Upload de arquivo
Selecionar um arquivo de amostra da base que respeite a estrutura de colunas e seus valores, com tamanho de até 25 Mb.
- Em seguida, indique qual o tipo de arquivo selecionado (CSV/ XLS), a existência de cabeçalho (Sim/Não) e, no caso de arquivo CSV, qual o separador utilizado no arquivo.
ETAPA 3 - Upload de arquivo
- Analise se está correta a inferência feita pelo algoritmo sobre qual o tipo de dado correspondente às informações encontradas em cada coluna do arquivo. Esse passo é extremamente importante para que as funções executadas futuramente por meio da CDP sejam bem sucedidas. Para editar o tipo de dado encontrado na coluna, basta selecionar o lápis azul ao lado de cada título de cabeçalho da base, que será exibido da seguinte forma na plataforma:
ETAPA 4 - Upload de arquivo
- Indicar se há, no arquivo, coluna com informações que identifiquem, de forma individualizada, quem é o usuário/cliente na base. Exemplo: CPF, e-mail, ID de cadastro, hash, etc. Se sim, selecionar a coluna correspondente como chave primária.
- Caso o arquivo não possua dados de identificação, opte por Gerar uma chave primária. Desta forma, chaves únicas de identificação serão geradas e passarão a corresponder aos registros na base.
ETAPA 5 - Upload de arquivo
- Selecione qual das bases legais, correspondentes à Lei Geral de Proteção de Dados (LGPD), serve de apoio ao armazenamento e tratamento dos dados contidos na base pela sua empresa.
Consulte o departamento jurídico e profissionais responsáveis por boas práticas de compliance à LGPD em sua empresa, para se assegurar da melhor opção a cada caso.
ETAPA 6 - Upload de arquivo
- Na Tail CDP, é possível optar por anonimizar alguns dados na origem, ou seja: deixar algumas informações anônimas antes mesmo de serem disponibilizadas no datastore. Isso pode ser feito em colunas específicas a serem indicadas nesta etapa, como por exemplo: coluna com nomes nos clientes. Basta selecionar as colunas que contém informações que deseja anonimizar e passar à próxima etapa.
ETAPA 7 - Upload de arquivo
- Enriquecimento: este processo consiste em agregar dados Tail e/ou de providers parceiros à sua base, a partir de uma chave de associação - tipo de dado existente na base que servirá de referência para matching com os dados de enriquecimento -, visando ampliar o conhecimento sobre os usuários de forma qualitativa e possibilitando novas funções de segmentação e combinação dos datastores.
Se deseja realizar a etapa de enriquecimento de dados na CDP durante a criação de seu datastore,
confira o passo a passo aqui.
Para seguir com a criação de seu datastore e realizar a etapa de enriquecimento para outro momento, basta clicar em "Próximo" no final da página.
ETAPA 8 - Upload de arquivo
- Para concluir a configuração de seu datastore, selecione GRAVAR.
SFTP - Identificando a pasta de destino da base no datastore criado
- Retorne à sessão de Data Lake no menu lateral esquerdo de sua CDP e selecione Info no menu do datastore criado;
- Dentre as informações disponíveis sobre o datastore, haverá o Diretório, a sequência informada neste campo será o nome da pasta de destino para envio da base via SFTP (protocolo seguro de transferência de arquivos. Exemplo: Filezilla) para este datastore.
Caso ainda não tenha realizado a conexão SFTP com a Tail, veja como realizar esse processo.
- Na interface do SFTP que utilizar, abra o gerenciador de sites e, dentro dos endereços remotos, na pasta dataReceptor, busque a pasta que irá utilizar para transferência a este datastore (cujo nome é o mesmo do diretório).
Alem da base, precisamos receber o arquivo .md5 que é gerado a partir da mesma.
ETAPAS PARA ENVIO DE DADOS VIA BIGQUERY
Ainda não tem sua conta BigQuery conectada à Tail CDP? Conclua esta etapa antes de continuar.
Neste processo de datastore via BigQuery, há 5 etapas que serão seguidas e estarão visíveis no cabeçalho da CDP, por onde você poderá acompanhar seu avanço na configuração. Lembre-se que o datastore criado por essa origem não permite manipulação de dados, apenas leitura.
ETAPA 2 - BigQuery
- Selecione a tabela que deseja dentre as que a conta cadastrada tem acesso;
ETAPA 3 - BigQuery
- Visualização de colunas e tipos de informação do arquivo;
ETAPA 4 - BigQuery
- Selecione qual das bases legais, correspondentes à Lei Geral de Proteção de Dados (LGPD), serve de apoio ao armazenamento e tratamento dos dados contidos na base pela sua empresa.
Consulte o departamento jurídico e profissionais responsáveis por boas práticas de compliance à LGPD em sua empresa, para se assegurar da melhor opção a cada caso.
ETAPA 5 - BigQuery
- Para concluir a configuração de seu datastore, selecione GRAVAR.
Qualquer dúvida no processo, entre em contato conosco! Envie um email para: academy@tail.digital