Giter Site home page Giter Site logo

lab-azure-search's Introduction

Azure Cognitive Search: Utilizando AI Search para indexação e consulta de Dados

Documentação criada para exemplificar como utilizar blobs storage e fazer a busca através de frases-chaves para trabalhar com análises textuais e Machine Learning.

Important

Num navegador web, navegue até Portal Azure para explorar todas as opções.

💡 Na página https://learn.microsoft.com/pt-br/azure/search/search-features-list você consegue obter mais informações sobre como usar todos os recursos da IA do Azure Search.

📣 O nome mudou: O Azure Cognitive Search agora é o IA do Azure Search.

Seguindo esses passos você consegue testar a busca e fazer análises textuais:

Recursos do Azure necessários A solução que você criará para o Fourth Coffee requer os seguintes recursos na sua assinatura do Azure:
  • Um recurso do Azure AI Search, que gerenciará a indexação e a consulta.

  • Um recurso de serviços de IA do Azure , que fornece serviços de IA para habilidades que sua solução de pesquisa pode usar para enriquecer os dados na fonte de dados com insights gerados por IA.

  • Uma conta de armazenamento com contêineres de blobs, que armazenará documentos brutos e outras coleções de tabelas, objetos ou arquivos.

Crie um recurso do Azure AI Search
  1. Entre no portal do Azure.

  2. Clique no botão + Criar um recurso , pesquise Azure AI Search e crie um recurso Azure AI Search com as seguintes configurações:

  • Assinatura: sua assinatura do Azure
  • Grupo de recursos: selecione ou crie um grupo de recursos com um nome exclusivo
  • Nome do serviço: um nome exclusivo
  • Localização: Escolha qualquer região disponível
  • Nível de preços: Básico
  1. Selecione Review + create e depois de ver a resposta Validation Success, selecione Create.

  2. Após a conclusão da implantação, selecione Ir para o recurso . Na página de visão geral do Azure AI Search, você pode adicionar índices, importar dados e pesquisar índices criados.

Crie um recurso de serviços de IA do Azure
  1. Você precisará provisionar um recurso de serviços de IA do Azure que esteja no mesmo local que seu recurso do Azure AI Search. Sua solução de pesquisa usará esse recurso para enriquecer os dados no armazenamento de dados com insights gerados por IA.

  2. Retorne à página inicial do portal do Azure. Clique no botão +Criar um recurso e pesquise os serviços de IA do Azure. Selecione criar um plano de serviços de IA do Azure. Você será levado a uma página para criar um recurso de serviços de IA do Azure. Configure-o com as seguintes configurações:

  • Assinatura: sua assinatura do Azure
  • Grupo de recursos: O mesmo grupo de recursos que seu recurso do Azure AI Search
  • Região: o mesmo local do recurso do Azure AI Search
  • Nome: Um nome exclusivo
  • Nível de preços: Padrão S0
  • Ao marcar esta caixa, confirmo que li e compreendi todos os termos abaixo: Selecionado
  1. Selecione Revisar + criar. Depois de ver a resposta Validation Passed, selecione Create.

  2. Aguarde a conclusão da implantação e visualize os detalhes da implantação.

Crie uma conta de armazenamento
  1. Retorne à página inicial do portal do Azure e selecione o botão + Criar um recurso .

  2. Procure conta de armazenamento e crie um recurso de conta de armazenamento com as seguintes configurações:

  • Assinatura: sua assinatura do Azure
  • Grupo de recursos: O mesmo grupo de recursos que os recursos do Azure AI Search e dos serviços Azure AI
  • Nome da conta de armazenamento: um nome exclusivo
  • Localização: Escolha qualquer localização disponível Padrão de desempenho
  • Redundância: armazenamento localmente redundante (LRS)
  1. Clique em Revisar e em Criar. Aguarde a conclusão da implantação e vá para o recurso implantado.

  2. Na conta de Armazenamento do Azure que você criou, no painel de menu esquerdo, selecione Configuração (em Configurações).

  3. Altere a configuração de Permitir acesso anônimo de Blob para Habilitado e selecione Salvar.

Carregar documentos para o armazenamento do Azure
  1. No painel do menu esquerdo, selecione Containers.

  2. Selecione + Contêiner . Um painel do seu lado direito é aberto.

image

  1. Insira as seguintes configurações e clique em Criar:
  • Nome: Coffee-Reviews
  • Nível de acesso público: Container (acesso de leitura anônimo para containers e blobs)
  • Avançado: sem alterações
  1. Em uma nova guia do navegador, baixe as avaliações de café compactadas em https://aka.ms/mslearn-coffee-reviewse extraia os arquivos para a pasta de avaliações.

  2. No portal do Azure, selecione o contêiner de avaliações de café. No contêiner, selecione Carregar.

  3. No painel Carregar blob, selecione Selecionar um arquivo.

  4. Na janela do Explorer, selecione todos os arquivos na pasta de avaliações, selecione Abrir e, em seguida, selecione Carregar.

image

  1. Depois que o upload for concluído, você poderá fechar o painel Upload blob. Seus documentos estão agora em seu contêiner de armazenamento de avaliações de café.
Indexar os documentos

Depois de armazenar os documentos, você poderá usar o Azure AI Search para extrair insights dos documentos. O portal do Azure fornece um assistente de importação de dados. Com este assistente, você pode criar automaticamente um índice e um indexador para fontes de dados suportadas. Você usará o assistente para criar um índice e importar seus documentos de pesquisa do armazenamento para o índice do Azure AI Search.

  1. No portal do Azure, navegue até o recurso do Azure AI Search. Na página Visão geral, selecione Importar dados.

  2. Na página Conectar-se aos seus dados, na lista Fonte de Dados, selecione Azure Blob Storage. Preencha os detalhes do armazenamento de dados com os seguintes valores:

  • Fonte de dados: Armazenamento de Blobs do Azure
  • Nome da fonte de dados: coffee-customer-data
  • Dados a extrair: Conteúdo e metadados
  • Modo de análise: Padrão
  • Cadeia de conexão: Selecione Escolha uma conexão existente
  1. Selecione sua conta de armazenamento, selecione o contêiner e clique em Selecionar:
  • Autenticação de identidade gerenciada: Nenhuma
  • Nome do contêiner: esta configuração é preenchida automaticamente depois que você escolhe uma conexão existente
  • Pasta Blob: deixe em branco
  • Descrição: Avaliações sobre Fourth Coffee Shops
  • Selecione Próximo: Adicionar habilidades cognitivas (opcional)
  1. Na secção Anexar Serviços Cognitivos, selecione o seu recurso de serviços Azure AI.

  2. Na seção Adicionar enriquecimentos:

  • Altere o nome da qualificação para coffee-skillset
  • Marque a caixa de seleção Habilitar OCR e mesclar todo o texto no campo merged_content
  • Certifique-se de que o campo Dados de origem esteja configurado como merged_content
  • Altere o nível de granularidade de enriquecimento para Páginas (blocos de 5.000 caracteres)
  • Não selecione Habilitar enriquecimento incremental
  1. Selecione os seguintes campos enriquecidos:

Captura de tela de 2024-02-24 20-31-31

  1. Em Salvar enriquecimentos em um armazenamento de conhecimento, selecione:
  • Projeções de imagem
  • Documentos
  • Páginas
  • Frases chave
  • Entidades
  • Detalhes da imagem
  • Referências de imagem
  1. Selecione projeções de blob do Azure: Documento. Uma configuração para o nome do contêiner com as exibições preenchidas automaticamente do contêiner de armazenamento de conhecimento. Não altere o nome do contêiner.

  2. Selecione Próximo: Personalizar índice de destino. Altere o nome do índice para o que achar melhor com -index no final.

  3. Certifique-se de que a chave esteja configurada como metadata_storage_path. Deixe o nome do sugeridor em branco e o modo de pesquisa preenchido automaticamente.

  4. Revise as configurações padrão dos campos de índice. Selecione filtrável para todos os campos que já estão selecionados por padrão.

image

  1. Selecione Próximo: Criar um indexador.

  2. Altere o nome do indexador para nome-indexer.

  3. Deixe a programação definida como Once.

  4. Expanda as opções avançadas. Certifique-se de que a opção Base-64 Encode Keys esteja selecionada, pois as chaves de codificação podem tornar o índice mais eficiente.

  5. Selecione Enviar para criar a fonte de dados, o conjunto de habilidades, o índice e o indexador. O indexador é executado automaticamente e executa o pipeline de indexação, que:

  • Extrai os campos de metadados do documento e o conteúdo da fonte de dados.
  • Executa o conjunto de habilidades cognitivas para gerar campos mais enriquecidos.
  • Mapeia os campos extraídos para o índice.
  1. Volte à página de recursos do Azure AI Search. No painel esquerdo, em Gerenciamento de pesquisa, selecione Indexadores. Selecione o indexador recém-criado. Espere um minuto e selecione ↻ Atualize até que o Status indique sucesso.

  2. Selecione o nome do indexador para ver mais detalhes.

image

Consultar o índice Use o Search Explorer para escrever e testar consultas. O explorador de pesquisa é uma ferramenta incorporada no portal do Azure que oferece uma maneira fácil de validar a qualidade do seu índice de pesquisa. Você pode usar o Search Explorer para escrever consultas e revisar resultados em JSON.
  1. Na página Visão geral do serviço de pesquisa , selecione Explorador de pesquisa na parte superior da tela.

  2. Observe como o índice selecionado é o índice de café que você criou. Abaixo do índice selecionado, altere a visualização para JSON view.

    image

  3. No campo do editor de consultas JSON, copie e cole:

       {
         "search": "*",
         "count": true
       }
    
  4. Selecione Pesquisar. A consulta de pesquisa retorna todos os documentos no índice de pesquisa, incluindo uma contagem de todos os documentos no campo @odata.count. O índice de pesquisa deve retornar um documento JSON contendo os resultados da pesquisa.

  5. Agora vamos filtrar por localização. No campo do editor de consultas JSON, copie e cole:

      {
        "search": "locations:'Chicago'",
        "count": true
      }
    
  6. Selecione Pesquisar. A consulta pesquisa todos os documentos no índice e filtra revisões com localização em Chicago. Você deveria ver 3no @odata.count campo.

  7. Agora vamos filtrar por sentimento. No campo do editor de consultas JSON , copie e cole:

      {
        "search": "sentiment:'negative'",
        "count": true
      }
    
  8. Selecione Pesquisar. A consulta pesquisa todos os documentos no índice e filtra revisões com sentimento negativo. Você deveria ver 1no @odata.count campo.

Um dos problemas que podemos querer resolver é por que pode haver certas avaliações. Vamos dar uma olhada nas frases-chave associadas à avaliação negativa. O que você acha que pode ser a causa da revisão?

Revise o armazenamento de conhecimento

Vamos ver o poder do armazenamento de conhecimento em ação. Ao executar o assistente Importar dados, você também criou um armazenamento de conhecimento. Dentro do armazenamento de conhecimento, você encontrará os dados enriquecidos extraídos pelas habilidades de IA que persistem na forma de projeções e tabelas.

  1. No portal do Azure, navegue de volta para a sua conta de armazenamento do Azure.

  2. No painel do menu esquerdo, selecione Containers. Selecione o contêiner de armazenamento de conhecimento.

    image

  3. Selecione qualquer um dos itens e clique no arquivo objectprojection.json.

  4. Selecione Editar para ver o JSON produzido para um dos documentos do seu armazenamento de dados do Azure.

  5. Selecione a localização atual do blob de armazenamento no canto superior esquerdo da tela para retornar à conta de armazenamento Containers.

  6. Em Containers, selecione o contêiner nome-skillset-image-projection. Selecione qualquer um dos itens.

image

  1. Selecione qualquer um dos arquivos jpg. Selecione Editar para ver a imagem armazenada no documento. Observe como todas as imagens dos documentos são armazenadas desta forma.

  2. Selecione a localização atual do blob de armazenamento no canto superior esquerdo da tela para retornar à conta de armazenamento Containers.

  3. Selecione Navegador de armazenamento no painel esquerdo e selecione Tabelas. Há uma tabela para cada entidade no índice. Selecione a tabela nomeSkillsetKeyPhrases.

lab-azure-search's People

Contributors

dani-peixoto avatar

Stargazers

 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.