PT EN ES

Retrieval Augmented Generation (RAG)

Enriqueça suas conversas com IA utilizando informações de documentos, sites e vídeos

RAG é uma tecnologia que melhora as capacidades conversacionais dos chatbots incorporando contexto de diversas fontes, como documentos, conteúdo web e vídeos do YouTube.

Visão Geral

Retrieval Augmented Generation (RAG) é uma tecnologia de ponta que aprimora as capacidades conversacionais dos chatbots incorporando contexto de diversas fontes. Funciona recuperando informações relevantes de uma ampla gama de fontes, como documentos locais e remotos, conteúdo web e até fontes multimídia como vídeos do YouTube. O texto recuperado é então combinado com um template RAG predefinido e prefixado ao prompt do usuário, fornecendo uma resposta mais informada e contextualmente relevante.

Uma das principais vantagens do RAG é sua capacidade de acessar e integrar informações de uma variedade de fontes, tornando-o uma solução ideal para cenários conversacionais complexos. Por exemplo, quando um usuário faz uma pergunta relacionada a um documento ou página web específica, o RAG pode recuperar e incorporar as informações relevantes dessa fonte na resposta do chat.

Como o RAG funciona
  1. O usuário faz uma pergunta ou fornece um prompt.
  2. O sistema RAG recupera informações relevantes de fontes configuradas.
  3. As informações recuperadas são combinadas com o prompt do usuário.
  4. O modelo de IA gera uma resposta baseada no prompt enriquecido.
  5. A resposta é apresentada ao usuário, muitas vezes com citações das fontes.

Integração de Documentos Locais e Remotos

Para utilizar documentos locais com RAG, primeiro é necessário fazer o upload deles através da seção Documentos da área de Workspace. Uma vez carregados, você pode acessá-los usando o símbolo # antes de uma consulta.

Como usar documentos locais
  1. Acesse a seção Documentos no seu Workspace.
  2. Faça upload dos documentos que deseja utilizar (PDF, DOCX, TXT, etc.).
  3. No chat, inicie sua consulta com # seguido do nome do documento ou uma palavra-chave.
  4. Clique na URL formatada que aparece acima da caixa de chat.
  5. Um ícone de documento aparecerá acima de "Enviar uma mensagem", indicando que a recuperação foi bem-sucedida.
  6. Continue com sua pergunta para obter uma resposta baseada no contexto do documento.
Dica: Você pode carregar vários documentos para o mesmo chat, enriquecendo ainda mais o contexto disponível para o modelo de IA.

Você também pode carregar documentos diretamente no workspace iniciando um prompt com #, seguido por uma URL. Isso pode ajudar a incorporar conteúdo da web diretamente em suas conversas.

Busca na Web para RAG

Para integração de conteúdo web, inicie uma consulta em um chat com #, seguido pela URL alvo. Clique na URL formatada na caixa que aparece acima da caixa de chat. Uma vez selecionado, um ícone de documento aparece acima de "Enviar uma mensagem", indicando que a recuperação foi bem-sucedida. A Deepze busca e analisa informações da URL, se possível.

Páginas web frequentemente contêm informações supérfluas, como navegação e rodapé. Para melhores resultados, vincule a uma versão bruta ou amigável para leitura da página.
Exemplo de uso de RAG com conteúdo web

Suponha que você queira fazer perguntas sobre um artigo específico:

  1. Digite # seguido da URL do artigo (ex: #https://exemplo.com/artigo)
  2. Selecione a URL formatada que aparece
  3. Faça sua pergunta específica sobre o conteúdo do artigo
  4. O modelo responderá com base no conteúdo extraído da página

Personalização do RAG

Personalização de Template

Personalize o template RAG a partir do Painel de Administração > Configurações > menu Documentos.

Suporte a Embeddings

Altere o modelo de embedding RAG diretamente no Painel de Administração > Configurações > menu Documentos. Este recurso suporta modelos Ollama e OpenAI, permitindo que você aprimore o processamento de documentos de acordo com seus requisitos.

Pipeline RAG Aprimorado

O sub-recurso de busca híbrida alternável para nosso recurso de embedding RAG aprimora a funcionalidade RAG via BM25, com reclassificação alimentada por CrossEncoder e limiares de pontuação de relevância configuráveis. Isso fornece uma experiência RAG mais precisa e personalizada para seu caso de uso específico.

Citações no Recurso RAG

O recurso RAG permite que os usuários rastreiem facilmente o contexto dos documentos alimentados aos LLMs com citações adicionadas para pontos de referência. Isso garante transparência e responsabilidade no uso de fontes externas dentro de seus chats.

Integração com YouTube

O pipeline RAG dedicado para resumir vídeos do YouTube via URLs de vídeo permite interação suave com transcrições de vídeo diretamente. Este recurso inovador permite que você incorpore conteúdo de vídeo em seus chats, enriquecendo ainda mais sua experiência de conversa.

Como usar a integração com YouTube
  1. No chat, digite # seguido da URL do vídeo do YouTube (ex: #https://youtube.com/watch?v=exemplo)
  2. Selecione a URL formatada que aparece
  3. A Deepze extrairá a transcrição do vídeo e a utilizará como contexto
  4. Faça perguntas específicas sobre o conteúdo do vídeo
Este recurso é particularmente útil para vídeos educacionais, palestras, tutoriais e qualquer conteúdo com informações valiosas que você deseja consultar.