Enriqueça suas conversas com IA utilizando informações de documentos, sites e vídeos
Retrieval Augmented Generation (RAG) é uma tecnologia de ponta que aprimora as capacidades conversacionais dos chatbots incorporando contexto de diversas fontes. Funciona recuperando informações relevantes de uma ampla gama de fontes, como documentos locais e remotos, conteúdo web e até fontes multimídia como vídeos do YouTube. O texto recuperado é então combinado com um template RAG predefinido e prefixado ao prompt do usuário, fornecendo uma resposta mais informada e contextualmente relevante.
Uma das principais vantagens do RAG é sua capacidade de acessar e integrar informações de uma variedade de fontes, tornando-o uma solução ideal para cenários conversacionais complexos. Por exemplo, quando um usuário faz uma pergunta relacionada a um documento ou página web específica, o RAG pode recuperar e incorporar as informações relevantes dessa fonte na resposta do chat.
Para utilizar documentos locais com RAG, primeiro é necessário fazer o upload deles através da seção Documentos da área de Workspace. Uma vez carregados, você pode acessá-los usando o símbolo # antes de uma consulta.
Você também pode carregar documentos diretamente no workspace iniciando um prompt com #, seguido por uma URL. Isso pode ajudar a incorporar conteúdo da web diretamente em suas conversas.
Para integração de conteúdo web, inicie uma consulta em um chat com #, seguido pela URL alvo. Clique na URL formatada na caixa que aparece acima da caixa de chat. Uma vez selecionado, um ícone de documento aparece acima de "Enviar uma mensagem", indicando que a recuperação foi bem-sucedida. A Deepze busca e analisa informações da URL, se possível.
Suponha que você queira fazer perguntas sobre um artigo específico:
Personalize o template RAG a partir do Painel de Administração > Configurações > menu Documentos.
Altere o modelo de embedding RAG diretamente no Painel de Administração > Configurações > menu Documentos. Este recurso suporta modelos Ollama e OpenAI, permitindo que você aprimore o processamento de documentos de acordo com seus requisitos.
O sub-recurso de busca híbrida alternável para nosso recurso de embedding RAG aprimora a funcionalidade RAG via BM25, com reclassificação alimentada por CrossEncoder e limiares de pontuação de relevância configuráveis. Isso fornece uma experiência RAG mais precisa e personalizada para seu caso de uso específico.
O recurso RAG permite que os usuários rastreiem facilmente o contexto dos documentos alimentados aos LLMs com citações adicionadas para pontos de referência. Isso garante transparência e responsabilidade no uso de fontes externas dentro de seus chats.
O pipeline RAG dedicado para resumir vídeos do YouTube via URLs de vídeo permite interação suave com transcrições de vídeo diretamente. Este recurso inovador permite que você incorpore conteúdo de vídeo em seus chats, enriquecendo ainda mais sua experiência de conversa.