O Hyper Cloud conecta assistentes de IA a múltiplos canais e às suas plataformas de BI — Qlik e Power BI — com um núcleo canônico de orquestração, agnóstico de canal e de provedor.
Mensagens entram por qualquer canal, passam por um núcleo canônico de orquestração, são processadas pelo provedor de IA e fundamentadas nos seus dados de BI.
Web Chat, WhatsApp Cloud e Microsoft Teams. Cada usuário fala com o assistente no app que já usa.
WebWhatsAppTeamsO AssistantRunner decide a rota, aplica quotas, mantém sessões e minimiza o consumo de tokens com cache de prompt.
Provedores intercambiáveis por licença — Claude, OpenAI, Gemini e Oracle OCI — geram a resposta e orquestram as ferramentas.
ClaudeOpenAIGeminiOCIConectores MCP para Qlik Cloud e Power BI / Fabric — a IA consulta os dados reais e fundamenta cada resposta.
QlikPower BIMCPO caminho é sempre o mesmo: Canal → AssistantRunner → Provider de IA → BI. O núcleo é agnóstico de canal e de provedor; o BI (Qlik / Power BI) é acessado pelo provedor de IA via MCP, não diretamente.
O mesmo assistente, com recursos nativos de cada plataforma.
Chat embutido no portal com gráficos interativos ApexCharts: pivot, filtros, paletas, metas, tendência e refino por IA — uma experiência BI completa dentro da conversa.
Gráficos BIÁudio→textoSalvar visãoWebhook oficial com listas interativas nativas para troca de assistente, gráficos renderizados como imagem, notas de voz transcritas e onboarding por link.
Listas nativasGráfico→imagemJanela 24hBot Framework com identidade AAD confiável, Adaptive Cards para menus e um diálogo stage-view que abre gráficos exploráveis dentro do Teams.
AADAdaptive CardsSem janela 24hProvedores intercambiáveis por licença, conectados ao BI via Model Context Protocol (MCP).
Cada licença escolhe o provedor e o modelo. O mesmo endpoint serve /claude, /openai, /gemini e /oci; o núcleo aplica retry com backoff.
Apps, dimensões, medidas e Insight Advisor expostos como tools — a IA consulta os dados reais por app.
Consultas DAX via executeQueries, com fallback XMLA para introspecção de esquema e auto-resolução de workspace.
No núcleo, cada token conta. A arquitetura é desenhada para reduzir o consumo — e, com isso, o custo — sem perder qualidade na resposta.
O system prompt e o esquema dos dados (tabelas, medidas) são cacheados e reaproveitados nos turnos seguintes — em vez de reenviados a cada pergunta.
*ilustrativo — varia conforme o tamanho do esquema e do histórico
System prompt + esquema marcados com cache_control nos orquestradores Qlik e Power BI — não reenviados a cada turno.
Toda chamada registra input, output, cache read e cache write — nada fica fora do controle de consumo, por cliente e provedor.
Máximo de tokens por requisição, limite diário de requisições e teto mensal de tokens — definidos por cliente.
Histórico limitado, datasets em formato colunar compacto com cap de linhas — menos tokens por resposta.
Simule a economia gerada pelo cache de prompt no seu cenário. Todos os campos são editáveis — os preços são aproximados e variam por provedor, modelo e contrato.
Ajuste os valores conforme o seu cenário. Estimativa ilustrativa, não é cotação.
Premissa: ~85% do input (system prompt + esquema) é reaproveitado via cache (leitura de cache ≈ 10% do preço do input). Considera apenas tokens de entrada — a maior fonte de custo recorrente. Estimativa ilustrativa, não é cotação.
A IA emite blocos chart/dataset que viram gráficos interativos no web/Teams e imagens no WhatsApp.
Áudios são transcritos (Whisper/Gemini) e processados como texto, no WhatsApp e no chat web.
Links self-service de uso único conectam Power BI (OAuth) e Qlik sem sair da conversa.
Limites por tenant e usuário, idempotência, anti-flood single-flight e gates por licença.
Keep-alive contínuo de "digitando…" enquanto a IA pensa, sem lacunas em respostas longas.
Retry com backoff para erros transitórios.
Uma pergunta de negócio respondida com dados e gráfico — exatamente como o usuário final vê.
"Qual foi o faturamento por mês?" — sem saber DAX nem nome de tabela.
O núcleo identifica que é dado, busca o esquema e a IA gera a consulta correta.
Texto explicativo e gráfico no formato ideal de cada canal.
As respostas do chat deixam de ser efêmeras: salve qualquer gráfico no repositório pessoal e tenha uma galeria viva de insights — que sobrevive à conversa.
O gráfico fica no repositório mesmo que o chat seja excluído ou arquivado — acessível a qualquer momento na página Meus Gráficos.
Cada gráfico guarda o contexto da fonte (app Qlik / dataset Power BI). Dá para pedir um refino à IA direto da galeria, que re-executa a consulta sozinha.
Reabra em tela cheia e ajuste tipo, cores, pivot, filtros, meta e tendência — os mesmos controles BI do chat.
Marque favoritos, filtre por fonte/provedor, ordene por recência ou nº de refinos — e veja os tokens gastos em cada gráfico.
Deixe seus dados e nossa equipe entra em contato para uma demonstração do Hyper Cloud.