#
002 infra
**
4 de dez. de 2025
#
Wagner / Fernando / Leonardo (Planejamento área de Dados)
Convidados Fernando Neto Leonardo Luiz Wagner Jorge work@marpont.es Marcello Pontes
Anexos Wagner / Fernando / Leonardo (Planejamento área de Dados)
Registros da reunião Transcrição
#
Resumo
Fernando Neto e Wagner Jorge discutiram os desafios na organização e governança de dados, destacando o aumento exponencial de custos no BigQuery (BQ) devido ao crescimento do volume de dados e queries ineficientes, e o desafio de gerenciar o acesso frequente a datasets e projetos. Marcello Pontes, que recebeu acesso de viewer na Google Cloud Platform (GCP) por Fernando Neto, propôs analisar os problemas para sugerir caminhos, focando em uma arquitetura de dados ideal (Bronze, Silver e Gold) e na construção da confiança nos dados através de um escopo restrito (como o FPD). Wagner Jorge detalhou o avanço no Dataplex usando LLMs para catalogar dados e o uso intensivo de IA em 70% do seu fluxo de trabalho, enquanto Fernando Neto enfatizou a necessidade de segregar o consumo de IA por usuário e solicitou uma projeção de custos de dados para o próximo ano a Wagner Jorge para ser repassada à Tainá.
#
Detalhes
Tamanho das anotações: Padrão
Desafios e Reestruturação de Dados Fernando Neto e Wagner Jorge identificaram um desafio na organização e preparo de dados para consumo externo, como a criação de dashboards. O crescimento no volume de dados está gerando um aumento exponencial de custos, e o cenário ideal envolve a reestruturação para enxugar o uso e tornar os custos mais lineares. Fernando Neto enfatizou a governança de dados, acesso e compartilhamento, enquanto Wagner Jorge foca mais na organização e arquitetura ([00:01:35)).
Acesso e Custos de Dados Um dos principais desafios é a frequência de pedidos de acesso a projetos e datasets no BigQuery (BQ). Fernando Neto também destacou a preocupação com o aumento dos gastos com dados e a necessidade de planejar a projeção de custos para o próximo ano. Wagner Jorge, por sua vez, descreveu a situação como uma "casa para ter goteira" e Fernando Neto comparou seu trabalho a "apagar fogo" ([00:01:35)).
Contexto e Histórico de Marcello Pontes Marcello Pontes mencionou que já havia discutido os desafios com a equipe de dados (Wagner Jorge, Léo e Bruno) e recebeu uma perspectiva de macro-negócio da OM de Bruno. Ele compartilhou sua experiência, morando na Eslovênia e trabalhando remotamente desde 2013, e que trabalhou em infraestrutura por um ano e meio antes de retornar à área de dados, combinando paixão por dados e infraestrutura ([00:02:57)).
Análise e Acesso Inicial de Marcello Pontes Marcello Pontes expressou a intenção de analisar as dores e problemas para sugerir caminhos, buscando não ser influenciado pelas visões existentes, mas propor alternativas ([00:04:59)). Fernando Neto concedeu a Marcello Pontes acesso de viewer na Google Cloud Platform (GCP). Wagner Jorge indicou que o acesso será necessário principalmente para buckets de storage, BigQuery e Dataplex ([00:06:09)).
Iniciativas na Arquitetura de Dados Wagner Jorge mencionou que fez um avanço significativo no Dataplex usando um LLM para catalogar todos os dados, o que representa um passo para a frente ([00:06:09)). Ele também solicitou que Marcello Pontes fosse incluído nas agendas de discussão de arquitetura com o Google, que está desenvolvendo uma proposta após a apresentação das dores da empresa ([00:07:16)).
Problemas com Metadados e Limpeza de Dados Wagner Jorge relatou que a proposta inicial do Google para inferência de metadados era muito genérica e cara, o que os levou a desenvolver essa parte internamente usando a API do Chat GPT para descrever colunas e preencher informações com base no conhecimento do projeto ([00:08:26)). Eles discutiram que grande parte do custo pode ser solucionada limpando dados, como visões (views) temporárias ou não utilizadas por um ano. Marcello Pontes sugeriu a criação de uma política para que os dados legados caduquem ou sejam movidos para cold storage ([00:09:52)).
Desafios com a Ferramenta Looker Studio (antigo Metabase) Fernando Neto apresentou que o custo mensal no BQ é substancial ([00:13:36)), e Wagner Jorge apontou que as queries mal escritas, muitas vezes com excessivas camadas de views (view dentro de view), geram relatórios caros ([00:12:06)). A migração de Cobrança para o Looker Studio, sob a orientação de uma nova Analytics engineering, visa evitar que a equipe crie coisas desnecessárias e utilize queries mais eficientes, já que as LLMs criam queries "verborrágicas" devido à falta de versatilidade da equipe em SQL ([00:15:46)).
Uso e Governança do Metabase Wagner Jorge descreveu que a imagem do Metabase é antiga e difícil de atualizar, e que a política inicial de acesso para o Metabase era full para todos os usuários, dando a eles poder quase total e permitindo SQL injection. Fernando Neto adicionou que as queries no Metabase são expostas na URL ([00:22:00)) ([00:24:31)). A liberdade total concedida historicamente no Metabase levou os usuários a preferirem essa ferramenta, mesmo que ela não implemente políticas de segurança de dados como restrição de acesso a informações sensíveis (como telefone), o que força o uso de dados não tratados ([00:25:48)).
Modelo de Arquitetura de Dados Ideal Marcello Pontes e Fernando Neto alinharam o entendimento de que a arquitetura ideal de dados (o Data Warehouse) deve seguir o modelo Bronze, Silver e Gold (ou Raw, Staging e Prontos para Consumo), em que os dados para consumo devem ser validados e governados ([00:27:09)). Marcello Pontes sugeriu que uma ferramenta de catálogo como o Dataplex, que Wagner Jorge está implementando, serviria como um "DBA comunitário" para socializar o conhecimento ([00:18:17)).
Gestão de Acesso e Segregação de Dados A falta de perfis de acesso restritos hoje impede o gerenciamento adequado, resultando em acesso a todas as camadas de dados (Bronze, Silver e Gold) ([00:29:50)). Isso leva os usuários a criarem coisas novas fora do pipeline de dados já transformados ([00:31:11)). A gestão do acesso é crucial para o Row Level Security (RLS) e a proteção de dados pessoais (PII), pois diferentes áreas (como Crédito e Cobrança) precisam de diferentes níveis de acesso a informações, como telefone do usuário ([00:29:50)).
Conscientização e Conhecimento dos Dados Fernando Neto e Wagner Jorge enfatizaram a falta de conscientização e conhecimento sobre a importância dos dados dentro da empresa ([00:32:18)). Wagner Jorge sugeriu a realização de sessões de Stack Talks para instruir a equipe sobre novos padrões de dados e governança, e descontinuar os antigos de forma clara ([00:33:27)). Marcello Pontes propôs uma abordagem focada em um escopo restrito e a automatização da transição para o legado, para garantir que as novas práticas sejam implementadas e aprimoradas antes de se expandir ([00:34:29)).
Uso de Inteligência Artificial para Desenvolvimento Wagner Jorge revelou que está direcionando 70% de seu fluxo de trabalho para LLMs (como o Cloud Code e API do Chat GPT), principalmente para tarefas massantes, como a criação de templates e validação de números ([00:36:50)). Ele usou LLMs para comparar código em SQL com código em Polars/Python para validar números entre equipes de Crédito, conseguindo ajustes em 5 minutos ([00:38:15)). Fernando Neto comentou sobre a nova infraestrutura que ele está montando para habilitar modelos de IA (Vertex AI com Sonet e Gemini 3) para a equipe, incluindo o time de dados ([00:39:35)) ([00:42:46)).
Custo e Gestão de IA Marcello Pontes levantou uma preocupação sobre o custo de usar Cloud Code via API Key, que se mostrou muito mais caro do que assinaturas Enterprise ou o uso de ferramentas com limite de uso, como o Cursor. Fernando Neto confirmou que o gasto com dados é o maior custo, mas precisa de maneiras de segregar o consumo de IA por usuário para monitoramento ([00:40:44)) ([00:42:46)).
Gargalo de Confiabilidade dos Dados Wagner Jorge identificou que a "confiança nos números" é a maior montanha a ser superada. Ele explicou que a área de Crédito possui números consolidados, e o resto da empresa tende a seguir esses números. No entanto, há grandes divergências de valores entre áreas, como Cobrança e Crédito (ex: R$ 5 milhões) ([00:44:57)). A solução de mapear todas as 700 tabelas para determinar quais são confiáveis é complexa ([00:46:27)).
Construindo a Confiança nos Dados Marcello Pontes sugeriu uma abordagem estratégica para atingir a confiança dos dados, trabalhando em microatividades técnicas que se juntam para alcançar o objetivo estratégico ([00:48:54)). A sugestão é começar com um corte vertical em uma área, como o First Payment Default (FPD), para validar os números. Wagner Jorge concordou, descrevendo seu trabalho em criar books de variáveis para convergência de números, como a fonte de verdade para contratos, e quer automatizar essa validação ([00:50:11)).
Projeção de Custos para o Próximo Ano Fernando Neto solicitou a Wagner Jorge uma projeção de uso de dados para o próximo ano, incluindo o melhor e o pior caso, para passar à Tainá ([00:53:20)). Fernando Neto e Wagner Jorge concordaram que o foco deve ser no gasto estratégico e não em gastar o budget simplesmente por tê-lo ([00:54:12)).
#
Próximas etapas sugeridas
Fernando Neto vai disponibilizar e incluir Marcello Pontes nas agendas com a Google sobre arquitetura.
Fernando Neto e Wagner Jorge vão disponibilizar o acesso ao Google Cloud Console para Marcello Pontes e conceder acesso aos projetos necessários para que ele possa verificar a infraestrutura, os dados e a utilização dos usuários.
Wagner Jorge vai fazer uma projeção de uso de dados para o próximo ano para Fernando Neto.
#
Transcription
**
4 de dez. de 2025
#
Wagner / Fernando / Leonardo (Planejamento área de Dados) - Transcrição
#
00:00:00
Marcello Pontes: Tôi.
Fernando Neto: Então é bom rebobinando, né? A gente tem um problema de problema não, mas um desafio no lado dos dados que até hoje da maneira como a gente fez não me foi uma maneira tipo atender problemas de de modo que eles da medida que eles foram aparecendo, né? Então a gente tem dados, espços de projetos diferentes, organização dos dados, aí o o Wagner pode falar melhor também, mas e como é que a gente usa e prepara esses dados para consumo externo, né? Seja lá o pessoal que vai montar dashboard, etc. Então a gente tem uma uma série de desafios. A maneira como a gente compartilha os dados também entre a nas pessoas aqui da da que da empresa, né? Então a gente tem muito, muito pedido de, ah, preciso de acesso a tal projeto, melhor tal dataset em tal projeto lá no BQU, né? Esse é um dos desafios. Os o outro desafio é a quantidade de grana que a gente tá gastando com esses caras aí, né? Então, inclusive, era uma uma coisa que eu queria falar com o Wagner, que é o planejamento do ano que vem. Eh, eu não sei se você acompanha, Wagner, mas o crescimento do dos dados em si em termos de preço, né? Quanto que a gente consome no mês a mês, porque a gente não que a gente precisa capar o negócio, a gente trabalhar a projeção pro ano que vem de quanto que a gente vai gastar de dados, né?
#
00:01:35
Fernando Neto: Obviamente o o cenário ideal seria um um a reestruturação dessa coisa aí a tempo da gente enxugar e conseguir deixar a coisa mais linear e não tão parece tá meio exponencial o uso de dados nossos que a gente tem lá hoje, né? Então acho que o desafios, os desafios maiores são esse aí em termos de arquitetura, esse como organizar dados, acho mais do lado do Wagner, ele que manja, né? Do meu lado aqui é mais a maneira que eu penso muito é é governança dessas coisas, acesso, quem tem acesso, quem pode ter acesso, eh como que a gente compartilha esses dados com times internos da empresa, né, que vão montar dashboard, etc. E e e como é que a gente faz gestão nesses dados de maneira geral, por mais que o Wagner toque toda a área de de dados aí, ele o Léo, né? Esses caras também vivem ocupado ali, pessoal pingando o tempo todo lá e fica mais preocupado em é, pensa mais em na mineração das coisas para mostrar pros outros em si do que cuidar dos dados em si, sabe?
Wagner Jorge: Pensa numa casa para ter goteira.
Fernando Neto: Eu eu vejo isso pelo menos olhando o dia a dia, porque essa é a realidade minha do lado de infra, né? Eu fico mais apagando o fogo do que resolvendo problemas de maneira mais efetiva, né?
#
00:02:57
Fernando Neto: Então eu acho que isso é uma verdade pro Wagner também. Ele ele me ele me corrige depois. Mas é basicamente esses desafios aqui do meu lado, tá? Do do do lado do Wagner aí tem outros desafios também.
Marcello Pontes: Entendi.
Fernando Neto: Então,
Marcello Pontes: Ah, eu tenho tenho ouvido. A gente teve um papo eh anteriormente, eu, o Wagner, o Léo e o Bruno, um pouco mostrando quais são os desafios. Eh, recentemente a gente teve um papo também com Del e Bruno. Hoje eu conversei com o Bruno também, que ele me apresentou uma perspectiva um pouco mais macronegócio e e de direcionamento, né, da da onde a a OM tá indo.
Fernando Neto: Sim. Угу.
Marcello Pontes: Ah, só para dar um passo atrás também e eh corrigir não, mas colocar alguns pontos aí sobre o que o Wagner falou. Humildemente eu fui deles, mas eu tava trabalhando lado a lado com esses caras aí que são feras e eu tava só tentando complementar um pouco do do trabalho brilhante que eles já fazem. Eh, e aí eh só para dar um pouco mais de contexto também, conhecer um pouco mais de mim, eu eu moro na Eslovênia desde moro não não tô no Brasil, moro na Eslovênia desde 2013 e aí eu trabalho
#
00:04:07
Fernando Neto: Que legal. Bacana.
Marcello Pontes: remoto desde então, né? Quer dizer, tava trabalhando remoto desde então, até que em 2021, no final 2021 eh apliquei para trabalhar num empresa daqui, não como engenheiro, né? E aí eu fui trabalhar na área de infra.
Fernando Neto: Sim, sim, sim.
Marcello Pontes: Coincidência ou não tô na tô na mesma área aí. Eh, na verdade trabalhei um ano e meio na área de infra, eh, diversos tipos de tecnologias. E aí, eh, mais recentemente, eu voltei a trabalhar com área de dados e tal. Então eu eu costumo falar que eu sou um cara apaixonado por dados, mas com um pezão e infra que eu gosto muito também.
Fernando Neto: Ah, mas isso que é bom, bicho. É, o cara já é rodado já.
Marcello Pontes: Apaixonante.
Fernando Neto: Isso que é bom. Já levou pancada de tudo com telado. Tá bom demais.
Marcello Pontes: É, mas eu escutei, eu escutei também, viu?
Fernando Neto: Legal, cara.
Marcello Pontes: Eu escutei falar do Fernando também, que é um cara que é o pica aí da infraestrutura aí, que tem que tem que boa.
#
00:04:59
Fernando Neto: É, eu não sei. Eu eu corro da pica, velho.
Marcello Pontes: É lá ele, né?
Fernando Neto: Mais ou menos isso aqui, viu?
Marcello Pontes: Lá ele, né? Como o pessoal fala, né?
Fernando Neto: É.
Marcello Pontes: Eh, então, eh, eh, o meu, o meu intuito mais agora conhecendo um pouco assim, eu conheço, lógico, tô chegando de cima, né? Tô vendo o a visão top down ali, tô analisando um pouco de de todas as dores que eu tenho escutado até agora, mas em algum momento eh é lógico que eu vou analisar meu, vou procurar analisar quais são
Fernando Neto: Sim.
Marcello Pontes: os problemas, quais são as dores e sugerir ali alguns caminhos eh eh tentar tentar não me viciar tanto com com a visão que vocês já t de como resolver, mas tentar além disso também propor alternativas para essa visão.
Fernando Neto: Bom demais.
Marcello Pontes: E aí, eh, Fernanda, em algum momento eu vou, eu até tava até falando com o Wagner ontem, eu recebi o validei lá o o acesso ao Google Cloud Consult, eh, mas eu vou precisar dar alguma olhada. Não sei em que nível tu consegue me disponibilizar aí para poder ver eh o que que tem, o que que tem disponível, como é que o pessoal tá usando, tal.
#
00:06:09
Fernando Neto: É, tem não.
Marcello Pontes: E assim, nível de infraestrutura, nível de dados, nível de usuário, as bases de dados e e as injeções de dados que tem desenvolvidos aí.
Fernando Neto: Bacana. Ô, na hora que a gente tava conversando aqui, eu já tava colocando seu user lá na GCP, tá? Como viewer, tá, ô Wagner? Mas aí agora pelo menos a entidade dele, você consegue dar acesso aos projetos que você precisa colocar lá e enfim, que precisar de essa, você me avisa.
Wagner Jorge: Uhum. Beleza. Beleza. Eu acho que o que vai ser necessário é isso. Buckets eh, storage, né?
Fernando Neto: Ja.
Wagner Jorge: Storage, big query, catálogo, né? Dataplex. Aí, inclusive fiz um avanço massa no Dataplex sem ajuda do Google. Eu eu fiz um LLM lá na Tora e cataloguei os dados todinhos da gente.
Fernando Neto: O ja.
Wagner Jorge: E aí, Léo, tá colocando lá, já é um passo pra gente avançar, mas enfim, eu acho que Dataplex, isso, acho que o Metabase já vem junto com o nosso login, né?
Fernando Neto: Eu acredito que eu não sei como é que esse isso aí é um fala a verdade nem sei onde essa p**** vive aí.
#
00:07:16
Wagner Jorge: Né? Isso aí é um buraco sem fundo, né, velho?
Fernando Neto: Tá. Tá.
Wagner Jorge: o tal do metabas. E é isso.
Fernando Neto: Não, legal.
Wagner Jorge: E Lucas que já vai est gente dentro da Steck. É isso. E aí Marcelo vai cutucando e vai vendo aí do ponto de vista de infra o que é que ele vai precisando.
Fernando Neto: Não, legal.
Wagner Jorge: E aí vai levantando a mão e vão a gente não, resumindo, a gente não faz muita doideira, não.
Marcello Pontes: Tá do ponto dividido.
Fernando Neto: É, vai pingando o o acesso que a gente tem melhor, o relacionamento que que Infra tem com dados aqui é bem é bem mais tranquilo em relação ao resto da empresa. A gente é não não, a gente a ideia é é que é uma questão de mentalidade mesmo, né?
Wagner Jorge: Vamos comportar.
Fernando Neto: A gente tá em pegadas diferente aí dentro da empresa, então, mas com com dados aqui não tem zica nenhuma. E o que vocês precisarem, vocês me falando o aí, ô Wagner, assim, assim que for aparecendo problema do resorço específico que você tá tentando acessar, você me avisa, eu vou lá tentando, tá?
Marcello Pontes: Obrigada,
Wagner Jorge: Humum. Tá bom. Outro ponto, Fernando, eh inclui ele lá naquelas agendas lá com a Google sobre arquitetura.
#
00:08:26
Wagner Jorge: Só para te dar contexto, Marcelo, a gente tá discutindo com a Google e eles ficaram de fazer uma proposta pra gente de arquitetura. A gente apresentou as dores e tudo mais.
Marcello Pontes: Entendi. M. Ja.
Wagner Jorge: Eles fizeram a parte de de marketing inicialmente, né, vendendo produtos e tudo mais, mas pouca coisa ali, eh, tem muita coisa que nos interessou e tem outras coisas que não. Eu posso te mostrar no detalhe eh algumas coisas. Tem muita coisa de linhagem construída com grafos e tudo mais. Tem algumas coisas de inferência de de metadados, só que a parte de inferência de metadados tava muito genérica. Eu fiz um testezinho em uma tabelinha muito genérica e muito cara.
Marcello Pontes: Entendi.
Wagner Jorge: E aí essa parte de metadatados, pelo menos a parte de descrição de colunas e etc e tal, eu fiz por fora.
Marcello Pontes: M. Угуm.
Wagner Jorge: Aqui coloquei dentro da PI do do chat GPT que a gente paga e fui terando em cima e ficou eh como ele pega o conhecimento da da companhia do projeto, pronto, aí ele preencheu muito bem. Aí essa parte aí a gente vai pular, mas a parte de grafo tem coisas interessantes. Seria bom tu dar uma olhada sobre relacionamentos que tu vai perceber assim que tu vê o BQ é que tem um mundarel de dados, tá ligado?
#
00:09:52
Wagner Jorge: E assim tem um monte de coisa que é pura reinvenção da roda por 50 pessoas diferentes. Um monte de views que tipo assim, o cara fez agora para testar um negócio e vai morrer amanhã. Aí o cara deixou para lá. E aí assim, tem um monte de coisa que é que é basicamente limar, tem um monte de coisa dos nossos custos que é facilmente eh solucionável, que é só limar, tipo assim, passa um thrash lá, o que não
Marcello Pontes: muito portável.
Wagner Jorge: usa no de um ano para trás, beleza?
Fernando Neto: É, acho que a gente consegue pegar isso via via via via logs, né?
Wagner Jorge: Vai legado e acabou. Ninguém vai mexer mais nisso. Pronto.
Fernando Neto: Tipo, a gente consegue fazer um audit na na no na na B. Legal.
Wagner Jorge: Não é muito tranquilo, muito tranquilo. Dá para fazer na API do Big Query facilmente. Eu fiz isso aqui com, sei lá, 5 a 10 minutos. O big query traz tudo.
Fernando Neto: É, então Ja.
Marcello Pontes: Inclusive, inclusive mais do que mais do que fazer um one off desse aí, seria bom também em algum momento, não no primeiro, imagino, mas eh estabelecer Vai ser uma política, né, uma pollice, né, de caducar esse tipo de
#
00:10:45
Wagner Jorge: Com LLM é bom demais.
Marcello Pontes: coisa, ó.
Wagner Jorge: Uhum.
Marcello Pontes: E e tipo, ó, gente, estejam avisado, vai fazer um negócio lá, o negócio vai deletar, sei lá, vai pro code storage em tanto tempo e depois de tanto tempo vai se possível, né?
Fernando Neto: Ja.
Wagner Jorge: Sim. E aí assim, essa parte que de custos, eh, que Fernando trouxe, tá muito associado ao Luger. E assim, como muita gente tá habituado ao metabase e aí tu melhor do que eu sabe o funcionamento do metabas, a galera se acostumou muito a ser SKL light like, tá ligado? E aí quando tu vai pro ler que eu não tinha usado, eu comecei a usar essa semana, é um inferno.
Marcello Pontes: M.
Wagner Jorge: Por exemplo, tu quer, tu tem um dashboard lá e tu tem um template para ele ficar bonitinho e tal. Tu não quer o dado, tu só quer só o template. Se tu duplicar aquele dash e dropar os dados, ele continua apontando pro antigo. Então fica lento para caramba, tu tem que criar do zero.
Marcello Pontes: Uhum. É o é o Lucers que vocês usam.
Wagner Jorge: E a galera é Luca Stúio.
Marcello Pontes: Era um antigo Google Data Studio, uma coisa desse negócio do Google Data, era uma coisa dessa do Google.
#
00:12:06
Wagner Jorge: E aí às vezes é é exato.
Marcello Pontes: Depois compraram louco, virou isso aí. Beleza.
Wagner Jorge: Mas aí tu tá voltando muito no tempo. Aí eu era menino ainda. E e aí tem muito relatório que é muito caro, mas ele é caro por quê?
Fernando Neto: Parece não.
Marcello Pontes: bar
Wagner Jorge: Caro pur e simplesmente porque são queres mal escritas, viu mal escrita. Eh, às vezes tu tem um inception brutal de views. Tu tem lá view dentro de view dentro de view dentro de view que vai descendo. Aí quando tu vai rodar uma, sai chamando todo mundo de uma vez.
Marcello Pontes: E essa e essas vias o pessoal cria pelo pelo Bque.
Wagner Jorge: Então é meio que boa prática aí é que tá. Antigamente tinha acesso geral generalizado para o bigquer de escrita. Hoje a política Fernando tá aí sabe melhor. Hoje a política tá bem restrita.
Marcello Pontes: Legal.
Wagner Jorge: 90% 95% das pessoas só tem acesso de leitura e não de escrita mais todos os assim essa parte de disponibilização de acesso no BQ tá na minha mão e na mão de Léo.
Fernando Neto: Ja.
Marcello Pontes: س
Wagner Jorge: E aí a gente não para absolutamente quase ninguém, exceto o time de dados especificamente ou algum alguém que que de fato precisa desse acesso pra escrita.
#
00:13:36
Wagner Jorge: No mais ninguém tem acesso.
Fernando Neto: Ó, eu só tô mostrando aqui para vocês, só para vocês terem uma ideia aqui da de como é que anda as coisas, né?
Marcello Pontes: Да.
Wagner Jorge: Nossa senhora.
Fernando Neto: Então, você vê aí, né?
Wagner Jorge: 500k vai mais.
Fernando Neto: É, o negócio é é que é esses números brutais assim, mas enfim, vamos lá. Isso aqui é o acumulado dos três meses, né?
Marcello Pontes: Угу.
Fernando Neto: Mas aí que você vê aqui, ó, esse é basicamente o projeto do do de dados, né?
Wagner Jorge: Uhum.
Fernando Neto: Não. Aí é é exatamente.
Wagner Jorge: É, são seis, né? Só que a gente centralizou tudo num só lugar e a gente tá matando os outros poranição.
Fernando Neto: E essa aqui é a produção em si, onde tem toda a comput lá que a gente usa data plataforma também, né? Acho que tá na tá no mesmo saco. Aí a gente se ferra bastante com logs aqui, cara. É, não, não, nem tô no no na parte dos logs em si. Deixa eu mostrar aqui. Mas logs é dados também aqui na empresa, só que ninguém usa para nada, tá?
Marcello Pontes: Угуm.
Fernando Neto: Aqui é na na org nova que eu tô montando, vai direto pro Big Quer, tá?
#
00:14:42
Fernando Neto: Então lá é dado, tratado como dado. Então aqui você vê que os campeões aqui, né? O BQU no talo ali, ele consome bastante, né? Tipo 35% ali do do custo mensal e ele vem aumentando, né? Você vê aqui é que aqui eu a justamente aqui ô Marcel, a gente veio até aqui e a gente acabou de fazer um contrato novo com a com a com a Google, então tá mostrando daqui para cá só, tá? Mas isso aqui já representa bem, vem sempre uma crescentezinha, já vinha vindo, né? Então você vê aqui tem 83 aqui. É, tava menos aqui. Olha que coisa interessante. Aqui tem alguém que comeu mais aqui, ó. Foi o big, foi o a comput, mas enfim. Esse aqui a gente tem mantido um olho nele porque ele de fato ele vem aumentando. Só que acho que o o Wagner tá fazendo um trampo por por detás dos panos. Aí já tá melhorando, né?
Wagner Jorge: Eh, vamos começar a matar um monte de coisa aí.
Fernando Neto: É.
Wagner Jorge: Na verdade, Marcelo, eh, fizeram até uma figurinha do Léo lá com AI, né?
Fernando Neto: É, é.
Wagner Jorge: Ex terminador de querer lá, lá já tem limado um monte de coisa.
#
00:15:46
Fernando Neto: Não tem. É, quem mais mata a gente hoje nas queres aí, cara, é as automáticas lá do do meta metabase, né?
Wagner Jorge: Porque se
Fernando Neto: Todo mundo fala: "Ah, vou matar o metabas metabas." Mas na sequência, não sei o que que falou semana passada, velho, que tava usando o ler para apontar pro metabase. Eu falei, "Não tem negócio mais meta do que isso, cara".
Marcello Pontes: Oh.
Wagner Jorge: eh em movimento a gente já tá movimentando. Por exemplo, cobrança. Cobrança tá migrando. Entrou um Analytics engineering agora, Marcelo e Fernando. E ela já tá, é, ela vai começar a migrar tudo para metabase.
Fernando Neto: É a Jéssica para o metas.
Wagner Jorge: E aí assim, o brief foi cara, o que tem ô para o Looker, para o Big Query Looker, não sair do metabase.
Fernando Neto: M.
Wagner Jorge: Então, qual é a ideia? Eh, não trazer nada que não que não vai precisar mais. eh, e olhar paraa frente e ir matando, porque eu acho que cobrança é um dos lugares que mais pesa, por a turma não é versada em SQL e a LLM vai fazer o trabalho. Só que algumas versões são extremamente verborrágicas, então são queres absurdamente eh ineficientes.
#
00:17:11
Wagner Jorge: Mas assim, eu tenho minha expectativa é que isso vai funcionar. E aí com a chegada no Marcelo começa a desenhar essas coisas. E uma das coisas que eu fiz questão de de gastar uma energia, pô, passei meu domingo à noite fazendo isso, foi começar a catalogar esses dados, porque ninguém sabe o que tem. Então, o que é que o cara faz? Se eu não conheço, não existe.
Marcello Pontes: E tu tem que atar para onde vagão?
Wagner Jorge: E aí eu crio. A gente tá usando tudo dentro da stack da Google, então vai tá tudo no dataplex.
Marcello Pontes: Uhum.
Wagner Jorge: E aí, Fernando, eu queria até ver um plano contigo, porque hoje o dataplex tá habilitado para mim, para o Léo exclusivamente, mas o ideal é de que isso seja disseminado paraa companhia, para que as pessoas busquem os campos
Fernando Neto: Ja. Tá.
Wagner Jorge: e não fiquem criando coisas novas.
Fernando Neto: O que que é o Não conheço esse cara aí não, mas depois eu vejo também.
Wagner Jorge: Só que a gente tem outro desafio, o data, o dataplex é ele substituiu o data catalogue, né? É recente agora.
Fernando Neto: Sim, sim.
Wagner Jorge: Ele vai pegar todos os todas as informações do bigquery e vai fazer um catálogo, né?
#
00:18:17
Wagner Jorge: Eh, as descrições do campo, etc. e tal, só que ele é searchable. Então, sei lá, eu quero uma informação de recência, frequência e valor monetário.
Fernando Neto: Ah, entendi.
Wagner Jorge: Pô, do tá lá no campo, ele vai trazer todas as tabelas e views que tem a informação sobre IRFM. Por que que isso é importante? para porque, por exemplo, eu tô falando de capacidade de pagamento no crédito, na cobrança eu tenho outro indicador, mas o cálculo é o mesmo. E a galera tá criando duas tabelas para fazerem o mesmo indicador. E se o cara faz a busca desse campo, ele vai saber que existe é uma tabela menos a ser criada, entendeu?
Fernando Neto: Sim, é como se fosse o DBA no meio do caminho, né?
Marcello Pontes: Oh. É uma boa prática, uma boa prática é a gente ter uma uma ferramenta dessa
Fernando Neto: Antigamente o o serviço do DBA você ia criar, ah, não, criou uma tabela para mim. O DBA fala: "Opa, calma aí, irmão. Que que você vai querer armazenar?" Ele saia procurando tabela existente e encaixava lá.
Wagner Jorge: Uhum.
Fernando Neto: É basicamente isso.
Marcello Pontes: de catálogo que sirva como, digamos, um DBA distribuí, um DBA comunitário, né, em que todo mundo que é dono de algum dado eh eh responda por aquilo ou tira dúvida e e tem uma ferramenta dessa para poder socializar
#
00:19:25
Wagner Jorge: M.
Marcello Pontes: o conhecimento de como usar também, porque não é só ter o dado tem que catalogar, mas tem algumas formas de usar determinados dados, né?
Fernando Neto: S.
Marcello Pontes: Uma pergunta, gente, eh, pelo que ouv a as conversas, eh, tem a gente tem o Metabase, que pelo jeito é a ferramenta mais amada pelos usuários, mas nem tanto pela gestão.
Fernando Neto: e olha.
Marcello Pontes: Por quê? Eh, porque eu entendo que tem uma uma um distanciamento entre o o metabase, por exemplo, e governança não só dos usuários, que foi melhorada agora com com a a introdução de uma identidade mais restritiva, mas também pela questão de tá plugado direto no big query, né? O que eu entendo é que se a gente começa a atacar o problema das fontes de dados e catalogar e fazer essa forma comunitária de todo mundo saber de uma maneira, sei lá, userfly de onde estão os dados, como é que usa, a gente resolve uma boa parte do problema. E a ferramenta, o que a gente vai precisar se preocupar com a ferramenta é essa questão de governança, né, de da gente eh plugar as identidades direitinho, quem que usa o que como é que pode usar cada identidade,
Wagner Jorge: Угуm.
#
00:20:43
Marcello Pontes: seja em row level security, seja com permissão de acesso, leitura escrita, que eu acho que essa ferramenta nem deveria ter escrito também, né? Eh, mas aí a ferramenta torna-se um pouco menos relevante no papel da solução desse mês, né, dessa desse eh labirinto de dados, digamos assim.
Wagner Jorge: Угу.
Marcello Pontes: Eh, a orientação então é é pela faceout do metabase em favor do Luca. Eh, qual a orientação? É, lógico que eu vou dar um passo atrás e tentar analisar e e olhar isso aí, mas como é que é essa situação hoje?
Wagner Jorge: Cara, vê, tem algumas questões relacionadas ao metabase e sobre a estratégia da empresa. Qual é a ideia? é que no nosso antigo VIP, ele dizia: "A gente quer ganhar dinheiro e ir paraa praia". Esse era o esse era o mote. E qual é a pegada? A gente até recomendou, pô, vamos usar de catalog o datahub, porque o datahub eu considero bem melhor do que o dataplex, né?
Marcello Pontes: M.
Wagner Jorge: Aí ele fez, mas quem vai cuidar do datahub? Quem vai ser o babá, a babá dessa criança? Ah, eu, poxa, é verdade, faz sentido.
#
00:22:00
Wagner Jorge: A gente não vai querer ficar cuidando disso. Se der pau, quem é que vai resolver? E aí, qual é a ideia do a questão do metabas? Pô, os cara e aí assim, eu tô olhando pra frente, mas é só para dar contexto, tá?
Marcello Pontes: Claro, claro.
Wagner Jorge: E aí não tô fazendo juízo de valor, só são fatos. A gente subiu o o metabase lá atrás e esse bicho ficou, a imagem dele tá parada no tempo em 2000, lá vai bolinha. Ninguém consegue atualizar. Quando tentou atualizar essa imagem, quebrou tudo. Foi onde Deus nos acuda. Ninguém vai, ninguém quer mexer nessa criança, tá? Tipo, começa por aí. Eh, segundo quando a gente fez metabas Uhum.
Fernando Neto: Só não sei se você falou isso, desculpa aí, Wagnão, só para para para inserir. O uso de ferramentas externas é bem-vindo também. Então, coisas que estão lá de alguma coisa que serviços fantásticos que vão ajudar também, a gente absorve. O que a gente quer exato, a gente quer inclusive se livrar de infra que a gente não precisa manter, né?
Wagner Jorge: É, né? É.
Fernando Neto: Eh, eh, otimizar porque o time é pequeno, etc, etc.
#
00:23:10
Fernando Neto: A gente quer eh soluções que saiam da frente do caminho da da empresa no geral, né? Então, só só fazer essa inserção aí.
Wagner Jorge: É, preferivelmente assim, a gente prefere pagar a open source porque open source a gente vai ter que tomar conta e a gente tendo um um contrato, deu pau, alguém vai lá resolver essa bronca aí, porque o time o
Fernando Neto: Exato.
Marcello Pontes: S. Perfeito.
Fernando Neto: Você chama exato.
Wagner Jorge: time é pequeno e não é estratégia da empresa crescer time vertigenosamente.
Marcello Pontes: Faz sentido. Eh, em vez de você ter que manter uma infraestrutura, faz todo entendo isso aí.
Wagner Jorge: Uhum.
Fernando Neto: За
Wagner Jorge: Aí, qual é a outra questão do metabas? É simples, cara. Vamos usar o BQ, só que, pô, eu tenho um monte de problema para resolver. Eu não vou conseguir resolver acessos de fulaninho, de tal que tá no time XPTO para dar acesso a ele a uma tabela ou a um projeto ou o que quer que seja. Então eu vou criar aqui o metabase. Todo mundo tem acesso full, divirtam-se.
Fernando Neto: Ja.
Wagner Jorge: E aí, qual o problema disso tudo? é que os usuários têm poder quase que total em cima do metabase.
#
00:24:31
Wagner Jorge: Como ele é SKL like, aí tu pode fazer SKL Injection, tu pode fazer o que tu quiser.
Fernando Neto: A URL dele, cara, você sa ver, tem tem chamada da URL dele lá que tem a querer eh criptografada com B64.
Wagner Jorge: E aí? Aí é pronto.
Fernando Neto: Então você tem lá o getzão do negócio com RL, com aquela RH no meio do caminho. Você pega a RH, manda o BAS adequada e aí tá lá o SKLzão lindo, maravilhoso, né?
Marcello Pontes: Isso. E deve e deve ter até e deve ter até uma um over over overload de configuração, porque o header normalmente não comporta um OS
Wagner Jorge: Língua nó. Essa essa é nova.
Fernando Neto: É, né? Deixa cada coisa, enfim, você ainda vai se espantar.
Wagner Jorge: Aí a questão do do metabase, tá, Marcelo Luc e qualquer ferramenta é tipo assim, eu gosto de sempre dizer, usar como lema.
Fernando Neto: Isso não é nada.
Wagner Jorge: Eh, tu não vai ver um pedreiro brigando se se uma pá é melhor do que a colher de pedreiro. Ele quer resolver o problema dele aqui. Direcionar, ele vai usar e pronto, acabou.
Marcello Pontes: pedreiro Briga pela pela pelo também.
Wagner Jorge: A, é a a questão aqui muito nossa é assim, eh, a liberdade total que a gente deu no passado para o metabase, que fez com que a galera entendesse, cara, pô, eu não vou migrar pro ler
#
00:25:48
Marcello Pontes: Brincar.
Wagner Jorge: se eu preciso de um dado de telefone, se se o cara botou uma camada lá que eu não posso Posso ver telefone e aí eu uso no metabase que eu tenho acesso a tudo lá chego no metabase e uso quando na verdade muitas vezes ele nem precisa de telefone é só porque ele deu um select asterístico lá e trouxe tudo que tinha dentro, entendeu?
Marcello Pontes: Так.
Wagner Jorge: É só questão de de boa prática.
Fernando Neto: Perguntinha de leve no meio do caminho, só para só para ver, porque eu eu também não tenho a experiência de dados em si, né?
Wagner Jorge: E aí manda aí Uhum.
Fernando Neto: Eu já montei pipeline para quem me pediu, mas eu nunca fiz gestão de dados em si, né? Então, na minha cabeça, quando eu estou, tipo, ah, tal, fulano precisa de acesso. Eu não sei como é que vocês estão de horário aí, mas eu acabei de me livrar de de uma reunião aqui, então tá, tá?
Marcello Pontes: Promita tranquilo.
Wagner Jorge: Não, eu tô tranquilo. Tô tranquilo.
Fernando Neto: Então assim, na minha cabeça de infra, olha, então tem lá um buraco cheio de dados preciosos, maravilhosos, que que é da empresa e dos usuários, né?
Wagner Jorge: Uhum.
Fernando Neto: E aí tem o pessoal que quer acessar esses dados para fazer seja lá o quê, né?
#
00:27:09
Wagner Jorge: Угу.
Fernando Neto: Na no mundo ideal, eu posso estar falando besteira e vocês me corrijam aqui. Eu teria algum tipo de, sei lá, algum tipo de segregação, seja num outro projeto onde a gente tem o Big Query lá também. Porém, com dados todo sanitizado, aquilo que o pessoal de dados deu a bênção lá pro negócio, fala assim: "Isso aqui pode ir para lá, isso aqui pode ir para lá e é isso aí que vocês têm para trabalhar." É assim que funciona ou eu tô
Marcello Pontes: Ó, normalmente eh Wagner conhece também isso daí, mas normalmente o que a gente trata assim no a gente tá falando de um datawarehouse, um grande data warehouse, né? O pessoal tem criado nomenclatura nova, tá? Fat, mas assim, é uma data warehouse.
Fernando Neto: É É
Marcello Pontes: E aí, o que que a gente, o que que a gente faz historicamente, tradicionalmente ali, a gente tem o os dados cruz que a gente ingere das fontes, tal, e a gente tem os dados cruz, a gente tem os dados em área staging e os dados que são prontos para consumo. Hoje em dia ou e outras tecnologias renomeiam isso, mas é a mesma coisa. É, é o como é golden medalha, golden silver e e quer dizer eh bronze, silver gold.
#
00:28:15
Fernando Neto: o plátino lá. Hold Да.
Wagner Jorge: Pronto, se vergonha.
Marcello Pontes: Obrigado. Então é isso. O que a gente tem agora no, pelo que eu tô entendendo no no cenário da UMA, é um pouco disso misturado. O pessoal tá tentando colocar ordem, mas em último caso o que a gente vai querer é isso, né? É exatamente essa tua descrição aí, Fernando. Então, o dado que vai tá pronto pro pessoal consumir em algum momento na evolução desse projeto é o dado que tá validado, que tem uma pessoa ou um departamento. Eu prefiro uma pessoa porque departamento você me ocupa, enfim, é responsável eh você ter uma um um departamento responsável departamento Wagner responsável.
Fernando Neto: Sim. O departamento aí, ó.
Marcello Pontes: A a esse departamento, Wagner, ele vai conseguir eh tirar dúvidas sobre aquilo. É isso mesmo.
Wagner Jorge: M. Угу.
Marcello Pontes: Quando de um negócio que tá errado com dado que não tá batendo best de bod, como o pessoal fala, ele vai aqui não tá batendo e aí você consegue tratar em cima disso. É, é, é por aí, sabe? Então tem tem técnica, né?
Fernando Neto: Não, não, legal.
Marcello Pontes: E aí, falando um pouco mais sobre o acesso restrito, eh, eu tô fazendo essas perguntas de ferramenta para que a gente vai é muito para entender filosoficamente qual é o o qual é o o o a situação mental do do pessoal daqui, porque o ideal, cara, o ideal é que a gente desse um metabase pro cara, mas em cima de uma golden area tratada, né, e governada e também em cima de uma goldena que tenha política
#
00:29:50
Marcello Pontes: de acesso, por exemplo, para dado eh PII, né? Personally identifiable information.
Fernando Neto: Tem não.
Wagner Jorge: M.
Marcello Pontes: Eh, no LGPD tem deve ter outro nome em português para isso. Eh, e e assim, política de acesso. Ah, o Wagner é um cientista de dados que vai precisar de algum dado que de repente uma pessoa de cobrança não não deveria ter acesso. E aí a gente tem que tratar um livro de R level security ou level security também.
Wagner Jorge: e disf porque, por exemplo, tu pega um cara lá de crédito, telefone do usuário.
Fernando Neto: Ка.
Wagner Jorge: Para que que o cara de crédito quer telefone? Mas para cobrança faz sentido ele ter.
Marcello Pontes: cobrança já faz sentido. Exatamente.
Wagner Jorge: Então essa gestão precisa ser feita, entendeu? E hoje é o seguinte, eh, a esteira ela vai e volta, porque acontece, como a gente não tem perfis de acesso hoje, o a galera perde acesso o seguinte: "Cara, eu preciso de acesso ao projeto Perdeu Mea, o Big Quer do Perdeu Me Data". E aí tu não consegue gerenciar, tu dá acesso ao perder um datita big query. Então o cara vai ter acesso à camada bronze, silver, gold e tudo que tá fora dela e ainda não foi transformado.
#
00:31:11
Fernando Neto: Ah, bom, só traduzindo o que ele falou.
Wagner Jorge: E aí o que é que o usuário faz? Ele não vai usar gold, ele vai usar o que tá fora da esteira e vai criar uma coisa totalmente nova.
Marcello Pontes: Okay.
Wagner Jorge: Então assim, eh, basicamente, é, exato.
Fernando Neto: Você perguntou do estado mental do pessoal. O pessoal é louco.
Wagner Jorge: Aí, tipo, tu vai ter, por exemplo, eh, Léo fez um levantamento das tabelas pra gente mapear os donos para começar a matar, mas de um dia pro outro surgem 10, 15 tabelas, do dia pro outro surgem mais cinco tabelas, mais um monte de vi. Então assim, eh, idealmente eu acho que o passo, claro, tu vai mexer com arquitetura muito mais, Marcelo, desenhar isso tudo, mas assim, idealmente eu penso que é, cara, o que tá de um ano aqui para trás que não é atualizado mais. Beleza, vamos colocar isso aqui num legacy e acabou.
Fernando Neto: Lembrar. É, é, coloca no bucket, né?
Wagner Jorge: Eh, move para uma camada fria e acabou, entendeu?
Fernando Neto: Não sei como é que é a extração disso aí. Coloca no bucket a 5 anos, tá?
#
00:32:18
Wagner Jorge: Para um Não sei, não sei na GCP, mas era era o Glacier, né, na WS.
Fernando Neto: O é é o GL.
Marcello Pontes: Tem
Wagner Jorge: Mas é só pegar o o corresponde.
Fernando Neto: Eles têm mesmo o mesmo cold storage da vida.
Wagner Jorge: M.
Fernando Neto: É, mas o o coisa, senhores, o que vocês fazem é muito importante, assim, acho que o pessoal não tem noção, eu acho, não, eu tenho quase certeza que o pessoal não tem noção da importância do do o que mais vale empresas hoje são dados. Não é pessoal, nem infra, nem nada, é dados, né? Tanto que o nosso custo aqui é dados hoje, né? Mas eu acho que esse envolvimento do do pessoal de área que vocês o trabalho que vocês vão fazer vai precisar de um trabalho de conscientização das áreas também, que essa é a parte mais f***, eu acho, sabe?
Wagner Jorge: Sim, sim.
Marcello Pontes: Vai ser mais difícil.
Fernando Neto: Então assim, levantar isso, levantar a bandeira que vocês vão levantar, mas levantar com uma força assim, pessoal, prestem atenção, as coisas vão mudar para melhor, vai ser ruim no começo, tá? Blá, blá blá blá. Mas o pessoal tem que ficar ciente que é um trabalho sério, porque o que o Wagner tá descrevendo, velho, ir lá e criar uma tabela e depois ignorar o Golden A, enfim, eh, falta de treinamento ou falta de
#
00:33:27
Wagner Jorge: Sim. Sim. Eh, não é conhecimento.
Fernando Neto: informação. Vamos assumir por aí. Não acho que é falta de caráter nem nada, mas acho exato.
Marcello Pontes: Uhum. É, é questão também, é, desculpa, é questão também de o pessoal ter muita nova demanda e e a demanda tá mudando o tempo todo e tá todo mundo com Exatamente.
Wagner Jorge: É conhecimento. E assim é, ele vai resolver o problema dele.
Fernando Neto: É exato. Exato. Ele entrega o dele, ó, para trás.
Wagner Jorge: É. Eh, e assim, eh, tem muita questão de de mentalidade e de conhecimento. Eu não não digo que a galera eh sei lá, faz de propósito. Eu acho que nem perto disso, é só conhecimento mesmo. E e eu acho que falta a gente dizer o seguinte, cara. A gente tem uma cerimônia aqui, Marcelo, que é tipo um stack eh a gente chama de stack talks, mas é tipo um hands que a gente fazia lá atrás.
Marcello Pontes: Ne. M.
Wagner Jorge: Cara, pega um tema. Temer dados, governança de dados e como é que usa. Pô, vou pegar aqui uma hora e vou ensinar essa galera. Padrão novo é esse.
#
00:34:29
Wagner Jorge: Sigam esse padrão. Esse antigo vai ser desligado a partir do dia tal. Pronto. E a galera vai migrar. Deixe esse vídeo salvo. Consultem à vontade, perguntem à vontade.
Marcello Pontes: M.
Wagner Jorge: Vamos estar à disposição que vai funcionar. Eu eu talvez seja ingenuidade, mas eu tenho muita fé na humanidade sobre essas coisas, tá ligado?
Fernando Neto: Nej, Não, não.
Wagner Jorge: Eu acho que é só instruir e se disponibilizar, tá ligado?
Fernando Neto: Você tem que ter, você tem que ter, Да.
Wagner Jorge: É só se disponibilizar que a galera vai. Eu acho que é é só falta de conhecimento. É debil lá. Busquem conhecimento.
Marcello Pontes: a minha a minha sugestão sugestão assim ainda sem se debruçar ainda sobre o problema, tal, mas um um um abordagem que eu que eu gosto, que eu costumo adotar é o seguinte, a gente vai escolher uma pequena área,
Wagner Jorge: É isso aí. Yeah.
Marcello Pontes: um pequeno problema, um escopo restrito do problema, né? A gente vai atacar aquilo e beleza, a gente vai avisar que agora é isso e depois disso vai morrer, mas também tem um negócio que costuma funcionar que é estabelecer uma uma automação para caducagem do que é legado, entendeu?
#
00:35:47
Marcello Pontes: Por exemplo, ah, isso aqui vai, por exemplo, isso aqui vai hoje pro pro legado e se, por exemplo, se a gente eventualmente eh eh chegar numa situação dessa e aí com tantos dias vai vai para tal ou com tantos dias morre definitivamente. Ou então tô acabou acabou. E aí o o cut dry o o como é que é o corte do seco, né? Acabou agora. Mas isso costuma doer, não é? Não é tão saudável assim. Mas vamos ver. Eh, eu costumo gostar dessa ideia de automatizar o o a transição pro legado, né? né, quer dizer, a transição do legado ou do do atual pro legado, mas eh trabalhar com escopo reduzido assim é melhor porque a gente também era mais rápido e aprende algumas coisas com essa interação. E quando, por exemplo, chegar a hora de abrir o leque, o e o e o escopo para mais áreas, aí a gente já pelo menos tem uma história de sucesso aqui que o pessoal tende a escutar no no rádio peão que vai dar certo.
Fernando Neto: Sim, sim, sim. Não, mas é, acho que eu só fiz a inserção no meio do que o Wagner tava falando ali.
#
00:36:50
Wagner Jorge: Sim.
Fernando Neto: Acho que era o Wagner tava falando, mas era justamente para era basicamente isso, deixar claro a importância de não deteriorar essa área, porque você deixa o pessoal vai de fato, que nem fala sem conhecimento, o pessoal vai criando um monte de coisa que fica como ruído no meio do do do que tem lá. Você não sabe exatamente o que que é usado ou não. Aí você tem que fazer um monte de auditoria.
Marcello Pontes: Угуm.
Fernando Neto: Isso leva tempo, né? Eh, eh, custa dinheiro, né? Não só dos dados que estão lá e tal, mas das pessoas que vão mexer nessa bomba. Mas então assim, acho que falta um pouco conscientização da importância dos dados. Acho que é isso que eu tô querendo dizer. Acho que as pessoas não leva, simplesmente olham para pro pros dados como uma fonte de relatório pro que elas têm que entregar, sabe? Eu acho que é isso.
Wagner Jorge: Uhum. É, e tem outro tem um ponto aí adicional que eu tô refletindo sobre ele alguns dias, que cara, eu ultimamente eu tô direcionando 70% do meu fluxo para LLM, cara.
Marcello Pontes: Так.
Wagner Jorge: vai montando aqui templates, boiler plate, Java 4, até coisas de vis que, cara, eu quero que eu faça um gráfico assim, assim, com essa característica assim sem assim falar e monta eh para mim, especialmente tarefas mais massantes, né?
#
00:38:15
Wagner Jorge: Eh, não tão intelectuais.
Fernando Neto: Quando você fala direcionando para Llm, o que que você faz?
Wagner Jorge: E aí eu tô usando muito cloud.
Fernando Neto: Que que você tá usando de stack aí? Ô, Wagner, o cloud multicloudropic.
Wagner Jorge: É, não, o cloud da cloud code da Isso não tô usando muito o chat e o papo com Fernando que ele não poôde hoje, mas sem problema, tá Fernando, eu não respondi lá, mas zero bronca.
Marcello Pontes: Mas você tá usando direto cloud code ou tu tá no no chat?
Wagner Jorge: é que eu quero migrar isso para outro nível, né, para usar direto no cloud, no cloud code e pegar outros contextos, porque, por exemplo, Del tá escrevendo código de crédito lá, eu tava fazendo isso hoje. E aí João Guilherme, que é o R de crédito, Marcelo, disse: "Cara, eu preciso que tu valide esse número, só que ele tava escrevendo em polares, Python lá, bonitão, tal, e eu tava escrevendo em SQL. Pô, esses números precisam conversar, pô. Se eu for traduzir pollares para para SQL, vai ser uma demora da praga. Peguei o repositório do Dell, tá lá o monor de Python, trouxe tudo. Ache qual é o contexto que tá fazendo esses números aqui, olhe pro meu e faça os ajustes que precisam ser feitos e diga quais são as diferenças e por quê.
#
00:39:35
Fernando Neto: Você tá você tá ciente que eu tô montando a nova infra lá, né?
Wagner Jorge: Por 5 minutinhos já montei tudo, já validei os números, tá tudo certo, vamos seguir, entendeu? E aí eu quero aumentar o nível. Sim. Tô ciente.
Fernando Neto: Naquela outra infra, eu habilitei para algumas pessoas especiais, as pessoas que eu gosto.
Wagner Jorge: Tô ciente.
Marcello Pontes: T o pessoal de dados.
Fernando Neto: Na brincadeira foi foi um teste que eu tô fazendo para para ver o quanto de, por exemplo, quanto eu e meu time gastamos de IA. Eh, no mês, por exemplo, né?
Wagner Jorge: Sim.
Fernando Neto: Obviamente o que a gente gastou no mês não chegando perto de um dia de dados, por exemplo, mas são bichos diferentes que a gente tá comparando.
Marcello Pontes: Mhm.
Fernando Neto: Mas sim, o modelo que você precisar de acesso todos os modelos que são disponíveis lá no, como é que é o nome negócio do vertex lá dentro, como é que é?
Wagner Jorge: no no no cursor.
Fernando Neto: Garden a garden alguma coisa. Não, dentro do é dentro do vertic e eu habilitei o sonet.
Marcello Pontes: É guard model.
Wagner Jorge: Ah, do vertex. É, tá. Aham.
Fernando Neto: O eu aí o o Renato Rosa ficou sabendo que é o outro que usa i para cacete e veio atrás de mim, falou assim: "E aí, quando é que você vai liberar o acesso daquele negócio lá?"
#
00:40:44
Fernando Neto: A já liberei.
Wagner Jorge: E aí o Renato Rosa conversou comigo e ele disse assim: "Cara, tem um negócio da hora que tu precisa se envolver nisso daí também, já que tu tá mexendo, fala com o Fernando." Ah, então beleza. F.
Marcello Pontes: Mas deixa eu, deixa eu tirar uma dúvida aqui com vocês. A gente tinha uma demanda e é um pouco oftópic aqui, tá? a gente tinha uma demanda interna, enfim, todo mundo, todo dev nosso querendo usar, querendo usar IA, todo mundo querendo usar cloud code, a gente testou, fez uma um teste de usar cloud code com API Key em vez de ter a subscription direta com Antropic. Eh, o gasto é absurdo do cloud code com o API aqui, tipo, eh, enfim.
Wagner Jorge: Угуm.
Fernando Neto: Cara, é assim, é que os números aqui tá tão f*** em termos de gasto que o que a gente tem hoje de que nem no meu meu plano particular do cloud code, eu pago lá os R$ 110, alguma coisa assim que a gente paga, né?
Marcello Pontes: E em raz eu não sei, mas assim o a a característica era que a gente tava avaliando entre comprar licença para aquela licença que é aqui é no time Enterprise é sei lá $50 por pro time né se
#
00:41:46
Fernando Neto: Pris.
Marcello Pontes: você comprar no pessoal é mas aí a gente tava avaliando se IP aqui valeria teve a a média era 50 por dia por por défic
Fernando Neto: Sim.
Wagner Jorge: Não, a gente a gente tá usando assim, parte do time de desenvolvimento tá usando o cursor como ferramenta e aí se não me falha a memória, é 70 doll a cadeira, se não me falha a memória.
Fernando Neto: Ah, Ago.
Marcello Pontes: Mas custo, o custo é beleza. E a assinatura também, porque tem um cap, né, no no custo, ela não é. Aí que que eu uso eu uso cursel também, beleza?
Wagner Jorge: Então, cara, a gente tem acesso a, sei lá, deixa eu abrir aqui, mas tem acesso ao Opos, tem acesso ao a um monte de de de ferramentas, cara. Eu nunca nunca cheguei nem perto de de algum limite. É um negócio assim assustador de gigante.
Fernando Neto: Bom, só pr só pr é assim, é uma coisa também que, tipo, usando API key, uma coisa que eu não descobri via vertex ainda, como é que segrega, como é que segrega essa p****, tipo assim, quanto que eu
Wagner Jorge: E eu não sei nem como é que os caras estão fazendo isso, inclusive.
Marcello Pontes: Eh, para usar É,
#
00:42:46
Wagner Jorge: Mas assim, Угуm.
Fernando Neto: gastei, quanto que o Marcelo gastou, quanto que o Wagner gastou, né? Por quê? Porque eu preciso de alerta também do ponto de vista de de infra. Eu não posso de um dia pro outro. O maluco lá fez a inferência lá, voltou R$ 2 milhões deais.
Wagner Jorge: Угу.
Marcello Pontes: não tem tem, se eu não me engano, tem algumas maneiras no vértex, eu não não cheguei ao fim, mas eh de tu provisionar por envolvida, né, no aí tu tem que tu tem como fazer M.
Fernando Neto: Eh, eu preciso estudar direitinho. Hoje a gente só tem lá, eu habilitei o modelo, né? Então, qualquer pessoa que chega para mim, eu vou habilitar para vocês ali, inclusive já, tá?
Wagner Jorge: Угуm.
Fernando Neto: Mas é basicamente API, né? Então eu habilito lá os usuários de vocês naquele projetinho e vocês dão um export no terminal aí e corre para abraço. Eh, hoje tá só com Sonet. O o rosa pediu ous e o Gemini 3 deu um couro no cloud code. Então vou habilitar também.
Wagner Jorge: Угу.
Fernando Neto: Então assim, e você consegue via Gemini se lá e você consegue usar a mesma API lá do negócio, da coisa toda.
#
00:43:49
Marcello Pontes: M. Beleza.
Fernando Neto: Enfim, a gente tá coberto os modelos que precisarem. Eu não sei se vocês usam visão para alguma coisa, mas enfim, tem tem modelo lá também para essas coisas, mas eh vocês têm, é só falar comigo que a gente.
Wagner Jorge: Não, visão. Tô fora por enquanto.
Fernando Neto: Mas é assim, o o problema maior que eu tinha tava usando minha conta pessoal, cacete e a empresa não tinha nada, né?
Wagner Jorge: É, meu caso, eu tava usando a minha pessoal também.
Fernando Neto: E você usa pessoal, você faz cinco prompt lá, o negócio fala assim: "Meu irmão, você já o limite us diário já foi."
Wagner Jorge: Eu tava usando o meu pessoal e batendo, batendo.
Fernando Neto: Teve um dia que eu bati o limite semanal, fiquei três dias de castigo sem poder usar Iá. Fiquei e agora não sei mais nada. Não sei mais nada. Não, mas já habilitei depois Ja.
Wagner Jorge: Aí depois eu, pô, vou botar aqui o da UMI, só que eu tava fora do projeto com dois com dois promptos que eu botei o limite, aí disse: "Eita, poxa, ferrou". Aí foi quando eu habilitei o projeto, habilitei isso antes de ontem, mas sim, dado essa volta toda aí, o ponto é de esse é o maior, a maior montanha a ser rampada em dados para mim é essa que eu vou dizer agora.
#
00:44:57
Wagner Jorge: Eh, não é ter catálogo, não é organizar, não é fazer esteira. É o seguinte, confiança nos números, crédito é uma área bem consolidada e o João, ele é um negócio assim, tu vai conhecer ele eventualmente, Marcelo, mas ele é um cara que é assustador o quanto ele armazena informação e no detalhe, tipo, monta um dash, eu montei um um um detector de anomalias para ele e disse: "Cara, tá aqui que ele, pô, tem um número que não tá fazendo sentido. Seg, fala ele. Não, pô, vê só, tem esse B ID aqui que em 2024, em junho de 2024, tal, tal, o valor financiado deu tanto e isso é anômalo. Por que que não disparou? Caramba, o negócio lá de 2024, não sei das quantas, o cara bateu o olho e sabe. Então, o seguinte, o que acontece? crédito tem os números e o resto segue. E ponto, essa filosofia e acabou. Eh, qualquer número que diverge do crédito deve ser corrigido, só que a gente tem uma massaroca brutal de dados. Quando eu digo brutal, não é em volumetria, é em pedacinhos que foram sendo criados e tem um monte de pedaços espalhado.
#
00:46:27
Wagner Jorge: Só que muitos desses dados e desses números, eles não batem com crédito. E quando eu digo que não batem, não são divergências de R$ 1.000, R$ 2.000. Já encontramos divergências de R$ 5 milhões deais entre cobrança e crédito. E aí o que é que acontece? crédito não vai aprovar esse número. Por exemplo, ontem a gente discutiu disse: "Pô, comecei a catalogar os dados aqui Piri Parará e aí a o João bateu logo, tá? Mas eu acho que você não deveria fazer isso para todos os dados que a gente tem, só para aqueles que a gente confia. Só que nós que somos de exatas, isso não é mensurável. Os só os dados que a gente confia, tá? Mas são quais? preciso mensurar isso e eu acho que esse é o o maior gargalo hoje. É. E aí talvez a opção seja fazer uma lista e começar a descrever que é confiável, o que não é. E aí isso é o inferno. Porque, por exemplo, no último ano eu fiz um levantamento aqui, são 700 tabelas. É aí, pai, tu vai puxar uma lista com 700 tabelas, porque talvez aí possa ser o ponto de partida.
#
00:47:42
Wagner Jorge: Eu vou trazer isso aqui que é confiável e o resto se adapte, que é meio que a pegada do crédito. Mas do outro lado, o ponto de vista mais soft, não é assim que funciona. Cobrança, você não vai conseguir mudar eh para se adaptar a crédito, porque também tem contexto de negócio. Às vezes a gente vai reportar pro fundo de investimento e, sei lá, a gente tem uma probabilidade de def que a gente chama de FPD, né? First payment defult. de 9,5% na carteira, pô, a gente vai reportar pro fundo. A gente diz que é 10,5 pra gente ter uma gordura, porque se der algum BO, a gente tá dentro da margem de gordura e o fundo não vai precisar sofrer com isso.
Marcello Pontes: É, mas aí você faz uma camada depois do dado confiável, né?
Wagner Jorge: Exatamente. Só que quando tu bate esse número de 10,5 com cobrança dando eh 9.3, O três, pô, tá muito diferente, mas o número real é 9,5, então não tá tão diferente assim. Então é construir essa camada de confiabilidade nos dados é que não é uma tarefa tão trivial e talvez aí esteja o ouro do negócio.
Marcello Pontes: Oi, viu?
Wagner Jorge: E eu não sei como resolve isso, tá?
#
00:48:54
Marcello Pontes: Tá, eu enxergo assim, não é que, vamos lá, não é que eu sei que você não pensa assim, tá?
Wagner Jorge: Tô pensando ainda.
Marcello Pontes: Eu vou falar, não é que não é resolver o catálogo, eu acho que isso parece com um balance business cor, né? Que você começa do operacional e ative o estratégico.
Wagner Jorge: Uhum.
Marcello Pontes: O estratégico é geralmente é realmente um dos senão o maior ponto estratégico é atingir a confiança dos dados.
Wagner Jorge: Угу.
Marcello Pontes: E aí, como é que você atinge isso? Navegando para trás, passo passo, e eventualmente você vai ter essas micro atividades técnicas que é de que vão eh juntas ali no estratégico, fazendo com que a gente alcance a confiança do dos dados. E aí a gente tem uma série de tarefas de atividades estratégicas, tem uma série de eh ganhos eh desculpa, atividades operacionais, uma série série de ganhos estratégicos. E aí a gente vai fazer o tentar agora, enfim, mais para frente a gente vai ver como é que vai fazer isso, mas uma das sugestões é a gente fazer um corte vertical para fazer algum realizar algumas atividades operacionais e ver se elas eh resultam em um uma parte do ganho estratégico ou uma parte do Exato.
Wagner Jorge: famoso dividir para conquistar, né?
#
00:50:11
Wagner Jorge: Vamos começar aqui com crédito. Faz verticalmente.
Marcello Pontes: Vamos conversar com o FPD.
Wagner Jorge: Validou.
Marcello Pontes: Vamos conversar com o FPD.
Wagner Jorge: Vamos para Aham.
Marcello Pontes: E tipo, uma dúvida que me causa é p****, por que você Beleza, beleza.
Wagner Jorge: Aham. Entendeu?
Marcello Pontes: É, é o é o é o crédito que manda dado? Beleza, como é que ele chega nesse dado? E aí vamos, né?
Wagner Jorge: Uhum. É, eu tô trabalhando nisso e uma das coisas que eu comecei a tentar e isso isso eu comecei a a enraizar um pouco mais, espalhar um pouco mais, criando books de variáveis do tipo assim, cara, o que tá
Marcello Pontes: Acho que foi isso que tu comentou quando queria comparar o código do do Dell com o teu SQL, né? Tá indo para trás.
Wagner Jorge: no grão contrato, como é que o crédito enxerga? Qual é a fonte de verdade? Ah, tá na cabeça de fulano, Beltrân, Cicrono. Beleza, eu vou montar aqui e vou bater com esses caras para ver se esses números estão eh fazendo sentido. Ah, eu tenho um dash aqui que ele é confiável porque eu já validei 1000 vezes.
#
00:51:09
Wagner Jorge: Beleza, então eu vou ver se meu números tá convergindo para ele. Beleza, terminei o book no grão contrato. Tá confiável, tá confiável. Beleza, galera. Eh, crédito, cobrança, growth, marketing, sei lá, quem quer que seja, usem essa fonte de dados aqui. Toda vez que vocês precisarem de contrato, a verdade é essa aqui. Pronto, acabou.
Marcello Pontes: M.
Wagner Jorge: Agora vamos para eh borrers, tá? Aqui de borrers. Vamos aqui para aí a gente já fez contrato, borrer, retailers e mais uns quatro ou cinco aí e eh de Bambel principalmente, né? dados de birô e etc e tal. E aí, eh, por onde eu comecei, mas eu queria ver uma como é que a gente fez. Sentou eu e João, aproveitando as férias do João Guilherme e arrochando o pé aqui até fechar. Só porque a demanda do dia a dia engole muito o nosso tempo, né? É, pô, aproveitei as férias dele e arrochei o pé. Só que assim, é difícil escalar para tanta coisa, tá ligado? E aí eu queria deixar essa buga aí para ver se tu tem uma ideia aí, pra gente fazer uma coisa mais automatizada e que a gente gosta de chamar hoje de AI, né?
#
00:52:21
Marcello Pontes: Tá bom.
Wagner Jorge: E pode ser um monte de infiel aí, mas tá, tô aceitando.
Marcello Pontes: Ei, tu tá no mudo, Fernando.
Wagner Jorge: Vai no muro, Fernando.
Fernando Neto: tava falando que qualquer pessoa que trabalha com AI em si, quando ouve um LLM, você não chega de AI, os cara p*** que pariu.
Marcello Pontes: Os caras criaram, os caras criaram, os caras criaram lá no, no trabalho um canal, aí tem uma como se fosse umas texs dedicada para esse tópico de, ei, ai, tipo, o pessoal só fala de e cist, tá ligado? É, é isso aí.
Wagner Jorge: Aham.
Fernando Neto: É, é, não, não, mor.
Marcello Pontes: Eu não vou ser o chato, não. Não vou ser o tio chato, não.
Wagner Jorge: É, pois é. Eu eu já abstraí. Não, que eu tô usando EI aqui. Eu digo, seja feliz, vamos usar EAI.
Fernando Neto: Ai ai veli.
Marcello Pontes: Ô, gente, exado, ó.
Wagner Jorge: Aí eu não sei, né, se ele tá usando um carro autômato ou se ele tá usando um LLM. Ele tá usando eu digo, então, autônomo, né?
#
00:53:20
Fernando Neto: E tem aí.
Wagner Jorge: Então, vai lá. É, tem.
Marcello Pontes: Aí, tá valendo duas vezes o preço agora, ó.
Wagner Jorge: Seja feliz.
Marcello Pontes: É uma curiosidade, velho. Eu sei, enfim, com todos os termos, todos os os jargões da área, velho, o meu primeiro trabalho na área de dados, de verdade, foi foram dois anos trabalhando numa empresa que forneceu o quê?
Fernando Neto: Вот так.
Marcello Pontes: Crédito. Então, eu era o cara que fazia relatório de relatório de risco, relatório de eh castigo, toda essa p**** toda. E e bater com o contador lá que era esse negócio de beo. Boas lembranças. Mas enfim, vamos ver se eu consigo trazer um pouco disso para cá, né, agora.
Fernando Neto: Não, legal. O que vocês precisarem, vocês vão me chamando aí, bicho. A gente tem um canal lá, a gente troca ideia. Eh, eu tô aqui para dar suporte como vocês precisarem para vocês chegarem no no objetivo que vocês precisam aí, tá?
Marcello Pontes: Obrigado.
Wagner Jorge: Show de bola.
Fernando Neto: Eu vou vou lá para uma próxima aí, Wagnão, depois, velho, eu não sei se você consegue fazer alguma projeção de dados, de uso de dados pro ano que vem, do jeito que tá indo, tá?
#
00:54:12
Wagner Jorge: Show de bola. Show de bola. Tá, vou olhar isso aí. Vou olhar isso aí.
Marcello Pontes: Faz uma linha, faz uma linha.
Fernando Neto: Porque eu preciso passar para Tainar. É, traç ali com duas, né?
Marcello Pontes: esperado o pior caso. Beleza.
Wagner Jorge: Beleza.
Fernando Neto: Na mor de que eu preciso passar para Tainá o custo combinado epóo que a o dados vai mudar, né?
Wagner Jorge: Beleza.
Marcello Pontes: ouvido.
Fernando Neto: Por mais que eu tenha a gente tenha o o compromisso com a GCP de gastar tanto por ano, eu sei que a gente vai gastar bem mais, né?
Wagner Jorge: Uhum.
Fernando Neto: Só que é só um lance que eu preciso passar para ela para ela ter no bolso lá.
Wagner Jorge: Mas aquela coisa, gastar por gastar para mim não faz sentido. Às vezes a gente tem muito essa mentalidade de, tipo assim, a gente tem um budget para gastar com a Google, então vamos gastar.
Fernando Neto: É.
Wagner Jorge: Mas esa lá, gastar por gastar não, vamos gastar estrategicamente aqui e eu quero almoçar com os caras.
Fernando Neto: Não, não concordo. Para mim, eu eu preferia 1 vezes ter um um Ah, o dia que você vier para cá, o dia que você vier para cá, eu vou falar, vou marcar lá, vocês vão lá.
Wagner Jorge: Cadê o almoço que disseram que ia rolar?
Marcello Pontes: GCP.
Wagner Jorge: Sim. Beleza.
Fernando Neto: Eu já tô cansado de lá, já fui lá tomar duas vezes, almoçar com o pessoal lá.
Wagner Jorge: Ah, boa, boa.
Fernando Neto: Dá de boa, senhores. É isso aí. Vou pular pra próxima aqui.
Marcello Pontes: Obrigado pelo tempo de vocês aí.
Fernando Neto: Boa tarde, senhores. Até mais. Prazer aí, Marcelo.
Wagner Jorge: Vai lá, Mat. Tu precisa de mais alguma coisa, de alguma dúvida para tirar?
Fernando Neto: Até mais.
Wagner Jorge: Pode ir lá, Fernando, se quiser que tu vai para outra, né? Fica à vontade. Valeu. Tu precisar de alguma coisa, fala aí, levanta a mão. Vou tá safe.
Marcello Pontes: Vou levantar, fica tranquilo. Obrigado pelo teu tempo aí, velho. E bom desafio que a gente tem aí, né?
Wagner Jorge: Então, show. Eh, e outra coisa, Veli, aí é um, putz, é um problema nosso, tá?
#
A transcrição foi encerrada após 00:56:06
Esta transcrição editável foi gerada por computador e pode conter erros. As pessoas também podem alterar o texto depois que ele for criado.
**