{
  "sections": {
    "overview": {
      "kicker": "01 · Status Geral",
      "title": "USD 11M+ em economia + 99,99% uptime: plataforma de observabilidade enterprise",
      "sub": "",
      "published": true
    },
    "deliverables": {
      "kicker": "02 · Entregas principais",
      "title": "Descritivo → Impacto → Stakeholders",
      "sub": "Frentes que definem o nível atual e sustentam a conversa de staff.",
      "published": true
    },
    "influence": {
      "kicker": "03 · Influência cross-team",
      "title": "Arquitetura que outros times adotaram",
      "sub": "Observability deixou de ser \"coisa da plataforma\" e virou \"padrão da empresa\".",
      "published": false
    },
    "matrix": {
      "kicker": "04 · Skills & Progresso",
      "title": "Skill 2026 - Trilhas de Progresso e Evolução",
      "sub": "",
      "published": true
    },
    "skills": {
      "kicker": "",
      "title": "Skill matrix",
      "sub": "",
      "published": true
    },
    "progress": {
      "kicker": "",
      "title": "Progresso 2026  — status das dimensões",
      "sub": "",
      "published": false
    },
    "initiatives": {
      "kicker": "05 · Próximas iniciativas",
      "title": "Q2 / Q3 2026",
      "sub": "Iniciativas e Busisnes cases",
      "published": true
    },
    "projects": {
      "kicker": "07 · Projetos abertos",
      "title": "Repositórios com topic portfolio",
      "sub": "",
      "published": false
    },
    "posts": {
      "kicker": "08 · Posts publicados",
      "title": "Feed do Notion — DB Portfólio",
      "sub": "",
      "published": false
    },
    "committee": {
      "kicker": "",
      "title": "Observações para o comitê",
      "sub": "",
      "published": false
    },
    "cv": {
      "kicker": "09 · CV snapshot",
      "title": "One-pager do currículo",
      "sub": "CV para ser impresso ou salvo como PDF (⌘/Ctrl + P → Salvar como PDF).",
      "published": true
    },
    "teste-nova-secao": {
      "kicker": "TESTE",
      "title": "",
      "sub": "TESTE",
      "published": true
    }
  },
  "meta": {
    "title": "Rodrigo Kosai — Portfólio Profissional | Senior Observability & Platform Engineer no Banco Itaú",
    "description": "Entregas técnicas 2024-2026: 250TB+/day | USD 11M+/year cost savings | AWS, Splunk, Datadog, FinOps & SRE",
    "siteUrl": "https://rodckdev.github.io/portfolio/"
  },
  "hero": {
    "eyebrow": "Entregas técnicas · 2024 – 2026",
    "headlineParts": [
      {
        "text": "Observabilidade "
      },
      {
        "text": "em escala",
        "accent": true
      },
      {
        "text": ", FinOps com "
      },
      {
        "text": "USD 11M+/ano",
        "accent": true
      },
      {
        "text": " e infraestrutura "
      },
      {
        "text": "AWS",
        "accent": true
      },
      {
        "text": " que sustenta milhares de engenheiros."
      }
    ],
    "ledeHtml": "Sênior Site Reliability / Observability Plataform Engineer no Banco Itaú desde Aug/2021. Responsável pela operação de uma plataforma de telemetria crítica que serve <strong>2.000+ usuários</strong>, ingere <strong>250TB+/dia</strong> e roda sobre <strong>400+ EC2</strong>.",
    "cta": [
      {
        "label": "Ver entregas",
        "href": "#deliverables",
        "kind": "primary"
      },
      {
        "label": "CV snapshot ↓",
        "href": "#cv",
        "kind": "ghost"
      }
    ],
    "cardTitle": "Impacto acumulado",
    "metrics": [
      {
        "label": "Economia anual",
        "value": "USD 11M+"
      },
      {
        "label": "Ingestão diária",
        "value": "250TB+"
      },
      {
        "label": "Usuários atendidos",
        "value": "2.000+"
      },
      {
        "label": "Frota gerenciada",
        "value": "400+ EC2"
      },
      {
        "label": "Uptime plataforma",
        "value": "99,99%"
      },
      {
        "label": "Redução de toil",
        "value": "-50%"
      }
    ]
  },
  "overview": {
    "kicker": "01 · Status Geral",
    "title": "USD 11M+ em economia + 99,99% uptime: plataforma de observabilidade enterprise",
    "subHtml": "Portfólio executivo que traduz <em>engenharia de confiabilidade em escala</em> em <em>valor financeiro</em>: USD 11M+/ano em modernização, USD 500K/ano em FinOps, 15% redução infraestrutural. Documenta <em>o quê</em> foi arquitetado (plataforma Splunk/Datadog HA multi-site), <em>por quê</em> importa (2.000+ usuários críticos, finance/telecom, risk mitigation), e <em>o impacto</em> (reliability, cost control, automation at scale).",
    "pills": [
      "📅 Aug 2021 – presente (5 anos) · Banco Itaú",
      "🏦 Financial Services | Platform Engineering & Observability | 2.000+ users | 400+ instances",
      "🛠️ Splunk (Architect/Core/SmartStore) | Datadog (APM/SLO/Synthetics) | AWS (EC2/EKS/Lambda) | Terraform | OTEL",
      "💡 SRE · FinOps · Observability Pipeline · HA Multi-site Infrastructure",
      "📈 USD 11M+/ano · USD 500K/ano · 250TB+/dia · 99,99% SLO · 50% automation toil reduction"
    ]
  },
  "deliverables": {
    "items": [
      {
        "id": "finops-usd-11m-ano-processamento-com-capacity",
        "num": "1",
        "order": 1,
        "title": "FinOps + USD 11M+/ano, +Processamento com - Capacity.",
        "sub": "Consolidação, Graviton, Spot, SmartStore S3 e otimização de ingestão.",
        "blocks": [
          {
            "heading": "O que foi feito",
            "bullets": [
              "Consolidação / modernização Splunk (redução de footprint).",
              "Adoção de EC2 Graviton em workload elegível.",
              "Spot + SmartStore S3 — mix de pricing otimizado.",
              "Otimização da ingestão de logs (amostragem + filtros)."
            ]
          },
          {
            "heading": "Impacto técnico",
            "bullets": [
              "Arquitetura escalável sem \"just add more servers\".",
              "Custo de observability sob controle (framework FinOps).",
              "Dados críticos sem perder conformidade."
            ]
          },
          {
            "heading": "Impacto financeiro",
            "bullets": [
              "Redução de capacity sem impactar performance.",
              "Descomissionamento de recursos ociosos.",
              "USD 11M+/ano em economia comprovada.",
              "USD 500K/ano somente em Graviton.",
              "ROI em automação: payback em ~12 meses."
            ]
          },
          {
            "heading": "Impacto operacional",
            "bullets": [
              "Otimização de capacity."
            ]
          },
          {
            "heading": "Stakeholders beneficiados",
            "bullets": [
              "CFO / Finance — bottom line.",
              "Platform team — infra que se paga.",
              "Engineering — confiabilidade com economia."
            ]
          }
        ],
        "metrics": [
          "Savings USD -11M infra , Data retention 60 to 30 days, VCPU -32%"
        ],
        "extras": []
      },
      {
        "id": "multi-roteamemento-de-logs-fluentbit-s3-splunk-datadog",
        "num": "2",
        "order": 2,
        "title": "Multi Roteamemento de logs FluentBit/S3/Splunk/Datadog.",
        "sub": "Armazenamento centralizado, durável e barato para auditoria, analytics e retenção",
        "blocks": [
          {
            "heading": "O que foi feito",
            "bullets": [
              "Habilitar multi routing para Datadog , Splunk, S3 e cloudwatch. Configurar pipelines innersource para filtrar e gravar em buckets S3 por conta/ambiente com particionamento por data e prefixos; habilitar lifecycle, criptografia e políticas de acesso."
            ]
          },
          {
            "heading": "Impacto técnico",
            "bullets": [
              "Alta durabilidade e escalabilidade, versionamento e imutabilidade (Object Lock).",
              "Opcao de roteamento entre CLoudwatch, S3, Splunk e Datadog."
            ]
          },
          {
            "heading": "Impacto financeiro",
            "bullets": [
              "Reduz custo por GB vs. armazenamento quente e permite políticas de lifecycle (IA/Glacier) e expiração automática."
            ]
          },
          {
            "heading": "Impacto operacional",
            "bullets": [
              "Simplifica retenção/compliance, padroniza exportação de logs, facilita compartilhamento entre times e integra com ferramentas (Athena, Glue, SIEM)."
            ]
          },
          {
            "heading": "Stakeholders beneficiados",
            "bullets": [
              "SRE/Plataforma; Segurança/Compliance; Data/Analytics; FinOps"
            ]
          }
        ],
        "metrics": [
          "100% de log info roteadas; custo mensal de storage; tempo de retenção garantido; tempo para atender auditoria/forense; nº de consultas/insights via Athena"
        ],
        "extras": []
      },
      {
        "id": "lifecycle-automation-50-de-reducao-de-toil",
        "num": "3",
        "order": 3,
        "title": "Lifecycle automation + 50% de redução de toil",
        "sub": "Lifecycle automation, capacity scaling, self-healing e runbooks automatizados.",
        "blocks": [
          {
            "heading": "O que foi feito",
            "bullets": [
              "Lifecycle automation: provisioning, patching e decommissioning de EC2.",
              "Políticas de capacity scaling (weekends, off-peak).",
              "Self-AMI update via Lambda + Auto Scaling.",
              "Runbooks automatizados via Lambda, API Gateway."
            ]
          },
          {
            "heading": "Impacto técnico",
            "bullets": [
              "Padronização de golden Imagem.",
              "Reducao do cyber Score.",
              "Atualização de AMI sem intervenção."
            ]
          },
          {
            "heading": "Impacto financeiro",
            "bullets": [
              "50% de redução em operações manuais.",
              "Menos erro humano (Cyber Risk Score ↓).",
              "Equipe foca em \"valor\" em vez de \"operação chata\"."
            ]
          },
          {
            "heading": "Impacto operacional",
            "bullets": [
              "Antes: ~20 h/semana em tarefas manuais repetitivas.",
              "Depois: ~10 h/semana.",
              "Produtividade: 1 eng = trabalho de 1,5 eng."
            ]
          },
          {
            "heading": "Stakeholders beneficiados",
            "bullets": [
              "Platform engineering — capacidade liberada.",
              "Budget — menos horas em operação, mais em inovação."
            ]
          }
        ],
        "metrics": [
          "Changes: 10 → 5, % execucao automatizado: +80% , Lead Time: +40%"
        ],
        "extras": []
      }
    ],
    "kicker": "02 · Entregas principais",
    "title": "Descritivo → Impacto → Stakeholders",
    "sub": "Cinco frentes que definem o nível atual e sustentam a conversa de staff."
  },
  "influence": {
    "items": [
      {
        "id": "team-a",
        "order": 1,
        "tag": "Team A",
        "body": "Adotou o observability governance framework → 20 serviços alinhados.",
        "extras": []
      }
    ],
    "kicker": "03 · Influência cross-team",
    "title": "Arquitetura que outros times adotaram",
    "sub": "Observability deixou de ser \"coisa da plataforma\" e virou \"padrão da empresa\"."
  },
  "progress": {
    "rows": [
      {
        "order": 1,
        "dimension": "Splunk HA — operação",
        "status": "stable",
        "statusLabel": "✅ estável",
        "target": "Manter 99,99%",
        "evidence": "Uptime logs, query perf",
        "extras": []
      },
      {
        "order": 2,
        "dimension": "FinOps",
        "status": "stable",
        "statusLabel": "✅ USD 11M entregue",
        "target": "+5% ano",
        "evidence": "Splunk Decommission",
        "extras": []
      },
      {
        "order": 4,
        "dimension": "OTEL",
        "status": "mid",
        "statusLabel": "🟨 LFS148 iniciado",
        "target": "Blueprint + piloto",
        "evidence": "Certificação em andamento",
        "extras": []
      }
    ],
    "kicker": "04 · Dashboard de progresso",
    "title": "Status atual × target 2025"
  },
  "skills": {
    "rows": [
      {
        "order": 1,
        "skill": "OpenTelemetry + collector + pipelines",
        "current": "Básico",
        "currentBadge": "mid",
        "target": "Expert",
        "gap": "Médio",
        "gapBadge": "warn",
        "plan": "Treinamento OTCA e Splunk para Otel + blueprint em produção",
        "extras": []
      },
      {
        "order": 2,
        "skill": "AWS cloud scale",
        "current": "Sênior",
        "currentBadge": "ok",
        "target": "Expert+",
        "gap": "Pequeno",
        "gapBadge": "warn",
        "plan": "Mais EKS, mais patterns Lambda",
        "extras": []
      },
      {
        "order": 3,
        "skill": "Kubernetes avançado + operators + admission/policies",
        "current": "Operacional",
        "currentBadge": "warn",
        "target": "Avancado",
        "gap": "Médio",
        "gapBadge": "warn",
        "plan": "Trilhas CKA, CKD",
        "extras": []
      },
      {
        "order": 4,
        "skill": "SLO framework",
        "current": "Teórico",
        "currentBadge": "warn",
        "target": "Comprovado",
        "gap": "Alto",
        "gapBadge": "err",
        "plan": "Pilotar em 3 serviços críticos",
        "extras": []
      },
      {
        "order": 5,
        "skill": "Liderança técnica",
        "current": "Operacional",
        "currentBadge": "warn",
        "target": "Influenciador",
        "gap": "Médio",
        "gapBadge": "warn",
        "plan": "Adoção em escala",
        "extras": []
      },
      {
        "order": 6,
        "skill": "Comunicação / sistêmico",
        "current": "Funcional",
        "currentBadge": "warn",
        "target": "Estratégico",
        "gap": "Médio",
        "gapBadge": "warn",
        "plan": "Talks + posts + design docs",
        "extras": []
      },
      {
        "order": 7,
        "skill": "Inglês (global)",
        "current": "B1",
        "currentBadge": "mid",
        "target": "B2 / C1",
        "gap": "Alto",
        "gapBadge": "err",
        "plan": "Aulas + apresentações em inglês",
        "extras": []
      }
    ],
    "kicker": "05 · Skill matrix",
    "title": "Habilidades técnicas e de liderança: atual × target"
  },
  "initiatives": {
    "items": [
      {
        "id": "telemetry-pepiline-vendor-neutral",
        "order": 1,
        "tag": "Iniciativa 1 · Maio – Junho",
        "title": "Telemetry pepiline vendor neutral",
        "fields": [
          {
            "label": "O que",
            "value": "Definição de arquitetura com OTel Collector como gateway central desacoplando ingestão e backend; \nIntegração com Datadog via exporters; Manutenção estratégica do FluentBit para logs; Implementação inicial de tracing distribuído com estratégia de sampling controlada; Criação de blueprint reutilizável para expansão cross-team"
          },
          {
            "label": "Por que",
            "value": "Criação de base estratégica para redução de custos de observabilidade, aumento da flexibilidade arquitetural e aceleração de iniciativas futuras (multi-vendor / otimização de ingestão), reduzindo dependência estrutural da stack atual."
          },
          {
            "label": "Impacto",
            "value": "Estabelecer uma pipeline de observabilidade vendor-neutral, reduzindo dependência de fornecedores e criando base para otimização de custo, portabilidade e evolução arquitetural."
          },
          {
            "label": "Métrica",
            "value": "• Definição e validação de blueprint de observabilidade + instrumentação de 2 serviços críticos com OpenTelemetry,  >70% de cobertura de tracing distribuído."
          }
        ],
        "extras": [
          {
            "key": "challenges-trade-offs",
            "label": "Challenges & Trade-offs",
            "kind": "text",
            "value": "Maior complexidade operacional, necessidade de governança rigorosa de cardinalidade e risco de aumento de custo sem estratégia de sampling adequada."
          }
        ]
      },
      {
        "id": "decomissionamento-de-ferramentas",
        "order": 2,
        "tag": "finops,sre,observability,splunk,decommission,cost",
        "title": "Decomissionamento de Ferramentas",
        "fields": [
          {
            "label": "O que",
            "value": "Desativar clusters Splunk com capacity ocioso com base em: inventário → análise de uso → redução de retenção/ingestão → migração do essencial → desligamento controlado."
          },
          {
            "label": "Por que",
            "value": "Custo elevado com baixo valor (dados não usados + retenção excessiva); oportunidade direta de saving e simplificação."
          },
          {
            "label": "Impacto",
            "value": "Redução de  20–40% em infraestrutura; eliminação de ingestão desnecessária; simplificação operacional."
          },
          {
            "label": "Métrica",
            "value": "Economia mensal (R$ 500k); ↓ GB/dia ingeridos; ↓ índices ativos; custo/GB; % redução de ingestão; forwarders desativados."
          }
        ],
        "extras": []
      },
      {
        "id": "service-maturity-score-business-case",
        "order": 3,
        "tag": "finops,sre,observability,service-maturity-score,cost,reliability",
        "title": "Service Maturity Score (Business Case)",
        "fields": [
          {
            "label": "O que",
            "value": "Implantar modelo integrado de FinOps + SRE + Observability com 4 pilares: FinOps-first (custo por serviço + tagging + otimização contínua), SLO-driven reliability (SLO + error budget), Operational excellence (alert engineering + automação) e Service Maturity Score (0–100)"
          },
          {
            "label": "Por que",
            "value": "Criar visibilidade por serviço, prioriza ações técnicas e otimizações de custo e reduz risco operacional com impacto financeiro direto."
          },
          {
            "label": "Impacto",
            "value": "Reduzir 20–30% custo de cloud e 20–50% custo de observabilidade; reduzir 20–40% incidentes críticos e 30–60% MTTR; aumentar produtividade operacional (20–40%); transparência executiva e accountability por serviço."
          },
          {
            "label": "Métrica",
            "value": "Score 0–100 por serviço (0.40 Health + 0.30 Cost Efficiency + 0.30 (100−Risk));  custo por serviço; budget variance; custo de observabilidade (%)."
          }
        ],
        "extras": [
          {
            "key": "challenges-trade-offs",
            "label": "Challenges & Trade-offs",
            "kind": "text",
            "value": "Iniciativa Cross team, Adoção de SLO no lugar de thresholds, Maturidade nos custos por serviço"
          }
        ]
      }
    ],
    "kicker": "06 · Próximas iniciativas staff-level",
    "title": "Q2 / Q3 2026"
  },
  "committee": {
    "title": "Observações para o comitê",
    "paragraphs": [
      "<strong>Força.</strong> Não é só operador de ferramentas. É arquiteto que pensa em escala (USD 11M), automatiza (50% de toil) e padroniza (governance).",
      "<strong>Gap.</strong> O trabalho precisa ficar visível para quem decide promoção. OTEL é o próximo passo do mercado. SLO é o próximo passo da carreira. Influência cross-team precisa ser documentada.",
      "<strong>Potencial staff.</strong> Fechando OTEL + SLO + 3 cases de adoção até julho, está pronto para a conversa de promoção."
    ]
  },
  "cv": {
    "kicker": "09 · CV snapshot",
    "title": "One-pager do currículo",
    "sub": "Este card foi desenhado para ser impresso ou salvo como PDF (⌘/Ctrl + P → Salvar como PDF).",
    "name": "Rodrigo Kosai",
    "role": "Senior Observability / Site Reliability Engineer · Banco Itaú",
    "summary": "10+ anos em plataformas de telemetria e AWS em escala bancária. Responsável por USD 11M+/ano em economia via FinOps, 99,99% de uptime em Splunk HA multi-site (250TB+/dia) e pela introdução de Datadog APM, SLOs e automação que cortaram 50% do toil operacional.",
    "contact": [
      {
        "label": "Período",
        "value": "Aug 2021 – presente"
      },
      {
        "label": "Escala",
        "value": "250TB+/dia · 2.000+ users · 400+ EC2"
      },
      {
        "label": "Email",
        "value": "rckosai81@gmail.com",
        "href": "mailto:rckosai81@gmail.com"
      },
      {
        "label": "GitHub",
        "value": "@rodckdev",
        "href": "https://github.com/rodckdev"
      }
    ],
    "deliverables": [
      {
        "title": "FinOps — USD 11M+/ano",
        "detail": "consolidação Splunk (~USD 5M), Graviton (USD 500K), Spot + SmartStore (~USD 3M), ingestão −30% (~USD 2,5M). ROI ~12 meses."
      },
      {
        "title": "HA multi-site Splunk",
        "detail": "99,99% uptime, 250TB/dia, 0 RPO/RTO crítico por falha infra. Evitou ~USD 2M+/ano."
      },
      {
        "title": "FluentBit log collector",
        "detail": "Fluentbit coletor principal para logs, redirect to S3, innersoruce, agrupamento recuros por capacity"
      },
      {
        "title": "Otel Pipeline",
        "detail": "Otel collector, otel agent agnostics, pipeline and redirect"
      },
      {
        "title": "Automação / self-healing",
        "detail": "lifecycle EC2, capacity scaling e runbooks automatizados. Toil: 20 h/sem → 10 h/sem."
      }
    ],
    "stack": [
      [
        "Splunk HA",
        "SmartStore",
        "Indexer clusters"
      ],
      [
        "AWS EC2",
        "Graviton",
        "Spot",
        "Lambda",
        "Auto Scaling"
      ],
      [
        "Datadog APM",
        "Synthetics",
        "SLOs",
        "OTEL"
      ],
      [
        "Terraform",
        "CloudFormation",
        "CI/CD"
      ],
      [
        "FinOps",
        "Governance",
        "Runbooks",
        "Compliance"
      ]
    ],
    "kpis": [
      {
        "value": "USD 11M+",
        "label": "economia / ano"
      },
      {
        "value": "250TB+",
        "label": "ingestão / dia"
      },
      {
        "value": "99,99%",
        "label": "uptime"
      },
      {
        "value": "-50%",
        "label": "toil operacional"
      },
      {
        "value": "2.000+",
        "label": "usuários"
      },
      {
        "value": "400+",
        "label": "EC2 gerenciadas"
      }
    ],
    "footerHtml": "Documento gerado a partir de <a href=\"https://rodckdev.github.io/portfolio/\">rodckdev.github.io/portfolio</a> — atualizado continuamente."
  },
  "syncedAt": "2026-05-06T10:34:44.964Z"
}
