un — Geometria do Des-Hamming

un

guest

1 / ?

back to lessons

A Intuição Geométrica de Hamming

Hamming Via Geometria Em Toda Parte

O Capítulo 9 de Hamming começa com um aviso: a intuição geométrica colapsa em dimensões altas. Em 3D, uma esfera preenche a maioria do cubo que a contém. Em 10D, a esfera ocupa menos de 0,2% do volume do cubo. Em 100D, a fração arredonda para zero. O volume se concentra perto da superfície. Os pontos se agrupam perto dos cantos, não no centro.

Seus códigos de correção de erros exploravam isso diretamente. Os códigos de Hamming empacotam palavras codificadoras em espaço binário n-dimensional de forma que cada palavra codificadora esteja circundada por uma esfera de erros corrigíveis. A geometria determina quantos erros você pode corrigir. O empacotamento de esferas no espaço n-dimensional é um problema matemático com estacas reais: empacote as esferas mais densamente, corrija mais erros.

O mesmo modo de falha geométrico se aplica às complexidades algorítmicas. Em pequena N, O(N²) e O(N) parecem quase idênticos em um gráfico. A diferença entre eles parece administrável. Em grandes N, a diferença explode - exatamente como o volume da esfera colapsa em dimensões altas. O que parece prático em pequena escala se torna impossível em escala.

A Forma de Cada Classe de Complexidade

Desenhando Complexidade

Cada classe de complexidade tem uma forma geométrica:

- O(1): uma linha horizontal. O mesmo custo independentemente de N. Sem inclinação.

- O(log N): uma curva ligeiramente ascendente que se nivela. Duplica a cada tempo N quadrado. Cresce proporcionalmente ao número de dígitos em N.

- O(N): uma linha diagonal passando pelo ponto de origem. O custo cresce proporcionalmente a N.

- O(N log N): uma linha diagonal ligeiramente mais inclinada. Uma linha que curva muito levemente para cima.

- O(N²): uma parábola. Em N = 100: 10.000 operações. Em N = 1.000: 1.000.000 operações.

'Curvas de Crescimento de Complexidade'

A insígnia crítica: a razão entre duas classes de complexidade é uma função de N em si. Em N = 10, O(N²) custa 10× mais do que O(N). Em N = 1.000, O(N²) custa 1.000× mais. Em N = 1.000.000, custa 1.000.000× mais. A diferença não apenas cresce - ela cresce à taxa de N mesmo.

Este é o argumento geométrico para entender por que as correções do MOAD-0001 importam. Mover um resolutor de dependências de O(N²) para O(N) não é uma aceleração constante. A N=50.000 pacotes, é uma aceleração de 50.000×. A N=100.000, é uma aceleração de 100.000×. O valor da correção cresce com o tamanho do problema.

A Brecha Aumentando

O(N²) e O(N) ambos produzem resultados corretos.

A N=10: O(N²) custa 100 operações, O(N) custa 10 operações. Razão: 10×.

A N=1.000: O(N²) custa 1.000.000 operações, O(N) custa 1.000 operações.

Quantas vezes o O(N²) é mais lento em relação ao O(N) em N=1.000? Qual é a forma geométrica que descreve a brecha crescente entre essas duas curvas à medida que o N cresce?

Gráficos como Geometria

O Gráfico Direcionado Acíclico

Um DAG (gráfico direcionado acíclico) é uma estrutura geométrica: nós conectados por bordas direcionadas sem ciclos. Gráficos de dependências de softwares, pipelines de construção e arquiteturas de fluxo de dados formam DAGs.

Modelo de Fábrica DAG com Nós Workaholic & Glutton

Cada nó carrega propriedades geométricas medidos pelo número de suas bordas:

- Entradas: número de bordas chegando ao nó. Altas entradas significam muitas dependências upstream alimentando esse nó.

- Saídas: número de bordas saindo do nó. Altas saídas significam muitos consumidores downstream que dependem desse nó.

- Entreza: entradas + saídas. Mede quantas caminhos passam por esse nó. Um nó de alta entreza fica em uma intersecção no gráfico.

- Pontuação de surto: aceleração × entradas. Mede quantas tarefas inundam downstream quando esse gargalo é liberado.

O modelo de fábrica dá a estas propriedades geométricas significado físico:

- Alta betweeness + alta pontuação de surto = nó trabalhador. Remova este gargalo sem etapas downstream = colapso.

- Alta saída - baixa pontuação de surto = nó glutton. Consome sem produzir. A máquina que esquece de parar.

Surge & Betweenness na Prática

Lendo um DAG

Considere uma cadeia de 5 nós: A → B → C → D → E, mais uma borda adicional B → D.

- A: grau de entrada 0, grau de saída 1, betweeness 1. Nó fonte. Nada o alimenta. Um consumidor.

- B: grau de entrada 1 (de A), grau de saída 2 (para C e para D), betweeness 3. Alimenta dois nós downstream — um ponto de ramificação.

- C: grau de entrada 1 (de B), grau de saída 1 (para D), betweeness 2. Um nó de passagem.

- D: grau de entrada 2 (de B e de C), grau de saída 1 (para E), betweeness 3. Recebe de dois caminhos.

- E: grau de entrada 1 (de D), grau de saída 0, betweeness 1. Nó de destino.

B e D compartilham a maior betweeness (3). B é o nó de ramificação: alimenta dois nós. D é o ponto de convergência: recebe de dois caminhos. Depois de uma atualização MOAD-0001 em C, D recebe surto de ambos os caminhos B→D e C→D simultaneamente.

Calculando Métricas de Nó

Um gráfico de dependência: A → B → C → D → E (uma cadeia), mais uma borda adicional B → D.

O nó C tem uma aceleração medida de 50× após uma atualização MOAD-0001.

Calcule o grau de entrada, grau de saída, betweeness e pontuação de surto do nó C. Qual nó corre o maior risco de MOAD-0005 após a atualização e por quê?

O Defeito do Flatland

MOAD-0007: Dados Espaciais Consultados como Uma Lista Planar

MOAD-0007 (o Defeito do Flatland): dados espaciais consultados como uma lista planar ignora a estrutura geométrica dos dados. Cada consulta verifica todos os N objetos. O(N) por consulta. Com M consultas: O(M × N). Em escala: catastrófico.

BVH vs Lista Espacial de Consulta

Um raycaster em tempo real verifica todos os objetos em uma cena contra cada raio. A 60 quadros por segundo, com 100 raios por quadro e 10.000 objetos na cena: 60.000.000 de testes de interseção por segundo. Todos evitáveis.

A visão geométrica: o espaço tem estrutura. Os objetos se agrupam. Um raio que erra a metade esquerda da cena erra todos os objetos na metade esquerda. Uma lista planar não pode explorar isso - verifica todos os objetos independentemente da localização espacial. Uma estrutura de dados espacial pode.

O BVH: Busca Binária em 3D

Como Funciona um BVH

Um BVH (Bounding Volume Hierarchy) decompe o espaço 3D em uma árvore de caixas delimitadoras aninhadas. Cada nó interno armazena uma caixa delimitadora que contém toda a geometria de seus filhos.

Uma consulta de raycast:

1. Teste a caixa delimitadora raiz. Se o raio falha, saia imediatamente - a cena inteira é eliminada.

2. Se o raio acerta, faça recursão nos filhos. Teste a caixa delimitadora de cada filho.

3. Para cada filho que falha: elimine esse ramo. Para cada filho que atinge: faça recursão mais profunda.

4. Em nós folha: teste a geometria real.

Geometria da eliminação: em cada nível, os ramos que não interseccionam são eliminados. Com um BVH balanceado de profundidade d: 2^d nós folha existem, mas um único raio precisa de, no máximo, O(log N) comparações para o caminho eliminado.

Isso é a mesma argumentação geométrica da busca binária: cada comparação reduz a metade do espaço de busca restante. A busca binária reduz uma matriz ordenada. Um BVH reduz o espaço 3D visível. A estrutura é idêntica - uma árvore binária balanceada com eliminação em cada nó.

Uma solução para MOAD-0007: substitua a lista planar por um BVH. Mude de O(N) por consulta para O(log N) por consulta. Em N=1.024 objetos, O(log₂ 1.024) = 10 comparações em vez de 1.024.

Calculando o Aceleração do BVH

Uma cena de jogo tem 1.024 objetos.

Sem uma BVH: um raycast verifica todos os 1.024 objetos.

Com uma BVH balanceada de profundidade 10 (2^10 = 1.024 folhas): um raycast percorre no máximo 10 níveis, com 2 comparações de filho por nível.

Estime o número máximo de verificações de caixa delimitadora que o BVH precisa para um raycast e calcule a aceleração em comparação com a varredura planar.