un

guest
1 / ?
back to lessons

Gráficos Log-Log e Saturação

A velocidade de cálculos seguiu uma curva de crescimento exponencial por 50 anos. Em um gráfico log-linear (log de velocidade vs tempo linear), isso aparece como uma linha reta com declividade b = taxa de crescimento em ordens de magnitude por ano.

Limites físicos impõem um teto horizontal: uma velocidade máxima S_max determinada pelo tamanho molecular, velocidade da luz e restrições de calor. À medida que o crescimento exponencial se aproxima de S_max, o crescimento deve diminuir.

Saturação Logística

Um modelo comum para crescimento com teto:

S(t) = S_max / (1 + e^(−r(t − t₀)))

Este é a equação logística aplicada à tecnologia. Em tempos iniciais (t << t₀): S(t) ≈ S_max × e^(r(t−t₀)) — puramente exponencial. Perto do teto (t >> t₀): S(t) → S_max de maneira assintótica.

A geometria: uma linha reta em coordenadas log-linear curva na direita perto do teto, produzindo uma S em forma quando visualizado em coordenadas linear-linear.

Geometria de Hardware: Lei de Amdahl e Esfera de Velocidade da Luz

Em que Ano a Crescimento Satura?

Suponha que a velocidade de um único processador cresça em 10^(0,09t) a partir de 10⁰ operações por segundo em 1940. Teto físico: S_max = 10^(12) operações por segundo (uma estimativa grosseira para um processador único, limitado por restrições térmicas e de velocidade da luz).

Usando S(t) = 10^(0,09·t) (t = anos desde 1940), encontre o ano em que S(t) atinge 10¹⁰ (aproximando o teto). Mostre oálculo. Então, compute: quantas duplicações de velocidade ocorrem entre 1952 (IBM 701) e esse ano de teto? Use tempo de duplicação = ln(2)/b onde b = 0,09 × ln(10).

Raio Máximo de Comunicação

A velocidade do relógio de um processador determina o raio máximo dentro do qual ele pode se comunicar em um ciclo. As sinalizações viajam aproximadamente 2×10⁸ m/s em cobre.

Para um período de relógio T (em segundos), o raio máximo de comunicação de ida única:

r_max = v × T / 2

(divida por 2 para o percurso de ida e volta: o sinal deve sair e retornar dentro de T)

À medida que a velocidade do relógio aumenta, T diminui, então r_max diminui. Essa restrição geométrica obriga os componentes a se aglomerarem mais perto - reduzindo a área da placa - ou aceitar latência de múltiplos ciclos para comunicação off-chip.

A Esfera de Influência

Todos os componentes alcançáveis dentro de um ciclo de clock formam uma esfera de raio r_max centrada no processador. Volume: V = (4/3)π r_max³.

Se a densidade de componentes for ρ (componentes/m³), o número de componentes alcançáveis dentro de um ciclo: N = ρ × V = ρ × (4/3)π r_max³.

À medida que r_max diminui com o aumento da velocidade do relógio, N diminui cubicamente - um aumento de 2× na velocidade do relógio reduz o número de componentes alcançáveis em (1/2)³ = 1/8.

Componentes Alcançáveis por Ciclo de Clock

Uma estação de trabalho de 1993 opera a 100 MHz (T = 10 ns). Velocidade de sinal = 2×10⁸ m/s. Densidade de componentes em uma placa de circuito ≈ 10⁸ componentes/m³ (estimativa grosseira que inclui chips, resistores, capacitores).

Uma GPU moderna opera a 2 GHz (T = 0.5 ns).

Para o trabalho de estação de trabalho de 100 MHz (T=10 ns, v=2×10⁸ m/s, ρ=10⁸/m³): compute r_max, então V = (4/3)π r_max³, então N = ρ × V. Então compute o mesmo N para um processador de 2 GHz (mesma ρ, mesma v). Qual é a razão N(100MHz) / N(2GHz)?

O Limite de Aceleração de Processadores Únicos

A velocidade de processadores únicos se aproxima de teto físico. A resposta do setor: arquiteturas paralelas. A Lei de Amdahl quantifica a aceleração de velocidade alcançável pela paralelização.

Lei de Amdahl

Suponha que uma fração f de um programa pode ser paralelizado, e a fração (1−f) deve ser executada em série. Com p processadores:

Aceleração(p) = 1 / ((1−f) + f/p)

Quando p → ∞: Aceleração_max = 1 / (1−f)

A fração serial (1−f) estabelece um teto rígido na aceleração alcançável, independentemente de quantos processadores você adicionar.

Visão geométrica: A aceleração como função de p segue uma curva hiperbólica. A assíntota é 1/(1−f). Para f = 0,9, a aceleração máxima é 10, mesmo com processadores infinitos. Para f = 0,99, a aceleração máxima é 100.

A lição implícita de Hamming: o interesse em arquiteturas paralelas era real, mas o ganho dependia inteiramente de quanto a carga de trabalho era paralelizável - um fato que muitos otimistas da computação paralela ignoraram.

Computação da Aceleração Paralela

Uma simulação científica leva 1000 segundos para ser executada em um único processador. Aprofundando revela: 200 segundos em uma fase de inicialização serial (não pode ser paralelizada); 800 segundos em uma fase de cálculo paralelo.

Calcule a fração paralela f. Usando a Lei de Amdahl, calcule Aceleração(4), Aceleração(16), Aceleração(∞). Mostre cada aplicação de fórmula. Em seguida, interprete: é válido investir em processadores adicionais de 16 para ∞ no custo de hardware? O que a geometria diz sobre os retornos decrescentes?