Kasus Singkat Statistik
Hamming membuka Bab 27 dengan cerita. Seorang teman ahli statistik di Bell Labs merasa bahwa pengukuran dalam studi tersebut tidak akurat. Dia bertengkar dengan kepala departemen, yang menolak pengukuran ulang - 'alat-alat tersebut memiliki label perunggu yang mengatakan mereka akurat dan petugas saya dapat diandalkan.'
Pada Senin, statistikawan itu tiba dan mengatakan dia telah meninggalkan tasnya di kereta dan kehilangan semua data. Tidak ada yang bisa dilakukan kecuali mengukur ulang. Ketika pengukuran baru tiba, statistikawan itu mengeluarkan catatan asli - menunjukkan seberapa jauh mereka keliru. Dia tidak populer untuk langkah tersebut, tetapi ketidakakuratan tersebut kini tidak dapat diragukan.
Hamming mengambil pelajaran yang lebih sulit dari kasus lain: studi pola panggilan telepon yang direkam oleh perangkat pusat yang sama yang menempatkan panggilan. Suatu hari, statistikawan itu melihat panggilan yang dibebankan ke kantor pusat yang tidak ada. Setelah memeriksa lebih lanjut, dia menemukan persentase besar panggilan yang terhubung - selama beberapa menit - ke kantor pusat yang tidak ada. Mesin tersebut menghasilkan data yang salah tentang operasinya sendiri. Anda tidak dapat mengandalkan mesin untuk mengumpulkan data tentang dirinya sendiri dengan benar.
Contohnya ketiga: saudaranya di Departemen Polusi Udara Los Angeles, yang menemukan perlu untuk menangani, menyetel ulang, dan mengkalibrasi kembali setiap alat baru yang diterima, tanpa peduli dengan klaim pabrikan.
Aturan Hamming: selalu periksa data dengan hati-hati sebelum memprosesnya. Plot-kan. Cari pola yang tidak seharusnya ada. Periksa untuk ketidakselarasan. Terlepas dari seberapa penting jawaban tersebut, pertama-tama tes data sebelum dipercaya.
Pengujian Data Sebelumnya
Studi inventaris Hamming: dia menerima 18 bulan catatan inventaris untuk ~100 barang dan percaya buta pada jaminan pemasok bahwa ketidakselarasan telah dihapus. Di akhir proyek, dia menemukan ketidakselarasan sisa - entri yang tidak dapat terjadi tanpa kesalahan (misalnya, pengeluaran dari inventaris yang kosong).
Ia menyimpulkan: 'Saya harus mencari dan mengeliminasi mereka terlebih dahulu, lalu menjalankan data lagi. Dari pengalaman itu, saya belajar tidak pernah memproses data sebelum memeriksa dengan hati-hati untuk mengidentifikasi kesalahan.'
Dua Jenis Kesalahan
Setiap pengukuran fisika memiliki dua jenis kesalahan:
Kesalahan acak: variasi tidak terprediksi di sekitar nilai yang benar. Ini mengikuti distribusi (sering hampir Gaussian) yang berpusat pada nilai yang benar. Kesalahan acak dibatalkan dengan rata-rata: ambil cukup pengukuran dan rata-rata mendekati nilai yang benar.
Kesalahan sistematis (bias): offset konsisten ke satu arah. Semua pengukuran Anda tergeser oleh jumlah yang sama. Jumlah pengukuran yang banyak tidak dapat menghilangkan bias, karena rata-rata dari banyak pengukuran yang bias tetap bias.
Contoh Hamming dari fisika: meja dari 10 konstanta dasar (kecepatan cahaya, jumlah Avogadro, muatan elektron, dll.) disusun dan kemudian disusun kembali 24 tahun kemudian dengan alat yang lebih baik. Secara rata-rata, nilai baru jatuh 5.267 kali di luar batas kesalahan yang lama. Ini tidak mungkin dari kesalahan acak sendiri - kesalahan acak yang besar ini dapat terdeteksi. Penjelasan: alat yang lama memiliki kesalahan sistematis yang tidak tertangkap dalam ketidaktentuan yang dinyatakan, dan teknik itu sendiri memiliki kelemahan yang disebarkan melalui komunitas.
Komentar Shannon: 'Kalibrasi adalah hal terpenting dalam pengukuran.' Kalibrasi mengatasi kesalahan sistematik. Jika alat ukur Anda secara konsisten membaca 3% terlalu tinggi, tidak ada jumlah pengukuran ulang yang dapat memperbaiki hal itu - Anda harus kalibrasi.
Mengidentifikasi Kesalahan Sistematik
Konstanta Hubble: laju di mana universa ekspansi, diukur dari hubungan redshift-jarak galaksi. Beberapa kelompok independen telah mengukur hal ini selama 50 tahun terakhir. Secara historis, banyak nilai yang diterbitkan jatuh di luar batang peluru lainnya yang diterbitkan - yang berarti perselisihan lebih besar dari ketidakpastian yang disebutkan.
Bagaimana Anda Menguji Ketersediaan yang Tidak Bisa Diuji?
Hamming menghadapi masalah yang tidak memiliki solusi yang jelas, tetapi yang setiap insinyur praktisi akan menghadapi: Bagaimana Anda menguji ketersediaan perangkat saat tes sendiri lebih lama dari yang Anda miliki, dan perangkat tes Anda kurang andal dari perangkat yang Anda uji?
Skenario: suatu perangkat harus bertahan selama 20 tahun di lapangan (175.000 jam). Laboratorium uji kehidupan Anda hanya dapat menangani 10.000 jam operasi. Anggaran waktu uji Anda adalah 3 bulan (sekitar 2.000 jam). Perangkat tersebut diharapkan akan menghadapi suhu operasi hingga 85°C di lapangan.
Pengujian ditingkatkan: jalankan perangkat pada suhu 105°C dan asumsikan kegagalan terjadi 10× lebih cepat daripada pada 85°C (suatu aturan jari tangan teknik umum). Maka 2.000 jam pada 105°C 'mewakili' 20.000 jam pada 85°C. Tetapi apakah itu benar?
Masalahnya: mode kegagalan pada 105°C mungkin berbeda dari mode kegagalan pada 85°C. Jika sambungan solder mengalami kegagalan oleh fatiga panas pada 85°C namun oleh oksidasi pada 105°C, tes ditingkatkan tidak memberi tahu Anda sesuatu yang berguna tentang waktu kehidupan lapangan.
Nasihat Shannon berlaku: kalibrasi — memahami apa yang pengukuran Anda sebenarnya ukur — adalah langkah kritis. Pengujian ditingkatkan mengkalibrasi suhu terhadap laju kegagalan hanya jika mode kegagalan yang sama. Verifikasi ini membutuhkan studi terpisah.
Desain Uji Kehidupan
Anda adalah insinyur keandalan untuk perangkat medis yang diimplantasikan di tubuh manusia. Harus bertahan 10 tahun (87.600 jam). Anggaran laboratorium Anda hanya memungkinkan tes selama 6 bulan (4.380 jam). Perangkat tersebut beroperasi pada suhu tubuh (37°C).