un — Hamming Bab 27: Data Tidak Dapat Diandalkan

un

tamu

1 / ?

kembali ke pelajaran

Tas Ahli Statistik

Hamming membuka Bab 27 dengan sebuah cerita. Seorang teman ahli statistik di Bell Labs mencurigai bahwa pengukuran dalam sebuah studi tidak akurat. Dia berdebat dengan kepala departemen, yang menolak pengukuran ulang — 'alat-alat ini memiliki label logam yang mengatakan mereka seakurat itu, dan orang-orang saya dapat diandalkan.'

Pada hari Senin, ahli statistik tiba dan mengatakan dia telah meninggalkan tasnya di kereta dan kehilangan semua datanya. Tidak ada yang bisa dilakukan selain mengukur ulang. Ketika pengukuran baru tiba, ahli statistik menghasilkan catatan aslinya — menunjukkan seberapa jauh mereka telah meleset. Dia tidak populer karena langkahnya, tetapi ketidakakuratan itu sekarang tidak dapat disangkal.

Hamming menarik pelajaran yang lebih keras dari kasus lain: sebuah studi tentang pola panggilan telepon, sedang direkam oleh peralatan kantor pusat yang sama yang menghubungkan panggilan. Suatu hari ahli statistik memperhatikan panggilan yang ditagihkan ke kantor pusat yang tidak ada. Melihat lebih jauh, dia menemukan persentase besar panggilan terhubung — selama beberapa menit — ke kantor yang tidak ada. Mesin menghasilkan data buruk tentang operasinya sendiri. Anda tidak dapat mempercayai mesin untuk mengumpulkan data tentang dirinya sendiri dengan benar.

Contoh ketiganya: kakaknya di departemen Polusi Udara Los Angeles, yang menemukan perlu untuk membongkar, merangkai ulang, dan mengkalibrasi ulang setiap instrumen baru yang mereka terima, terlepas dari klaim pabrikan.

Aturan Hamming: selalu periksa data dengan hati-hati sebelum memprosesnya. Plotnya. Cari pola yang seharusnya tidak ada. Periksa ketidaksesuaian. Tidak peduli betapa mendesak jawabannya, uji data terlebih dahulu.

Kesalahan Acak, Kesalahan Sistematis & Rantai Kalibrasi

Pengujian Data Awal

Studi inventori Hamming: dia menerima 18 bulan catatan inventori untuk ~100 item dan naif percaya jaminan pemasok bahwa ketidaksesuaian telah dihapus. Terlambat dalam proyek, dia menemukan ketidaksesuaian sisa — entri yang tidak bisa terjadi tanpa kesalahan (misalnya, penarikan dari inventori kosong).

Dia menyimpulkan: 'Saya harus menemukan mereka terlebih dahulu, kemudian menghilangkannya, dan kemudian menjalankan data semuanya lagi. Dari pengalaman itu saya belajar untuk tidak pernah memproses data apa pun sebelum saya telah memeriksa dengan hati-hati untuk kesalahan.'

Jelaskan tiga pemeriksaan konsistensi spesifik yang akan Anda terapkan pada dataset baru sebelum mempercayainya untuk analisis. Untuk setiap pemeriksaan, jelaskan jenis kesalahan apa yang akan ditangkapnya — dan mengapa jenis kesalahan itu mungkin ada di data meskipun jaminan pemasok.

Dua Jenis Kesalahan

Setiap pengukuran fisik membawa dua jenis kesalahan:

Kesalahan acak: variasi yang tidak dapat diprediksi di sekitar nilai sebenarnya. Ini mengikuti distribusi (sering kali sekitar Gaussian) yang berpusat pada nilai sebenarnya. Kesalahan acak membatalkan dengan rata-rata: ambil cukup pengukuran dan mean mendekati nilai sebenarnya.

Kesalahan sistematis (bias): offset yang konsisten dalam satu arah. Semua pengukuran Anda bergeser dengan jumlah yang sama. Tidak ada jumlah rata-rata yang menghapusnya, karena mean dari banyak pengukuran yang bias masih bias.

Contoh Hamming dari fisika: tabel dari 10 konstanta fundamental (kecepatan cahaya, bilangan Avogadro, muatan elektron, dll.) dikompilasi, dan kemudian dikompilasi ulang 24 tahun kemudian dengan instrumen yang ditingkatkan. Secara rata-rata, nilai-nilai baru jatuh 5.267 kali di luar batas kesalahan yang dinyatakan sebelumnya. Ini tidak masuk akal dari kesalahan acak saja — kesalahan acak sebesar ini akan dapat dideteksi. Penjelasannya: alat-alat lama memiliki kesalahan sistematis yang tidak ditangkap dalam ketidakpastian yang dinyatakan, dan teknik-teknik itu sendiri memiliki cacat bersama yang dilewatkan melalui komunitas.

Komentar Shannon: 'Kalibrasi adalah hal terpenting dalam pengukuran.' Kalibrasi mengatasi kesalahan sistematis. Jika instrumen Anda secara konsisten membaca 3% terlalu tinggi, tidak ada jumlah pengukuran berulang yang memperbaikinya — Anda harus mengkalibrasi.

Mengidentifikasi Kesalahan Sistematis

Konstanta Hubble: laju di mana alam semesta berkembang, diukur dari hubungan redshift-jarak galaksi. Beberapa kelompok independen telah mengukurnya selama 50 tahun terakhir. Secara historis, banyak nilai yang dipublikasikan jatuh di luar batas kesalahan dari nilai yang dipublikasikan lain — artinya ketidaksepakatan itu lebih besar dari yang diprediksi ketidakpastian yang dinyatakan.

Jelaskan mengapa pengukuran independen dari konstanta Hubble dapat masing-masing memiliki kesalahan acak yang dinyatakan kecil tetapi masih tidak setuju dengan jumlah yang lebih besar daripada kesalahan tersebut. Jenis kesalahan apa yang menyebabkan pola ini, dan bagaimana Anda akan membedakannya dari kesalahan acak secara eksperimental?

Bagaimana Anda Menguji Apa yang Tidak Dapat Anda Uji?

Hamming mengajukan masalah tanpa solusi yang bersih, tetapi yang setiap engineer praktis akhirnya hadapi: Bagaimana Anda menguji perangkat untuk keandalan ketika pengujian itu sendiri memakan waktu lebih lama daripada yang Anda miliki, dan peralatan pengujian Anda kurang dapat diandalkan daripada perangkat yang Anda uji?

Skenarionya: perangkat harus bertahan 20 tahun di lapangan (175.000 jam). Laboratorium pengujian daya tahan Anda dinilai untuk 10.000 jam operasi. Anggaran periode pengujian Anda adalah 3 bulan (sekitar 2.000 jam). Perangkat diharapkan menghadapi suhu operasi hingga 85°C di lapangan.

Pengujian yang dipercepat: jalankan perangkat pada 105°C dan asumsikan kegagalan terjadi 10× lebih cepat daripada pada 85°C (aturan praktis rekayasa umum). Kemudian 2.000 jam pada 105°C 'mewakili' 20.000 jam pada 85°C. Tetapi apakah itu?

Masalahnya: mode kegagalan pada 105°C mungkin berbeda dari mode kegagalan pada 85°C. Jika sambungan solder gagal karena kelelahan termal pada 85°C tetapi karena oksidasi pada 105°C, pengujian yang dipercepat tidak mengatakan Anda apa pun yang berguna tentang masa pakai di lapangan.

Saran Shannon berlaku: kalibrasi — memahami apa yang sebenarnya diukur pengukuran Anda — adalah langkah kritis. Pengujian yang dipercepat mengkalibrasi suhu terhadap tingkat kegagalan hanya jika mode kegagalan sama. Memverifikasi ini memerlukan studi terpisah.

Merancang Pengujian Daya Tahan

Anda adalah engineer keandalan untuk perangkat medis yang ditanamkan dalam tubuh manusia. Itu harus bertahan 10 tahun (87.600 jam). Anggaran laboratorium Anda memungkinkan untuk 6 bulan pengujian (4.380 jam). Perangkat beroperasi pada suhu tubuh (37°C).

Apa masalah fundamental dengan hanya menjalankan pengujian yang dipercepat pada 50°C atau 60°C dan melakukan ekstrapolasi untuk memprediksi keandalan 10 tahun? Jelaskan setidaknya dua mode kegagalan spesifik yang mungkin dilewatkan atau salah karakterisasi pengujian yang dipercepat, dan jelaskan bukti tambahan apa yang akan Anda kumpulkan untuk memvalidasi ekstrapolasi.