Pembuktian langsung
Terdapat pembuktian langsung untuk teorema ini. Jika dua kejadian secara statistik bebas (yakni keduanya tidak memengaruhi satu sama lainnya), maka probabilitas keduanya terjadi bersamaan sama dengan hasil kali probabilitas keduanya terjadi secara independen. Sebagai contoh, jika peluang hujan di Sydney pada hari tertentu adalah 0,3 dan peluang gempa bumi di San Fransisco pada hari itu adalah 0,008, maka peluang keduanya terjadi pada hari yang sama adalah 0,3 × 0,008 = 0,0024.
Misalnya mesin tik mempunyai 50 tombol, dan kata yang perlu diketik adalah "banana". Dengan mengetik secara acak, peluang huruf pertama yang diketik merupakan b adalah 1/50, dan kemungkinan huruf ke dua yang diketik merupakan a juga adalah 1/50, dst. Sehingga peluang enam huruf pertama merupakan banana adalah
- (1/50) × (1/50) × (1/50) × (1/50) × (1/50) × (1/50) = (1/50)6.
Dengan alasan yang sama, peluang enam huruf selanjutnya merupakan banana juga (1/50)6, dst.
Dari perhitungan di atas, peluang untuk tidak mengetik banana dalam 6 blok huruf yang diberikan adalah 1 − (1/50)6. Karena setiap blok diketik secara independen, peluang Xn dari tidak mengetik banana di setiap n blok pertama enam huruf adalah:
Seiring dengan meningkatnya n, Xn menjadi semakin kecil. Untuk n satu juta, Xn kira-kira 0,9999 (yakni peluang tidak mengetik banana kira-kira 99,9%), tetapi untuk n 10 miliar, Xn adalah kira-kira 0,53 (yakni peluang tidak mengetik banana adalah kira-kira 53%), demikian pula untuk n 100 miliar, peluangnya adalah 0,0017. Seiring n mendekati takhingga, probabiltas Xn mendekati nol; yakni dengan membuat n cukup besar, Xn dapat dibuat sekecil yang diinginkan.[1][2]
Argumen yang sama juga menunjukkan bahwa mengapa paling tidak satu di antara banyaknya monyet-monyet tak terhingga akan "hampir pasti" menghasilkan sebuah teks secepat yang akan dihasilkan oleh pengetik manusia. Dalam kasus ini Xn = (1 − (1/50)6)n, dengan Xn mewakili probabilitas bahwa tidak ada n monyet pertama yang mengetik banana secara tepat pada usaha pertama mereka. Ketika terdapat 100 miliar monyet, probabilitas ini menurun menjadi 0,17%, seiring dengan meningkatnya jumlah n monyet, nilai Xn mendekati nol. Limit n mendekati takterhingga adalah nol.
Untai takhingga
Kedua pernyataan di atas dapat dinyatakan secara lebih umum dan lebih ringkas menggunakan konsep untai, yang merupakan barisan karakter yang dipilih dari sejumlah alfabet terhingga:
- Diberikan sebuah untai karakter takhingga di mana setiap karakter dipilih secara merata dan acak, setiap untai karakter terhingga yang diberikan hampir pasti merupakan sub-untai dari untai takhingga tersebut pada beberapa posisi (dan sesungguhnya pada banyak tak terhingga posisi).
- Diberikan sebuah barisan takhingga dari untai takhingga, di mana setiap karakter dari setiap untai dipilih secara merata dan acak, setiap untai terhingga yang diberikan hampir pasti merupakan prefiks dari salah satu untai-untai takhingga ini (dan sesungguhnya merupakan prefiks dari tak terhingga banyaknya untai-untai pada barisan)
Untuk teorema ke dua, misalkan Ek adalah kejadian bahwa untai ke-k dimulai dengan teks yang diberikan. Karena ia memiliki probabilitas p bukan nol yang tetap, Ek-nya adalah independen, dan penjumlahan di bawah ini divergen,

probabilitas bahwa takhingga banyaknya Ek yang terjadi adalah 1. Teorema pertama ditunjukkan dengan cara yang sama; seseorang dapat membagi untai acak menjadi beberapa blok yang tidak saling tumpang tindih dan menentukan ukuran blok ini dengan ukuran teks yang diinginkan, menjadikan kejadian Ek sebagai kejadian di mana blok ke-k sama dengan untai yang diinginkan.[3]
Probabilitas
Dengan mengabaikan tanda baca, spasi, dan kapitalisasi, seekor monyet yang mengetik huruf-huruf secara merata dan acak mempunyai peluang 1/26 untuk mengetik huruf pertama dari Hamlet. Ia mempunyai peluang 1/676 (26 × 26) untuk mengetik dua huruf pertama Hamlet tersebut. Karena probabilitasnya menurun secara eksponensial, untuk 20 huruf, ia hanya akan mempunyai peluang 1 di antara 2620 = 19.928.148.895.209.409.152.340.197.376 (hampir 2 x 1028). Dalam kasus keseluruhan teks Hamlet, probabilitasnya adalah sangat-sangat kecil. Teks Hamlet mengandung sekitar 130.000 huruf.[4] Sehingga terdapat probabilitas 1 di antara 3,4 × 10183.946 untuk mendapatkan teks ini benar pada usaha pertama. Jumlah rata-rata huruf yang perlu diketik sampai teks ini muncul juga adalah 3,4 × 10183.946.[5]
Bahkan jika seluruh alam semesta dipenuhi oleh monyet-monyet yang mengetik setiap saat, probabilitas total mereka untuk menghasilkan Hamlet masih lebih kecil dari 1 di antara 10183,800.