Kesilapan Kecil, Bencana Besar - GitLab Pergi Luar Talian Untuk Hari
GitLab, permulaan yang merupakan alternatif kepada GitHub yang sangat popular, telah mengalami hari yang agak sukar kerana baru-baru ini Kesalahan manusia menyebabkan seluruh laman web turun untuk sehari penuh.
Masalah GitLab mula-mula bermula apabila laman web mengalami masa beban dan masalah kestabilan. Laman web telah dibawa ke luar talian untuk membetulkan isu-isu tersebut. Walau bagaimanapun, semasa penyelenggaraan, seseorang secara tidak sengaja membuat kesalahan dengan tidak sengaja memadamkan direktori yang berisi data produksi langsung 300GB.
Nasib baik untuk GitLab, kandungan yang dipadamkan sahaja isu yang terjejas dan permintaan yang digabungkan. Repositori dan wiki tidak terjejas oleh kesilapan ini dalam apa jua cara, yang bermaksud bahawa Kerosakan yang disebabkan oleh kesilapan ini tidak begitu teruk kerana ia mungkin berlaku
Dengan direktori dipadam, kakitangan GitLab segera berpaling ke arah sandarannya. Malangnya bagi mereka, GitLab berlari namun masalah lain. Menurut fail Dokumen Google yang sentiasa dikemas kini sebagai GitLab berjuang untuk mendapatkan kembali dalam talian, semua 5 sandaran / replikasi teknik yang digunakan oleh laman web gagal berfungsi dengan pasti, dan dalam beberapa kes adalah tidak pernah didirikan di tempat pertama.
Mendapatkan fail yang hilang dari awan bukan pilihan untuk GitLab sama ada sebagai permulaan yang dibuat akhir tahun lalu untuk membuang awan untuk membina dan mengendalikan cluster Ceph sendiri. Tidak perlu dikatakan, GitLab kini mempertimbangkan semula pendirian mereka mengenai topik itu.
@TheRegister @gitlab akan berusaha untuk membuat aplikasi lebih performant dan meneroka pembekal hosting awan alternatif.
- Connor Shea (@connorjshea) 1 Februari 2017
Walaupun hari yang genting yang telah dimiliki oleh GitLab, laman web kini sudah berjalan dan berjalan seperti biasa. Sementara laman web melaporkan bahawa beberapa data telah hilang semasa tetingkap enam jam, Git repositori dibiarkan tanpa luka sepanjang huru hara keseluruhan. Satu log kejadian penuh dari keseluruhan acara boleh dilihat di sini.
Walaupun ramai Pelajaran boleh dipelajari dari kesilapan kecil GitLab (terutamanya hubris), kaedah pengendalian krisis GitLab agak mengagumkan seperti permulaan adalah jelas dan telus dengan penggunanya. Berikut adalah harapan bahawa GitLab belajar dari kesilapan ini. Jika tidak, pangkalan pengguna mungkin kurang memaafkan jika sejarah mengulanginya sendiri.
Sumber: Daftar