Storage Blog..

a peaceful place to turn knowledge into power. All about storage technology, best practices, ideas.. you name it.

Best practice on SAN Management

Ditulis oleh Iwan Sulistyawan di/pada Juli 30, 2009

best-practice Belum lama ini ada seorang sahabat saya yang dipindahtugaskan ke salah satu anak perusahaan. Di sana dipercayakan untuk pegang beberapa area termasuk storage management. Tulisan kali ini saya dedikasikan buat ribut sinandhi yang sekarang juga handle storage area ini di kantor barunya. (ini lanjutan dari transfer knowledge yang kemaren, bir..)

Berikut ini adalah beberapa best practice seputar SAN management yg perlu diimplementasikan pada area kerja storage management..

1. Dokumentasi
Maintain dokumentasi seputar SAN yang dimanage. Type devicenya, utilisasinya, performance, koneksi, etc.. yang dimaksud dengan maintain ini bukan sekali dibuat terus dibiarin.. tapi diperbaharui secara berkala & di review secara berkala juga. Banyak banget facts yang bisa didapat dari dokumentasi yang di review secara berkala. Misalnya error, updates bahkan bisa juga dipakai untuk capacity planning. Dokumentasi ini sebaiknya dikumpulkan dalam satu tempat yang bisa dibaca bareng2 seluruh team.

Ada beberapa tools yang dapat digunakan untuk mendapatkan informasi2 ini. Informasi detail bisa didapat dengan manfaatkan tools2 dari masing2 device untuk capture hal2 yg diperlukan tsb. Dan jangan lupa untuk direview secara berkala bersama team..

2. Backup regular
Backup perlu dilakukan secara teratur, terutama sebelum dilakukan modifikasi konfigurasi perangkat. Task ini penting banget untuk menghindari data lost yang bisa aja terjadi karena human error ataupun hardware failure.

switches : export zoning dan fabric configuration detail secara reguler. Bisa dilakukan secara manual oleh sysadmin atau automated dengan tools.. yg kedua ini pastinya lebih recommended. Apalagi kalau jumlah switchnya cukup banyak. Switch log juga perlu di backup secara reguler untuk keperluan trouble shoot.

storage :  array configuration & LUN masking information.

3. Monitor availability & performance
Monitor availability & performance ini sama seperti mobil dengan indikator2 di dashboardnya. Kita perlu tahu kalau bensin masih penuh atau hampir habis, temperatur mesin, speed saat mengendarai, dll. Tanpa indikator2 ini bisa saja mobil tetap jalan tapi ada resiko2 yang siap menghadang.. bisa saja tiba tiba mati di jalan karena kehabisan bensin.. atau mesin overheat.. atau performance tidak optimal. Sayangkan punya ferari kalau cuman jalan 2 km/jam karena nggak ada indikator rem tangan. Begitulah kira2 analogi pentingnya monitor ini..

Berikut ini titik2 yang bisa berpotensi bottleneck & patut di monitor
Host performance: Application, Database, file system, OS, host device (cpu, memory, HBA, etc)
Switch/fabric performance : ports, ISL, memory buffer
Storage performance: storage frontend ports, cache, storage backend port, disks, LUNs

Yang enak siih kalau bisa gunakan tools monitoring yang komprehensive dari host-fabric-storage. Ada banyak koq tools storage resource management. Sayangnya tools ini cukup pricy.. (mmmh.. kalau promosiin SRM di sini bisa dapet diskon gede nggak yaah??… :) ). Kalaupun nggak menggunakan tools yang komprehensive macam ini, minimal masing2 bagian memonitor yg menjadi area tanggung jawabnya. Sys admin, DBA, app admin, storage admin, network admin, dll. perlu diperkuat knowledge dan tools2nya masing2..

Gunakan tools2 yang dapat mengirimkan realtime atau near realtime alert. Sehingga begitu ada problem bisa segera dikenali. Beberapa tools mampu memprediksi sebelum terjadinya fault misalnya dengan mendeteksi bit error rate, atau jumlah gagal tulis ke block disks dalam sebuah HDD, dll.. dengan tools semacam ini kita bisa antisipasi sebelum benar2 terjadi failure.

4. Security
Keamanan selalu berbanding terbalik dengan kenyamanan. Semakin aman kita memproteksi sesuatu semakin banyak kenyamanan2 yang dikorbankan.  Tapi keamanan perlu doong.. apalagi yang kita handle adalah data.

ini beberapa hal yang perlu dilakukan berkaitan dengan security.
physical access
Perangkat2 harus diletakkan dalam ruangan yang terlindungi secara fisik. Misalkan dalam ruangan datacenter dengan finger print access dan CCTV. Hanya user2 yang memiliki hak akses saja yang bisa boleh mengakses secara fisik maupun logic baik untuk merubah konfigurasi atau sekedar monitoring perangkat.

Logical access
Terapkan zoning policy pada SAN fabric, LUN masking pada storage array. Rubah default username/password pada perangkat. Ganti password user secara berkala. Untuk environment yang besar bisa juga menggunakan radius server untuk centralized accaunt/password sehingga lebih mudah untuk mengganti secara reguler akses ke semua perangkatnya. Selain itu juga perlu menggunakan network segment yang terpisah antara management segment dengan segment user data. Jangan lupa untuk mengaktifkan log dan cek log secara berkala.

mmhh.. apalagi yaa??.. kurang lebih inilah yang sepatutnya dilakukan sebagai best practice untuk SAN management.. secara general best practice ini bisa digunakan untuk area2 yang lain di bidang IT. Saya sangat menghargai kalau ada tambahan dari temen2 yang baca artikel ini supaya wawasan kita bisa bertambah bersama dan kita bisa berkembang bersama..

:)

Banyak tools yang digunakan untuk mendapatkan informasi2 ini.

Tinggalkan Balasan

XHTML: Anda dapat gunakan tag ini: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <pre> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>