Staffing Network Operation Center
Sumber: https://www.inoc.com/blog/staffing-a-network-operations-center
Mengawaki NOC untuk beroperasi terus menerus—tiga shift sehari, 365 hari setahun—sulit untuk direncanakan dan dikelola, belum lagi sangat mahal bagi sebagian besar corporate/lembaga yang membutuhkan dukungan ini.
Dari perspektif perencanaan, tidak ada pedoman praktis yang dapat diikuti oleh para pemimpin TI untuk menangani segala sesuatu yang masuk ke dalam operasi semacam itu, seperti:
- mengembangkan struktur operasional dan organisasi;
- mendefinisikan peran dan tanggung jawab;
- menulis specialized job description;
- membuat jadwal kerja;
- staf pelatihan;
- mengamankan tool dan lisensi;
- mengembangkan proses;
- mengelola kualitas,
…dan semua tugas penting lainnya yang perlu dilakukan dengan serius sejak awal. Tim dibiarkan merasa berkeliling dalam kegelapan untuk menyatukan semua bagian ini—selama ini mempertaruhkan bisnis/kementrian/lembaga dan pelanggan/stakeholder mereka untuk menanggung konsekuensi ketika masalah mengakibatkan pemadaman dan downtime yang mahal. Sebagian besar bisnis/kementrian/lembaga tidak mampu melakukannya karena biaya dan risiko.
Juga tidak ada pedoman untuk apa yang terjadi setelah NOC berdiri dan dikelola: mengelolanya terus-menerus—selamanya.
Menjaga NOC yang selalu aktif adalah tindakan penyeimbangan yang rumit yang membutuhkan keahlian domain khusus, metrik yang unik, dan evaluasi berkelanjutan yang bijaksana.
Kurangnya investasi di sini dapat membebani terlalu sedikit staf dengan terlalu banyak pekerjaan, yang menyebabkan kelelahan. Investasi yang berlebihan (meng-hire terlalu banyak orang untuk sebuah masalah) dapat menjadi penguras keuangan yang sangat besar bagi bisnis/kementrian/lembaga, dan masih gagal untuk mengatasi masalah yang lebih mendasar pada operasi NOC.
Karena alasan inilah (dan banyak lainnya) perusahaan sebagian atau seluruhnya meng-outsource NOC mereka ke penyedia layanan pihak ketiga ahli yang usaha intinya adalah melakukan dukungan NOC.
Berikut adalah manfaat utama outsourcing NOC sehubungan dengan kepegawaian, sekilas:
- Beban yang berat dan konstan untuk merekrut, mempekerjakan, melatih, dan mempertahankan bakat dapat di sepenuhnya di hilangkan, sehingga waktu dan perhatian kita dapat dihabiskan di tempat lain.
- Melalui skala ekonomi, tingkat dukungan yang kita terima dapat disesuaikan dengan bisnis / kegiatan kementrian/lembaga —naik atau turun— secara terduga.
- Kita dapat memanfaatkan luasnya pengalaman dan keahlian yang tidak mungkin untuk dibeli atau dihasilkan secara internal.
Singkatnya, orang atau orang yang bertanggung jawab untuk mempekerjakan dan mengelola staf NOC 24x7 harus memahami dengan jelas apa yang mereka daftarkan di awal, dan mempertimbangkan nilai tambah dari outsourcing dengan cermat.
Apa yang di bahas di bawah ini akan membantu melakukan hal itu. Kita akan mengeksplorasi beberapa tantangan utama dalam mengatur staf NOC 24x7, sehingga kita dapat mengontekstualisasikannya untuk bisnis kita dan membuat keputusan yang paling tepat tentang bagaimana kita mendapatkan dukungan yang kita butuhkan.
Jika Anda ingin lebih banyak wawasan tentang membangun tim NOC, baca posting pendamping kami: Cara Membangun dan Mengelola Tim NOC yang Efektif
Mengembangkan Struktur Organisasi NOC
Mengawaki NOC 24x7 secara efektif dimulai dengan struktur yang terorganisir dengan baik. Sebelum kita dapat menyatukan struktur organisasi berbasis tim tradisional, kita harus membuat struktur operasional yang menentukan cara kerja tim tersebut. Ini harus langsung menginformasikan siapa yang kita butuhkan di NOC.
Struktur pendukung NOC berjenjang dan antrian alur kerja yang akan sajikan di bawah ini adalah titik awal yang baik untuk menentukan tingkat keterampilan yang dibutuhkan staf NOC.
Gambar 1 mengilustrasikan struktur pendukung NOC berjenjang yang terorganisir dengan baik, yang utamanya adalah tim Tingkat 1 yang menggunakan alat pemantauan dan berinteraksi dengan meja bantuan pengguna akhir, teknisi Tingkat 2 dan 3, dan pihak ketiga.
Panah mewakili arus informasi antara berbagai entitas dalam kerangka proses yang te;ah terdefinisi.
Dengan menggunakan struktur ini, banyak NOC dapat secara efektif menyelesaikan 65 hingga 75% insiden di Tingkat 1.
Struktur ini memungkinkan kelompok pendukung untuk menangani event, permintaan layanan, dan insiden pada tier yang sesuai, dengan lebih cepat mencapai resolusi.
Workflow adalah berikutnya dalam perencanaan, yang akan membantu kita membuat struktur organisasi yang terinformasi. Workflow yang terdefinisi dengan baik juga membantu tim menghindari kesalahan-kesalahan fatal dengan merencanakan apa yang akan terjadi dan kapan. Sering kali, masalah harus diprioritaskan dan diatur ke dalam satu set antrian, yang masing-masing dapat ditangani oleh kelompok yang sesuai. Variabel seperti SLA, teknologi, dan tingkat keterampilan teknisi memainkan peran penting dalam menentukan alur kerja.
Gambar 2 menunjukkan bagaimana satu set masalah dapat dipecah menjadi antrian dan ditugaskan ke grup berdasarkan keahlian.
Sekarang kita akhirnya bisa menyatukan struktur organisasi tim itu.
Gambar 3 di bawah menunjukkan contoh struktur NOC berbasis keterampilan yang dapat disesuaikan tidak hanya untuk mendukung persyaratan NOC 24x7, tetapi juga untuk menyediakan rencana pertumbuhan bagi karyawan, yang penting untuk retensi.
Ingatlah bahwa ini hanyalah salah satu pendekatan untuk menyusun tim NOC. Kita mungkin akan mengadopsi pola yang berbeda tergantung pada faktor yang ada.
Karena kita fokus pada staffing / kepegawaian secara khusus di sini, kita tidak akan menyelami semua proses yang kemudian perlu dikembangkan badan/institusi/perusahaan agar NOC mereka benar-benar beroperasi dengan baik secara konsisten. Tapi inilah daftar singkat dari apa yang kita harapkan perlu direncanakan jika kita berencana untuk melakukan operasi sendiri:
- Escalation
- QA/QC
- Disaster recovery/continuity
- Onboarding
- Training
- Continuous development
- Workflow management
- Incident management
- Problem management
- Knowledge management
- Access/credential management
Personalia
Setelah ada blue print operasional dan staf untuk NOC, dan deskripsi posisi dibuat, tim SDM harus dipersenjatai dengan arahan yang jelas untuk perekrutan dan retensi. Ini bisa menjadi tantangan besar yang memotivasi badan/lembaga/perusahaan untuk melakukan outsourcing ke tim yang akan menghidupi dukungan NOC. Ini bukan tugas kecil, terutama di pasar tenaga kerja saat ini.
Perlu diingat bahwa persyaratan personel minimum mutlak NOC 24x7 adalah 10 hingga 12 orang. Kebanyakan NOC membutuhkan lebih banyak.
Pertimbangkan dengan cermat manfaat yang bisa diberikan dari badan/lembaga kepada karyawan. Misalnya, jika badan/lembaga bisa memberikan 10 hari libur dan empat minggu PTO per karyawan, jam-jam ini perlu diperhitungkan dalam jumlah total karyawan untuk memastikan bahwa NOC kita berjalan dengan lancar.
Tanggung jawab utama tim NOC kemungkinan akan mencakup serangkaian tugas yang disajikan dalam kerangka kerja, seperti:
- Event Monitoring dan Management
- Incident Management
- Problem Management
- Capacity Management
- Change Management
Memastikan Keterampilan yang Tepat di NOC
Penting untuk merenungkan pentingnya keterampilan. Engineer NOC modern membutuhkan berbagai keterampilan untuk menjaga jaringan, infrastruktur, dan aplikasi kita agar tetap aktif dan berjalan.
Pengetahuan teknis yang beragam, termasuk pengetahuan tentang berbagai teknologi jaringan, lingkungan cloud, sistem operasi server, virtualisasi, sistem penyimpanan, dan aplikasi, menjadi semakin penting—dan semakin sulit ditemukan—setiap hari.
Tuntutan akan sumber daya manusia yang terampil dalam lingkungan 24x7 dapat menimbulkan tantangan yang cukup besar dan seringkali tidak dapat diatasi bagi banyak organisasi.
Selain keterampilan inti ini, inovasi teknologi menuntut keterampilan baru. Khususnya Machine Learning dan Artificial Intelligence menimbulkan tantangan baru yang tidak selalu sesuai dengan best practice yang selama ini di adopsi. Bahkan banyak engineer NOC berpengalaman yang tidak berurusan dengan jaringan yang menjadi lebih "sadar" akan lalu lintas yang melewatinya. Mengembangkan keterampilan yang melengkapi machine learning hanyalah salah satu contoh dari tantangan yang berkembang yang perlu diatasi oleh mereka yang bekerja di NOC.
Memprioritaskan desain NOC (bersama dengan program dan alat pelatihan yang tepat) untuk memaksimalkan kemampuan tim kita sejak awal menghemat banyak pekerjaan yang mahal dan padat karya saat NOC menjadi hidup.
Memahami skill yang diperlukan sejak dini dapat membantu kita mengidentifikasi staf yang tepat untuk dipekerjakan dan mendorong pemilihan alat untuk mengelola infrastruktur dari waktu ke waktu. Selain itu, manajemen pengetahuan dan program pelatihan yang ketat dan berkelanjutan penting untuk memastikan seluruh tim NOC mengetahui semua perubahan yang dilakukan pada infrastruktur yang didukung.
Sekali lagi, mengingat sifat operasi dukungan 24x7, tim harus siap meluangkan waktu untuk merekrut, mewawancarai, melatih, dan mengembangkan orang baru sebagai bagian rutin dan kemungkinan berkelanjutan dari pekerjaan mereka.
Juga perlu diingat bahwa lingkungan stres tinggi NOC secara alami cocok untuk pergantian, terutama pada posisi entry-level. Jumlah pekerjaan yang terlibat di sini hampir selalu lebih tinggi dari yang harapkan untuk rata-rata pekerjaan teknik. Apakah staf pendukung garis depan bergerak di luar perusahaan atau naik di dalamnya, perekrutan adalah tantangan manajemen yang hampir konstan dan sangat berisiko tinggi.
Apakah tim HR / SDM siap untuk menangani itu?
Pelatihan
Program pelatihan NOC harus mencakup orientasi awal serta pelatihan berkelanjutan. Jika kita mempertimbangkan untuk berdiri sendiri atau meningkatkan operasi dukungan yang ada, apakah kita memiliki waktu, energi, dan keahlian untuk mengembangkan dan mengelola pelatihan?
Jika demikian, bersiaplah untuk menghabiskan beberapa waktu di sini. Mungkin diperlukan waktu hingga enam bulan untuk berbagai kelas dan pelatihan di tempat kerja sebelum seorang engineer siap untuk mengambil tanggung jawab untuk mendukung / men-support NOC tergantung pada tugas dan teknologi yang menunggu mereka.
Setelah pekerjaan dimulai, sesi pelatihan bulanan atau triwulanan harus dijadwalkan untuk menjaga keterampilan engineer tetap segar dan untuk memperbarui tim dukungan tentang jenis layanan baru, persyaratan pelanggan baru, dan peralatan baru.
Pelatihan mungkin merupakan salah satu tantangan yang tidak tertulis / terucap tetapi mungkin merupakan biaya tertinggi yang akan kita tanggung. Dibutuhkan waktu untuk melatih individu tergantung pada level apa kita akan mempekerjakan mereka. Untuk NOC, kebanyakan orang biasanya berpikir dukungan gaya Tier 1, berpotensi Tier 2. Apakah kita mempekerjakan individu yang lebih berpengalaman? Apakah kita mempekerjakan orang-orang yang baru di industri ini? Karena itu juga akan mengubah cost yang harus kita tanggung. Lebih banyak pengalaman membutuhkan lebih banyak uang. Tetapi jika kita membayar hanya sedikit, dan kita akan memperoleh seseorang yang lebih baru, mereka harus mempelajari semua keterampilan dan proses dan hal-hal yang unik untuk badan/lembaga dan jaringan kita; bagaimana berinteraksi dengan berbagai departemen, sistem tiket; memahami seluk beluk badan/lembaga kita secara keseluruhan. Orang yang lebih berpengalaman mungkin hanya perlu mempelajari alat khusus yang ada di badan/lembagan karena bagian teknisnya sudah ada di sana.
Retensi
Tingkat pengurangan tertentu dalam NOC harus diperhitungkan berdasarkan data historis dan standar industri.
Faktor-faktor yang mempengaruhi tingkat retensi termasuk budaya lembaga serta organisasi NOC. Seperti,apakah ada jalur yang jelas untuk pertumbuhan karyawan dari satu tingkat ke tingkat berikutnya atau ke departemen lain dalam organisasi.
Dengan membuat perhitungan ini, kita dapat merencanakan kebutuhan staf dan pelatihan dengan lebih baik. Misalnya, dengan asumsi bahwa seorang engineer biasa bekerja lima tahun di NOC (dengan tingkat retensi 80%), maka kita perlu mempekerjakan 20% staf tambahan setiap tahun. Ini adalah salah satu dari banyak realisasi yang mendorong perusahaan untuk mengalihdayakan dukungan NOC mereka ke penyedia dukungan khusus, yang sekali lagi, dapat menanggungkan beban ini untuk mereka.
Scheduling
There’s also the never-ending task of juggling schedules. Paid time off, sick days, and other personnel interruptions all need to be planned and covered to ensure support with required skill sets is never missing when it can’t be.
Some companies may try to mitigate the problem of weekend and third shift staff shortages by outsourcing only those shifts—a hybrid solution. However, this requires management of both the internal and external NOC staff and ensuring quality and consistency are maintained across the two different teams, rather than a single in-house or outsourced team handling everything. We make sure this is addressed thoughtfully in our service engagements.
Quality
One of the biggest staffing considerations that fly under the radars of many teams—and isn’t taken into consideration—is quality control and quality assurance.
The quality of updates, communication, soft skills, etc., is something we see teams realize far too late despite being critical for the NOC to catch its errors and turn them into opportunities to improve.
Here are some of the quality-related tasks top-performing teams make part of their workflow:
Reviewing tickets, incidents, and escalations Reviewing chronic alarms and incidents Coordinating maintenance calendars Reporting on service and operational metrics Contractor assessments of performance Forecast planned activities Reviewing quantity and causes for NOC support activities Identifying root causes and preventive actions Reviewing escalations and open items Reviewing staffing and proficiency levels Validating assumptions for contract Identifying and mitigating risks within infrastructure and operations Reviewing previous action items and statuses Tools and Licenses The bigger your team, the more licenses and similar types of expenses you can expect to incur. If you’re planning on building a distributed team supporting you remotely, be sure to identify any additional costs that result, such as additional tools and sending individuals equipment. Also, make sure you have a strategy for access and credential management.
If a separate facility will be needed, be sure to factor these costs in as well as they can be considerable.
Utilization Metrics and Reporting
Metrics are far too often conflated with KPIs and SLAs only—the measures and contractual obligations for how well the NOC is doing its job.
While both can certainly be a sore spot for many support teams, in the context of staffing a 24x7 NOC, there’s an even bigger metrics-related problem—one that is often a complete blind spot for teams: utilization metrics.
These are the metrics that reveal why the NOC is or isn’t busy at any point in time, and how staffing levels should be set accordingly. It’s, in many ways, the key to efficiency.
What's your throughput? What's your workload? How many tickets are you dealing with at certain points in time? How long do you spend working tickets? All of these questions are critical for setting and fine-tuning staffing levels based on how and when the NOC is typically utilized.
Some essential utilization metrics for a NOC include:
Labor content for each edit of a ticket — reveals how much work was devoted to the lifecycle of a ticket, which helps you determine optimal staffing levels, resulting in control over OPEX and better morale by avoiding overworking employees. Number of edits processed/performed per hour — shows how many edits in the ticket lifecycle a person can perform per hour, which, in combination with the previous metric, can help you gauge how many tickets can be resolved per hour. A heatmap of edits by time of day and day of week — tells you how many tickets you can expect at a given time on a given day of the week, which helps you determine optimal staffing levels. In our other guide, we dive into these utilization metrics further: NOC Performance Metrics: How to Measure and Optimize Your Operation
Staffing a 24x7 NOC vs. Outsourcing
In most organizations, staffing a 24x7 NOC is often a needlessly high expenditure compared to strategically outsourcing support as a predictable operating expense. Given the payroll and overhead costs of building a NOC in-house, many companies that outsource with us cut their total cost of ownership in half.
A plan that doesn’t consider this opportunity might, for example, call for a staff of 12 full-time employees, when in fact, the same or likely better support could be provided through an outsourced service solution that takes full advantage of an economy of scale to provide far better service at a far lower cost.
In addition to staffing costs, the cost of acquiring, implementing, and integrating a full suite of NOC tools only further tips the scale in favor of outsourcing much of the time.
Perhaps the most apparent difference between homegrown and outsourced NOCs are the capabilities that come with an already-mature NOC operation and access to niche NOC expertise.
Between planning a NOC build, hiring a team, training that team, and aligning over the operational plan, in-house NOCs can expect 16 to 24 weeks minimum before all the parts are even in place. It can then take months or years to gain confident control over the system and bring it into a state of real operational maturity.
Turning up support with an outsourced NOC condenses all that time and effort into a number of weeks instead of years—often far more cost-effectively.
Read also: Shared vs. Dedicated NOC Support: A Quick-Guide
Final Thoughts and Next Steps
For most companies, the cost and complexity of building and managing a NOC is a diversion from focusing its attention where it's needed most: innovating and growing the business.
Without an effective NOC, persistent support issues lead to expensive project delays, endless stress, and serious vulnerabilities that threaten your business.
Through the NOC as a service model, an outsourced support provider helps you take control of your infrastructure through a suite of NOC solutions designed to meet the specific needs of your technology environment and operational workflow—all while enabling you to focus internal resources on the projects that move the business forward.