Server 2012 R2 C L U S T E R D A Y 1. OTURUM Seviye 200 @msclusterturkey microsoftclusterturkey Microsoft Cluster Çözümleri ile Servis Sürekliliği Ahmet Musa Kösalı w w w. C O Z U M P A R K. c o m w w w. M i c r o s o f t C l u s t e r. T v. T r
ÖRNEK ETKİ RİSK ANALİZİ Temel Yapı Basit Yapı Veri Yedekli Çözüm Güvenli Erişimli Veri Yedekli Çözüm Yüksek Erişebilirli Çözüm STORAGE CLUSTER STORAGE STORAGE STORAGE Cozumpark.Com ve MicrosoftCluster.Tv.Tr 2
KARŞILAŞILABİLECEK PROBLEMLER Donanımsal Sorunlar: Raid kartın arızalanması Memory Dimm arızası Anakart arızası Network kart problemleri Switch problemleri Soru : 1 yıl içinde kaç defa bu sorunu yaşarım değil kesinti durumunda ne kadar zarar ederim veya ne kaybederim? Data / Veri Problemleri: Veri kaybı/silinmesi Yedekleme Yedekten dönme Storage kontroler arızası Cozumpark.Com ve MicrosoftCluster.Tv.Tr 3
AMAÇ - HEDEF Hedef: 27 Kişinin öldüğü 20 Kasım 2003 tarihinde saat 10:55 te HSBC Gn. Md. Terör Saldırısı olmuştu. Fakat kesinti hissedilmeden işlemler devam etmişti. Amaç: Firmaların ana acı kᾰr elde etmek ve sürekliliğini sağlamaktır. Gereklilik: Müşteri memnuniyeti ve yeni müşteri kazanması Müşteri ne ister? Güven ve süreklilik Büyümenin ve Kârlılığın devamlılığı için Marka / Müşteri itibarının kaybedilmemesine yardımcı olur. Kanuni zorunluluk: * 19/10/2005 tarihli 5411 sayılı Bankacılık Kanunu 23,24,29 ve 30 uncu maddeler * 01/06/2010 tarihli 27598 sayılı Resmi Gazetede yayınlanan Bilgi Sistemleri Süreklilik Planı * 28/06/2012 tarihli 28337 sayılı Resmi Gazetede yayınlanan Finans kurumları İç Sistem Yönetmeliği Cozumpark.Com ve MicrosoftCluster.Tv.Tr 4
Fayda / Maliyet Analizi İSY, maliyetli bir planlama süreci olarak değil, kuruma değer katan bir süreç olarak görülmelidir. Bu nedenle yapılan iş sürekliliği planları belli aralıklarla tam anlamıyla tatbikatının yapılıp oluşan durumlara karşı süreç dokümanlarının güncellenmesi gerekmektedir. Cozumpark.Com ve MicrosoftCluster.Tv.Tr 5
Cozumpark.Com ve MicrosoftCluster.Tv.Tr İş Sürekliliği Yönetimi BS 25999 ve ISO 22301 Standardı Kapsam: Standartlar: 2006 yılında BS 25999 ve 2012 yılında devreye alınan ISO 22301 Genel olarak; veri kurtarma, iş sürekliliği ve felaket anında yapılacakları kapsamaktadır. Her türlü kesinti olası bir sorgulamaya karşı kayıt altına alınmalı Firmalar yaşayan sistem olarak görülmeli ve her güncelleme / değişiklik için İş Sürekliliği gözden geçirilip uygulanmalıdır Bu standart, planların oluşturulması, uygulanması, çalıştırılması, takibi, tatbik edilmesi, korunması ve etkinliğinin geliştirilmesi için Planla-Yap-Kontrol Et-Uygula (PYKU) döngüsünü kullanır. 6
BİLİNMESİ GEREKEN TERİMLER İş Devamlılığı Yönetimi, herhangi bir iş kesintisi durumunda, iş etkinliklerinin devamının ya da yeniden başlamasının sağlanmasını ve iş sürekliliği planının (planlarının) güncel ve geçerli kalmasını sağlayacak eğitim, tatbikat ve gözden geçirmelerle tüm programın yönetilmesini kapsar. İş Sürekliliği Yönetimi (İSY), bir kuruma yönelik potansiyel tehditleri ve gerçekleşmeleri durumunda bu tehditlerin iş operasyonlarına etkilerini tanımlayan, kurumun iç ve dış müşterileri korumaya yönelik bir müdahale kapasitesine sahip olacak kurumsal bir direnç inşa etme sürecidir. Cozumpark.Com ve MicrosoftCluster.Tv.Tr 7
BİLİNMESİ GEREKEN TERİMLER Ürün ve hizmetin sağlanmasına yeniden başlanamadığı takdirde kurumun mali yapısının geri dönülemez şekilde risk altında kalacağı süreye Tolere Edilebilir Maksimum Süre (RTO Recovery Time Objective) denir. Recovery Point Objective (RPO), kesinti sonunda servisin hangi durumdan/zamandan hizmet vereceğini göstermektedir. Örnek vermek gerekirse; Storage arızası sonrasında üzerindeki tüm verilerin gittiğini düşünün. Bu durumda en iyi kurtarma prosedürü yedekten geri dönmedir. En fazla ne kadar sürede sistemi yeniden kurup hazır hale getireceğiniz bilgisine RTO denir. Bu sistemin en son ne kadar gecikmeli veri ile hizmet vereceği ise RPO dir. Cozumpark.Com ve MicrosoftCluster.Tv.Tr 8
BİLİNMESİ GEREKEN TERİMLER İş Sürekliliği Planı (İSP), bir kurumun kritik etkinliklerini önceden tanımlanmış, kabul edilebilir bir düzeyde sürdürebilmesini sağlamak amacıyla, bir olay anında kullanılmak üzere geliştirilmiş, derlenmiş ve hazır tutulan, belgelere dökülmüş bilgiler ve prosedürler toplamıdır. İş Etkileri Analizi (İEA); çalışma işlevlerini ve iş kesintisinin bu işlevler üzerinde oluşturabileceği etkileri analiz etme işlemi. Toparlanma Süresi Hedefi; Bir olay sonrasında ürün, hizmet veya etkinliği sağlamaya yeniden başlanabilmesi için hedeflenen süredir. Hedeflenen toparlanma süresi tolere edilebilir maksimum kesinti süresinden kısa olmak zorundadır. Cozumpark.Com ve MicrosoftCluster.Tv.Tr 9
Nasıl Yapılır? İSY nin kapsamını, rolleri ve sorumlulukları tanımlamak; Süregelen İSY kapasitesinin yönetimi için uygun bir kişi ya da ekip atamak; İSY komitesinin oluşturulması: Karar mercihi Tehdit ve risklerin belirlenmesi Risklere göre Kritik iş ve servislerin belirlenmesi İş Sürekliliği Planlarının oluşturulması: kim tarafından, nasıl ve maksimum ne kadar sürede giderileceği. Recovery Time Objective (RTO) : Tolere edilebilir maksimum süre Recovery Point Objective (RPO): Kesinti sonunda servisin hangi durumdan/zamandan hizmet vereceğini göstermektedir. Toparlanma Süresi Hedefi Dış kaynak kullanımı varsa SLA lerin yapılması. (RTO dan küçük olmalı) İş Etkileri Analizlerin (İEA) oluşturulması: çalışma işlevlerini ve iş kesintisinin bu işlevler üzerinde oluşturabileceği etkileri analiz etme işlemi. Fayda maliyet analizlerinin oluşturulması Kurum içi bilinçlendirme ve eğitim programlarının yapılması En az yılda bir kere tatbikatının yapılıp İSP lerin güncellenmesi Cozumpark.Com ve MicrosoftCluster.Tv.Tr 10
SON SÖZ: Firmanızda öngörülebilecek düzeyde hasarlara karşı müdahale önlemlerini çok ciddi bir şekilde inceleyip İSP planlarınızı ustaca oluşturmuş olsanız bile bazen bir olay/problem kurumun hazırlıklı olduğu düzeyi aşabilir. Bu nedenle yönetimin ve bunu destekleyen yapıların mevcut bir plana inatla bağlı kalmak yerine, şartlara göre yargılarda bulunması zorunludur. İş sürekliliği planı, yönetimin bilgiye dayalı ve ustaca karar verme yeteneğinin yerine asla geçemez. Cozumpark.Com ve MicrosoftCluster.Tv.Tr 11
MSFC ile İş Sürekliliği Yönetimi Microsft Failover Cluster (MSFC) Kritik sistemlerinizin olası bir problem veya arızalanmaya karşı kabul edilebilen en kısa sürede hizmet vermeye devam ediyor olmanız gerekmektedir. Her sistemin iş sürekliliği farklı yöntemlerle sağlanmaktadır. Microsoft sistemlerin iş sürekliliğinin büyük bir bölümü Failover Cluster ile yapılmaktadır. Örnek vermek gerekirse; Hyper-V, File Server, MS SQL, Exchange MS ürünleri haricinde ise Windows Service altında yer alan servislerinizide «Generic Service» adı altında cluster yapılır. Bunlar: Generic Application, Generic Script ve Generic Service Bunların Dışında Desteklenenler: DFS-Namespace, DFS-Replication, DHCP, DTC, Hyper-V Replica Broker, IIS, iscsi Target, isns, MSMQ, NFS, WINS Cozumpark.Com ve MicrosoftCluster.Tv.Tr 12
Microsoft Failover Cluster Nedir? Aktif pasif çalışır. Amaç: donanım yedekliliği sağlanak en az kesinti ile veri kaybı olmazsızın hizmet vermeye devam edilmesi. En az 2 sunucudan oluşur. Storage yedekliliği için GeoCluster yapılır. NETWORK Data Center SQL Service Name Switch NETWORK HAC HBA HBA HBA Senkron Veri Kopyalama Cozumpark.Com ve MicrosoftCluster.Tv.Tr 13
Microsoft Failover Cluster KAVRAMLAR CLUSTER Servis sürekliliği için oluşturduğunuz yapınızın genel adıdır. NODE Cluster a dahil olan sunuculara verilen isim ROLES Cluster üzerinde iş sürekliliğini sağladığınız her bir servis/uygulamaya verilen isimdir. Cluster Resource: Cluster a tanımlınan tüm disk, ip, isim ve servislerin genel adını oluşturur Failover: İş sürekliliği için oluşturduğunuz rolün kontrollü veya kontrolsüz sunucular arasında taşınmasına denir. iscsi Cozumpark.Com ve MicrosoftCluster.Tv.Tr
Microsoft Failover Cluster OTOMATİK FAİLOVER SÜRECİ Node1 erişilemez olursa New Coordinator Node Role, Node2 de online olur Coordination Node Volume relocates to a healthy node Brief queuing of I/O while volume ownership is changed DİSK