Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revize Předchozí verze Následující verze | Předchozí verze | ||
cs:spravce:monitoring:end2end_monitoring [2018/08/15 20:49] jan.tomasek@cesnet.cz [FAKE-UID] |
— (aktuální) | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
- | ====== end2end monitoring ====== | ||
- | ===== Úvod ===== | ||
- | |||
- | Na základě zkušeností s zaváděním //eduroam//u jsme dospěli k závěru, | ||
- | že monitoring postavený jen na kontrole stavu jednotlivých RADIUS | ||
- | serverů není dostatečný. Docházelo totiž k případům, kdy chyba v | ||
- | konfiguraci na některé z organizaci vedla k tomu, že se návštěvníci | ||
- | nemohli získat přístup k síti ale monitoring nás na toto neupozornil | ||
- | předem. | ||
- | |||
- | Ideální by asi bylo mít možnost instalovat do každé připojené | ||
- | instituce počítač s WiFi kartou a příslušným softwarovým vybavením. To | ||
- | by ale bylo dosti nákladné a administrativně jen velmi obtížně | ||
- | realizovatelné. | ||
- | |||
- | CESNETem implementované řešení používá k monitorování jediný k tomuto | ||
- | účelu vyhrazený počítač. Tento počítač je nezávislý na //eduroam// | ||
- | infrastruktuře a s jednotlivými RADIUS servery organizací zapojenými | ||
- | do //eduroam//u komunikuje přímo. Počítač, na kterém je monitoring | ||
- | provozován, vystupuje v podstatě v roli dalšího Access Pointu. Proto je | ||
- | nutné, aby měl přístup k RADIUS serveru organizace, který se běžně | ||
- | stará o vyřizování dotazů z AP. | ||
- | |||
- | Díky přímému přístupu ke koncovým RADIUS serverům a faktu, že pro | ||
- | testování se používají testovací účty všech zapojených institucí, se | ||
- | jedná o testování každého s každým, tedy o end2end monitoring. Výhodou | ||
- | tohoto monitoringu je kromě získání informací, kde mohou mít | ||
- | návštěvníci z některých institucí problém s přístupem, také to, že | ||
- | nezohledňuje transport dotazů mezi RADIUS serverem hostitelské a | ||
- | domácí instituce. Díky tomu bude tento monitoring použitelný i v | ||
- | případě, že v budoucnu dojde k vyřazení proxy serverů a komunikace | ||
- | mezi zapojenými institucemi bude probíhat přímo. | ||
- | |||
- | ===== Zátěž generovaná monitoringem ===== | ||
- | |||
- | {{ :cs:spravce:monitoring:end2end_monitoring:maluvka-pro-vypocet-zateze-monitoringu.png?250|Náčrtek situace s pohledu monitoringu}} | ||
- | |||
- | Nevýhodou tohoto způsobu monitorování je, že systém generuje podstatně | ||
- | vyšší zátěž než jak tomu bylo v minulosti. Zátěž se pochopitelně | ||
- | agreguje na proxy serverech, ale i koncové RADIUS servery organizací | ||
- | musí vyřídit nemalé množství dotazů. | ||
- | |||
- | Na obrázku je znázorněna situace z pohledu monitoringu. Pro monitoring | ||
- | není podstatné, že komunikace je realizována prostřednictvím NREN | ||
- | proxy RADIUS serverů. Také není moc podstatné, že některé instituce | ||
- | mají dva RADIUS servery a jiné jen jeden. Hrubě řečeno - monitorující | ||
- | systém má k dispozici seznam serverů a seznam testovacích účtů, | ||
- | testuje každý s každým a nic víc nepotřebuje. | ||
- | |||
- | To, že pro monitoring není podstatná znalost zapojení infrastruktury, je | ||
- | zjednodušení, které je přínosné pro výpočet generované | ||
- | zátěže. Implementovaný monitoring pochopitelně bere ohled na zapojení | ||
- | infrastruktury. Ve výpočtu zohledňuji pouze fakt, že dotaz s funkčním | ||
- | testovacím účtem stojí podstatně méně zdrojů, než dotaz s testovacím | ||
- | účtem, jehož domácí RADIUS server neodpovídá. To je dáno tím, že | ||
- | monitoring musí dlouho čekat než vyprší timeouty a RADIUS servery po | ||
- | cestě musí zkoušet opakovat dotazy na protějšek, který neodpovídá. | ||
- | |||
- | ==== Odvození teoretické zátěže ==== | ||
- | |||
- | |**RS** |Počet monitorovaných RADIUS serverů. | | ||
- | |**TA** |Počet testovacích účtů (test account). | | ||
- | |**N<sub>g</sub>** |Frekvence testování návštěv (guest). | | ||
- | |**N<sub>l</sub>** |Frekvence testování lokálním účtem. | | ||
- | | || | ||
- | |**Q<sub>m</sub>=N<sub>g</sub>*(TA-1)+N<sub>l</sub>** |Počet dotazů, které monitoring pošle přímo RADIUS serveru. | | ||
- | |**Q<sub>t</sub>=N<sub>g</sub>*(TA-1)+N<sub>l</sub>+N<sub>g</sub>(RS-1)** |Celkový počet dotazů, které musí vyřídit RADIUS server organizace. Z toho **N<sub>l</sub>+N<sub>g</sub>(RS-1)** dotazů musí odbavit lokální AAI.| | ||
- | |**Q<sub>t</sub>=N<sub>g</sub>*(TA+RS-2)+N<sub>l</sub>**| Celkový počet dotazů, které musí vyřídit RADIUS server organizace.| | ||
- | |**Q<sub>nren</sub>=RS*N<sub>g</sub>(TA-1)**| Počet dotazů, které musí zpracovat NREN RADIUS servery.| | ||
- | |||
- | ==== Vypočtená teoretická zátěž ==== | ||
- | |||
- | Zátěž celé infrastruktury závisí na počtu zapojených organizací | ||
- | **TA**, počet RADIUS serverů je odvozen od počtu testovacích účtů: | ||
- | **RS=1.5*TA**. **N<sub>g</sub>=2**, **N<sub>l</sub>=12**. V časovém | ||
- | intervalu 1 hodiny se cizí účty testují 2x a vlastní | ||
- | (lokální) každých 5min. Po dosazení jsem dostal tato čísla: | ||
- | |||
- | | ^ **TA=20, RS=30** ^^ **TA=50, RS=75** ^^ **TA=500, RS=750** ^^ **TA=2000, RS=3000** ^^ | ||
- | ^server organizace | 108| 0,03| 258| 0,07| 2 508| 0,70| 10 008| 2,78| | ||
- | ^NREN servery | 1 140| 0,32| 7 350| 2,04| 748 500| 207,92| 11 994 000| 3 331,67| | ||
- | |||
- | Čísla v prvním sloupci představují absolutní počet vyřízených dotazů | ||
- | za hodinu, hodnota v druhém sloupci je přepočtena na vteřinu. Je třeba | ||
- | mít na paměti, že množství paketů bude o jeden řád vyšší. V tabulce | ||
- | jsou uvedeny EAP dotazy, což např. v případě PEAP-MSCHAPv2 znamená 10 | ||
- | RADIUS paketů na vyřízení. Chcete-li si s výpočty pohrát, je k | ||
- | {{:cs:spravce:monitoring:end2end_monitoring:vypocet-zateze-radius-serveru.ods|dispozici | ||
- | OpenOffice Calc Sheet}}, který jsem použil. | ||
- | |||
- | Z čísel je tedy vidět, že pro koncové servery není monitoring žádným | ||
- | rizikem, problémy se objeví mnohem dříve na NREN RADIUS | ||
- | serverech. Reálné výkonnostní parametry v tento okamžik nemám k | ||
- | dispozici, ale očekávám, že systém je schopen vyřídit alespoň 1000 | ||
- | paketů za vteřinu. | ||
- | |||
- | Výše uvedené má zásadní podmínku v tom, že testování musí být v čase | ||
- | rovnoměrně rozprostřeno. To se zhruba daří splnit, jak ukazují | ||
- | [[https://ermon.cesnet.cz/HotSaNIC/apps/rad_eap_test.html|grafy | ||
- | počtu]] testovacích procesů. Další informace o | ||
- | [[:cs:spravce:monitoring:uvod|monitoringu]] | ||
- | jsou k dispozici v samostatném článku. | ||
- | |||
- | ===== Služby monitorované na serverech připojených organizací ===== | ||
- | |||
- | ==== ==== | ||
- | |||
- | {{ :cs:spravce:monitoring:end2end_monitoring:sluzby_monitorovane_na_serveru_organizace.png?250|Služby monitorované na serveru organizace}} | ||
- | |||
- | Na každém serveru organizace je monitorována řada služeb. Jejich | ||
- | význam, závislosti na ostatních službách dalších serverů a vzájemné | ||
- | závislosti jsou popsány dále. Na připojeném obrázku můžete vidět, jak | ||
- | Nagios tyto služby vizualizuje. | ||
- | |||
- | === Ikona přeškrtlé trumpetky === | ||
- | |||
- | Naznačuje, u kterých služeb se **ne**posílá notifikace. | ||
- | |||
- | === Sloupec "Last check" === | ||
- | |||
- | Udává, kdy naposledy byla služba kontrolována. Pokud služba nemá | ||
- | splněnu některou ze závislostí, tak vůbec nejsou spouštěny její | ||
- | testy. Například když není povolen přístup pro ping z monitorovacího | ||
- | systému, tak se netestují žádné služby, ale Nagios stále zobrazuje | ||
- | poslední známý stav služby. | ||
- | |||
- | === Sloupec "Duration" === | ||
- | |||
- | Udává, jak dlouho setrvává služba v HARD stavu. Například služba IPSEC | ||
- | měla poslední zaznamenaný výpadek před 18hodinami. To ale ještě | ||
- | neznamená, že došlo k notifikaci o výpadku. Detailnější informace jsou | ||
- | k dispozici po kliknutí na jméno služby a následně na | ||
- | [[http://wiki.eduroam.cz/lib/exe/detail.php?id=spravce%3Amonitoring%3Aend2end_monitoring&cache=cache&media=spravce:monitoring:end2end_monitoring:service_availability_report.png|"View | ||
- | Availability Report For This Service"]]. | ||
- | |||
- | ==== PING ==== | ||
- | * testuje se odpověď na ICMP echo request | ||
- | * závisí na **gw/PING** | ||
- | * CRITICAL-HARD stav nastává po **10**ti pokusech, tj. max po 5+9*1=**14 minutách** od výpadku | ||
- | * normální perioda testování je **5 minut** | ||
- | * v případě výpadku se testuje každou **1 minutu** | ||
- | * notifikace se **posílají** správcům serveru a správcům eduroam.cz | ||
- | |||
- | |||
- | |||
- | ==== IPSEC ==== | ||
- | * tato služba je testována jen na RADIUS serverech, které tvoří infrastrukturu a jsou připojeny pomocí IPSEC, není k dispozici u serverů sloužících jen pro monitoring | ||
- | * testuje se odpověď na ICMP echo request skrz IPSEC tunel | ||
- | * test se spouští přes vzdálené volání pomocí nrpe na radius1.eduroam.cz | ||
- | * závisí na: | ||
- | * **PING** | ||
- | * **radius1.eduroam.cz/PING** | ||
- | * **radius1.eduroam.cz/RACOON** | ||
- | * CRITICAL-HARD stav nastává po **10**ti pokusech, tj. max po 5+9*1=**14 minutách** od výpadku | ||
- | * normální perioda testování je **5 minut** | ||
- | * v případě výpadku se testuje každou **1 minutu** | ||
- | * notifikace se **posílají** správcům serveru a správcům eduroam.cz | ||
- | |||
- | |||
- | ==== RADSEC ==== | ||
- | * tato služba je testována jen na RADIUS serverech, které tvoří infrastrukturu a jsou připojeny pomocí RADSEC, není k dispozici u serverů sloužících jen pro monitoring | ||
- | * testuje zda jsou navázána RADSEC spojení oběma směry | ||
- | * test se spouští přes vzdálené volání pomocí nrpe na radius1.eduroam.cz | ||
- | * závisí na: | ||
- | * **PING** | ||
- | * **radius1.eduroam.cz/PING** | ||
- | * CRITICAL-HARD stav nastává po **10**ti pokusech, tj. max po 5+9*1=**14 minutách** od výpadku | ||
- | * normální perioda testování je **5 minut** | ||
- | * v případě výpadku se testuje každou **1 minutu** | ||
- | * notifikace se **posílají** správcům serveru a správcům eduroam.cz | ||
- | |||
- | ==== BIG-PACKET ==== | ||
- | |||
- | * test přenosu fragmentovaných UDP paketů | ||
- | * závisí na **domácím realmu** | ||
- | * test se provádí s účtem big-packet@cesnet.cz což je specielní účet s velkým Access-Acceptem. Pokud testovaný server zvládne tento paket doručit na ermon, tak to znamená že je schopen přijmnout (z národního RADIUSu) ale i odeslat (na ermon) fragmentový UDP paket. | ||
- | * CRITICAL/WARNIG-HARD nastává po **3** neúspěných pokusech | ||
- | * normální perioda testování je **24 hodin** | ||
- | * v případě výpadku se testuje každé **12 hodin** | ||
- | * notifikace se posílají pro CRITICAL (timeout) a WARNING (access-reject) stavy | ||
- | |||
- | ==== VCELKA-MAJA ==== | ||
- | |||
- | * test přeposílání vnitřní EAP identity, více viz [[ | ||
- | https://random.cesnet.cz/pipermail/eduroam-admin/2008-February/000624.html|email v eduroam-admin listu]], [[ http://archiv.cesnet.cz/doc/techzpravy/2008/incorrect-eap-termination-in-eduroam/|technická zpráva]] | ||
- | * závisí na **domácím realmu** | ||
- | * CRITICAL-HARD nastává po **3** neúspěných pokusech | ||
- | * normální perioda testování je **24 hodin** | ||
- | * v případě výpadku se testuje každé **12 hodin** | ||
- | * notifikace se posílají pro CRITICAL (timeout) a WARNING (access-reject) stavy | ||
- | |||
- | ==== INSTITUTION-XML ==== | ||
- | |||
- | * test existence souboru [[:cs:spravce:edudb:institution_xml|institution.xml]] | ||
- | * URL souboru institution.xml se bere z definice realmu organizace v CESNET CAAS, testuje se na existenci stringu inst_realm ve staženém dokumentu | ||
- | * CRITICAL/WARNIG-HARD nastává po **3** neúspěných pokusech | ||
- | * normální perioda testování je **24 hodin** | ||
- | * v případě výpadku se testuje každé **3 hodiny** | ||
- | * notifikace se posílají 1x za 2 dny pro CRITICAL stav | ||
- | |||
- | ==== domácí realm ==== | ||
- | |||
- | * domácí realm je ten, pro který je server koncovým | ||
- | * domácích realmů může být na jednom serveru definováno několik | ||
- | * tento test testuje, jestli na serveru **funguje RADIUS** server | ||
- | * závisí na **PING** | ||
- | * CRITICAL-HARD stav nastává po **3** pokusech, tj. max po 5+10*(3-1)=**25 minutách** od výpadku | ||
- | * normální perioda testování je **5 minut** | ||
- | * v případě výpadku se testuje každých **10 minut** | ||
- | * notifikace se **posílají** správcům serveru, správcům realmu a správcům eduroam.cz | ||
- | |||
- | |||
- | ==== realmy ostatních organizací ==== | ||
- | |||
- | * tento test simuluje návštěvu uživatele z cizí organizace | ||
- | * závisí na: | ||
- | * **PING**, tj. jestli je server živý | ||
- | * **IPSEC**, tj. jestli má server živé spojení alespoň s jedním RADIUS serverem. Tato podmínka se uplaťnuje, jen když tento server tvoří eduroam.cz infrastrukturu. | ||
- | * **domácí realm**, tj. jestli na serveru funguje RADIUS | ||
- | * **domácí server testovaného realmu/testovaný realm**, tj. jestli domácímu serveru příslušnému k tomuto realmu funguje RADIUS | ||
- | * CRITICAL-HARD stav nastává po **3** pokusech, tj. max po 180+120*(3-1)=**420 minutách = 7 hodinách ** od výpadku | ||
- | * normální perioda testování je **180 minut** | ||
- | * v případě výpadku se testuje každých **120 minut** | ||
- | * notifikace se **ne**posílají | ||
- | |||
- | ==== CALLING-STATION-ID ==== | ||
- | |||
- | * test že SP posílá vyplněný RADIUS atribut Calling-Station-Id | ||
- | * týká se pouze serverů, které jsou napojeny na národni RADIUS přímo | ||
- | * test je implementován na základě dat z logů národního RADIUS serveru, podklady pro sondu se **aktualizují jednou za hodinu** | ||
- | * CRITICAL/WARNIG-HARD nastává po **3** neúspěných pokusech | ||
- | * normální perioda testování je **24 hodin** | ||
- | * v případě výpadku se testuje každé **3 hodiny** | ||
- | * notifikace se neposílají <del>1x za 2 dny pro CRITICAL stav</del> | ||
- | |||
- | ==== OPERATOR-NAME ==== | ||
- | |||
- | * test že SP posílá vyplněný RADIUS atribut Operator-Name, testuje se existence a syntaktická správnost | ||
- | * týká se pouze serverů, které jsou napojeny na národni RADIUS přímo | ||
- | * test je implementován na základě dat z logů národního RADIUS serveru, podklady pro sondu se aktualizují **jednou za hodinu** | ||
- | * CRITICAL/WARNIG-HARD nastává po **3** neúspěných pokusech | ||
- | * normální perioda testování je **24 hodin** | ||
- | * v případě výpadku se testuje každé **3 hodiny** | ||
- | * notifikace se neposílají <del>1x za 2 dny pro CRITICAL stav</del> | ||
- | |||
- | ==== CHARGEABLE-USER-IDENTITY ==== | ||
- | |||
- | * test že SP posílá vyplněný RADIUS atribut Chargeable-User-Idenity | ||
- | * test probíhá z CESNETích RADIUS serverů pomocí testovacího účtu organizace | ||
- | * CRITICAL/WARNIG-HARD nastává po **3** neúspěných pokusech | ||
- | * normální perioda testování je **24 hodin** | ||
- | * v případě výpadku se testuje každé **3 hodiny** | ||
- | * notifikace se neposílají <del>1x za 2 dny pro CRITICAL stav</del> | ||
- | |||
- | ==== FAKE-UID ==== | ||
- | |||
- | * Test že IdP vynucuje shodu vnější a vnitřní identity. Jako vnější (anonymní) identita se použije anonXXX@realm.cz a jako vnitřní pak testovací účet organizace. IdP takový požadavek na ověření nesmí vyhodnotit pozitivně. IdP které nepodporuje Chargeable-User-Identity nesmí povolit žádnou anonymní identitu (tj. ani anonymous@realm.cz), viz [[https://www.eduroam.cz/cs/roamingova_politika|Technické požadavky a doporučení pro členy federace eduroam.cz]]. | ||
- | * [[https://random.cesnet.cz/pipermail/eduroam-admin/2016-November/001141.html|více informací]] | ||
- | * řešení: [[https://www.eduroam.cz/cs/spravce/pripojovani/radius/freeradius2#kontrola_shody_vnejsi_a_vnitrni_eap_identity|FreeRADIUS v2]], [[https://www.eduroam.cz/cs/spravce/pripojovani/radius/freeradius3#kontrola_shody_vnejsi_a_vnitrni_eap_identity|FreeRADIUS v3]] | ||
- | * test probíhá z ermona | ||
- | * CRITICAL/WARNIG-HARD nastává po **3** neúspěných pokusech | ||
- | * normální perioda testování je **24 hodin** | ||
- | * v případě výpadku se testuje každé **3 hodiny** | ||
- | * notifikace se posílají 1x za 2 dny pro CRITICAL stav | ||
- | ===== Agregované neboli virtuální servery ===== | ||
- | |||
- | {{ :spravce:monitoring:end2end_monitoring:sluzby_monitorovane_na_agregovanem_serveru.png?250|Služby monitorované na agregovaném serveru}} | ||
- | |||
- | Jestliže je organizace připojena k //eduroam//u prostřednictvím | ||
- | několika serverů, tak se každý server monitoruje nezávisle. Aby bylo | ||
- | možné realizovat některé závislosti, bylo nutné nadefinovat virtuální | ||
- | servery, ty slučují všechny servery organizace v jediný. Služby | ||
- | definované na tomto serveru jsou přesnou kopií služeb na jednotlivých | ||
- | serverech organizací. Logika skrytá za těmito agregovanými službami | ||
- | zajišťuje, že služba přejde do CRITICAL stavu jedině když selžou | ||
- | všechny odpovídající služby na fyzických serverech. V případě, že je | ||
- | některý služba v jiném než OK stavu, má agregovaná služba stav WARNING. | ||
- | |||
- | Pro všechny služby na těchto serverech platí: | ||
- | * CRITICAL-HARD stav nastává po **1** pokusu | ||
- | * normální perioda testování je **1 minuta** | ||
- | * v případě výpadku se testuje každou **1 minutu** | ||
- | * notifikace se **ne**posílají | ||
- | |||
- | ==== Tvorba jmen virtuálních serverů ==== | ||
- | |||
- | Původně se vytvářely virtuální servery podle toho, který realm | ||
- | obsluhovaly, to ale vedlo v k tomu, že virtuálních serverů bylo víc | ||
- | než bylo nezbytně nutné a díky tomu bylo i zbytečně mnoho služeb v | ||
- | systému. Používala se jména aggregated.<realm>. Nyní se generují jména | ||
- | virtuálních serverů na základě jmen serverů, ze kterých se virtuální | ||
- | server skládá. Například: | ||
- | |||
- | * radius.cesnet.cz => radius.cesnet.cz | ||
- | * radius1.cesnet.cz + radius2.cesnet.cz => radius1_AND_radius2.cesnet.cz | ||
- | * radius1.cesnet.cz + radius2.cesnet.cz + radius3.cesnet.cz => radius1_AND_radius2_AND_radius3.cesnet.cz | ||
- | * radius.etest.cesnet.cz + radius.cesnet.cz => radius.etest_AND_radius.cesnet.cz | ||
- | * radius.cesnet.cz + radius.ces.net => radius.cesnet.cz_AND_radius.ces.net | ||
- | |||
- | ===== Systémové servery ===== | ||
- | |||
- | Monitoring monitoruje kromě serverů i systémové servery. Jedná se o | ||
- | |||
- | ==== GW ==== | ||
- | |||
- | Gateway, zajišťuje připojení monitorovacího systému k Internetu. Každá | ||
- | služba, která můžete vyvolat notifikaci, závisí na **GW/PING**, což | ||
- | zajišťuje, že monitoring "neobšťastní" všechny správce po | ||
- | výpadku konektivity monitoringu poštou. | ||
- | |||
- | ==== radius1 a radius2.eduroam.cz ==== | ||
- | |||
- | NREN RADIUS servery zodpovědné za transport RADIUS paketů mezi | ||
- | organizacemi v rámci //eduroam.cz//, ale také zajišťují spojení s | ||
- | toplevel servery //eduroam//u. Monitorované služby: | ||
- | |||
- | === PING === | ||
- | |||
- | === PING-etlr1 a PING-etlr2 === | ||
- | |||
- | Ping z NREN serveru na první, respektive druhý toplevel server. | ||
- | |||
- | === RADIUS === | ||
- | |||
- | RADIUS na NREN serveru. Testuje se pomocí lokálního účtu, takže | ||
- | výpadek skutečně znamená výpadek služby RADIUS na tomto serveru. | ||
- | |||
- | === RADIUS-etlr1 a RADIUS-etlr2 === | ||
- | |||
- | RADIUS na toplevel serverech. Zatím se testuje jen pomocí účtu v | ||
- | surfnet.nl, takže výpadek těchto služeb nutně nemusí znamenat, že | ||
- | došlo k výpadku národních serverů. | ||
- | |||
- | === RACOON === | ||
- | |||
- | RACOON je daemon zodpovědný za výměnu šifrovacích tajemství pro IPSEC, | ||
- | čas od času nemá svůj den a dostane se do dead-locku. Oba NREN servery se | ||
- | samy kontrolují a v případě potřeby tuto službu restartují. Více | ||
- | informací viz FIXME odkaz do archivu konference. | ||
- | |||
- | ===== Skupiny služeb a serverů ===== | ||
- | |||
- | Pro snazší orientaci ve značném množství serverů a služeb jsou | ||
- | definovány skupiny, které slučují související objekty a usnadňují | ||
- | navigaci. | ||
- | |||
- | ==== Skupiny serverů ==== | ||
- | |||
- | * [[https://ermon.cesnet.cz/nagios/cgi-bin/status.cgi?hostgroup=gw&style=detail|Gateway]] systémové servery | ||
- | * [[https://ermon.cesnet.cz/nagios/cgi-bin/status.cgi?hostgroup=Unsorted+servers&style=detail|Unsorted]] servery, které nepatří do žádné jiné skupiny. Jestliže je server v téhle skupině, téměř jistě není pořádně dokonfigurován. | ||
- | * semikwin2003s.cesnet.cz je pokusný Win2003 server určený k pokusům s IPsec na Windows. | ||
- | * cyrus.cesnet.cz slouží pro dočasné napojení IP telefonie k eduroam infrastruktuře | ||
- | * Everyone at <realm.cz>, agreguje servery zodpovědné za určitý realm, například [[https://ermon.cesnet.cz/nagios/cgi-bin/status.cgi?hostgroup=cesnet.cz&style=detail|Everyone at cesnet.cz]] | ||
- | |||
- | ==== Skupiny služeb ==== | ||
- | |||
- | * [[https://ermon.cesnet.cz/nagios/cgi-bin/status.cgi?servicegroup=%40cesnet.cz&style=detail|Realm cesnet.cz at everywhere]] zobrazuje, jak se uživatelé s realmem cesnet.cz budou ověřovat na jednotlivých RADIUS serverech, tj. institucích. | ||
- | * [[https://ermon.cesnet.cz/nagios/cgi-bin/status.cgi?servicegroup=IPSEC&style=detail|IPSEC at everywhere]] | ||
- | * [[https://ermon.cesnet.cz/nagios/cgi-bin/status.cgi?servicegroup=IPSEC-radius1.eduroam.cz&style=detail|IPSEC-radius1.eduroam.cz at everywhere]] | ||
- | * [[https://ermon.cesnet.cz/nagios/cgi-bin/status.cgi?servicegroup=IPSEC-radius2.eduroam.cz&style=detail|IPSEC-radius2.eduroam.cz at everywhere]] | ||
- | * [[https://ermon.cesnet.cz/nagios/cgi-bin/status.cgi?servicegroup=PING&style=detail|PING at everywhere]] | ||
- | |||
- | ===== Matice dostupnosti ===== | ||
- | |||
- | {{ :spravce:monitoring:end2end_monitoring:matice_dostupnosti.png?250|Matice dostupnosti}} | ||
- | |||
- | Skupiny služeb a serverů sice trochu usnadňují orientaci v množství | ||
- | dat, ale neumožňují vidět aktuální stav sítě najednou. Proto jsem | ||
- | vytvořil na Nagiosu nezávislou matici dostupnosti. V ní jsou na řádcích | ||
- | buď lokality nebo servery organizací a na sloupcích jsou uvedeny | ||
- | jednotlivé realmy. Díky tomu lze na téměř první pohled okamžitě zjistit, | ||
- | kde co nefunguje. | ||
- | |||
- | K matici je volný přístup, adresa je [[https://ermon.cesnet.cz/matrix/]]. | ||
- | |||
- | ===== Nagios ===== | ||
- | |||
- | Jak už jsem zmínil několikrát výše, jádrem celého monitoringu je | ||
- | Nagios. Jeho webové rozhraní je k dispozici na adrese | ||
- | https://ermon.cesnet.cz/nagios/, přístup mají jen uživatelé, kteří mají | ||
- | účet v CESNET CAAS. | ||
- | |||
- | |||
- | ====== ====== | ||
- | --- //[[http://staff.cesnet.cz/~semik|Jan Tomášek]] 19.03.2008 16:25// připsány informace o testech BIG-PACKET a VCELKA-MAJA\\ | ||
- | --- //[[http://staff.cesnet.cz/~semik|Jan Tomášek]] 22.06.2006 09:44// napsán text o aktuální implementaci\\ | ||
- | --- //[[http://staff.cesnet.cz/~semik|Jan Tomášek]] 14.06.2006 17:34// napsán úvod a teoretický výpočet generované zátěže |