venerdì 21 gennaio 2011

Configurare un failover su un doppio link WAN tramite IP SLA

L'IP SLA (Ip service level agreements) è una funzionalità dell'IOS Cisco che permette agli amministratori di rete di analizzare il livello di servizio IP per le applicazioni ed i servizi. IP SLA utilizza il monitoraggio attivo del traffico dati della rete, misurando l'effettivo sovraccarico delle performance della rete.
L'IP SLA può essere utilizzato anche per gestire il failover tra due connessioni WAN nel caso in cui si abbia un router con una connessione a due ISP (primario e backup).
Si potrebbero usare delle rotte statiche oppure l'utilizzo di un protocollo di rete (BGP).Nell'esempio di seguito avremo un link WAN ridondato in failover tramite la feature IP SLA con NAT.




track 1 ip sla 1 reachability
!
interface FastEthernet0/1
 description verso l' ISP 1 (Primario)
 ip address 192.168.1.1 255.255.255.252
!
interface FastEthernet0/2
 description verso l' ISP 2 (Secondario)
 ip address 10.0.0.1 255.255.255.252
!
!
ip route 0.0.0.0 0.0.0.0 192.168.1.2 track 1
ip route 0.0.0.0 0.0.0.0 10.0.0.2 10
!
ip sla 1
 icmp-echo 4.2.2.2 source-ip 192.168.1.1
 timeout 500
 frequency 1
ip sla schedule 1 life forever start-time now
ip sla enable reaction-alerts
!



Questa configurazione invia echo icmp verso un IP verso internet (4.2.2.2.), ha un indirizzo IP sorgente sull'interfaccia connessa all'ISP primario preferito (rotta SLA da tracciare), se il ping fallisce la rotta statica verso il default gateway (192.168.1.2) viene rimossa dal routing table , a questo punto la seconda rotta statica che punta al default gateway di backup (10.0.0.2) sarà l'unica default route disponibile ed utilizzata dal traffico dati.
E' importante specificare che l'indirizzo sorgente per il ping sia l'indirizzo IP del router della subnet 192.168.1.2, se non si rispetta questa regola la seconda rotta diventerà attiva in quanto la prima rotta non sarà più in grado di inviare ping, il track statement inizierà a funzionare in quanto il ping verso 4.2.2.2 viaggerà sul link secondario reinstallando nuovamente la rotta come se il link primario fosse non funzionante, e dunque, ci sarebbe una ripetizione del processo. 
Di seguito i log di raggiungibilità del tracking:
*Mar  1 21:44:41.715: %TRACKING-5-STATE: 1 ip sla 1 reachability Up->Down
*Mar  1 21:47:21.971: %TRACKING-5-STATE: 1 ip sla 1 reachability Down->Up