OSPF Hızlı Yakınsama ve Kararlılık

 

Etkiliyen Unsurlar :

1 – Tek bir router’ın komşuluk sayısı : 60-70 arası önerilen.

2 – Bir area’daki router sayısı. 50’den fazla önerilmiyor.

3 – Bir ABR/ASBR üzerindeki alan sayısı. 3’den fazla önerilmiyor.

4 – DR/BDR seçimi. CPU kullanımı az olan seçilmeli.

OSPF’de hızlı yakınsama :

1 – Sorun tespiti

2 – Sorunun bildirimi

3 – Hata noktası çevresinden, yeni topology’nin tespiti

4 – RIB tablosunun güncellenmesi

5 – FIB tablosunun güncellenmesi

1-4-5. adımlar genelde tüm routing protocollerinde benzerdir ve yakınsama aslında en fazla bu adımlardan etkilenir. Özellikle 1-2 adımlar süre olarak en fazla etkiliyen adımlardır. Burada IGP timerlerı (Hello,dead-time vb) gibi poll based event detection yaklaşımını beklemek zman kaybı olabilir. Bunun yerine olay bazlı (carrier loss, BFD failure, UDLD vb) bir yaklaşımı tercih etmek daha hızlı olabilir. Günümüzde linklerin büyük bir çoğunluğu ethernet tabanlı servislere dayanmakta, dolayısı ile buralarda hata algılama IGP timerlarına bırakılır ise oldukça fazla zaman kaybedilebilir. Buradaki yaklaşım elverdiğince BFD kullanmak olmalıdır. IGP bazında yakınsamayı en aza indirmek için 2 ve 3 adımları iyileştirmek gerekir.

“The detection of network failures consumes most of the convergence time budget in typical designs”

“Event driven detection of link or neighbor failures is almost always going to be faster than polled detection of these failures.
For instance, detecting the loss of carrier on a point-to-point Ethernet link is always faster than detecting the loss of three “hello” or “status” packets no matter how fast those hello packets are transmitted, received, and processed.”

Russ White, Mosaddaq Turabi CCDE Quick Reference 

Yakınsama zamanı, hatının yayılımı (LSA timers), SPF zamanlarına ve SPF hesaplama sürelerine bağlıdır. Eğer birden fazla alan/area/domain içeren bir yayılım söz konusudur ve link state protcollerinin alanlar arası yakınsaması link vektor tip protocolere benzer (area/lsa summerization’dan dolayı).

Ayrıca tüm ağ bazında yakınsama, kullanılan tüm kontrol protokolleri için yakınsama süresini içerir. Dolayısı ile kullanılan diğer kontrol protokollerinin yakınsamasıda unutulmamalıdır (BGP, MPLS, LDP vb.). LDP IGP sync, BGP PIC Edge konularınada bakılması önerilir.

Yapılabilecekler :

Genel olarak OSPF/IS-IS içerisinde çok fazla prefix kullanılmamlıdır. Özellikle müşteri routeları, edge networkler, çok fazla up/down olduğu için OSPF/IS-IS gibi link-state protokolleri ile taşınması uygun değildir. Bunun yerine IBGP bu amaç için kullanılabilir. OSPF/IS-IS ise IBGP next-hop bilgilerini taşımak için kullanılır. Unified MPLS/Seamless MPLS.

Bunun ötesinde IGP için komşuluk kurma, hatayı hızlı algılama, bir döngüye yol açmıyacak şekilde hata dışında yeni bir yol hesaplama gibi işlemlerin hızlıca yapılması gerekir.

carrier delays : carrier-delay komutu ile ayarlanabilinir. Interface’in fiziksel seviyede down olarak bildirilmesi için geçen süre.

carrier-delay down msec 0
carrier-delay down up 10

ip event damping : BGP damping’e benziyen işlem.

Hello/dead timers (fast hellos) : Komşuluk için hızlı hello değiş tokuşu, yakınsama işlemini hızlandırır. Bir çok vendorun fast hello uygulaması mevcuttur. Fakat yine’de OSPF dead interval 1sn’den az olamaz. Dolayısı ile BFD bu konuda yardımcı olur.

Bidirectional Forwarding Detection(BFD) : Indirect link bağlantılarında P2P ve MP BFD kullanımı.

LSA packet pacing : Süresi dolan ve yeniden yollanması gereken, retransmit edilmesi gereken (ACK almamış) ve flood edilmesi gereken LSA’larin guruplanarak gönderilmesi. Büyük networklerde ayarlanması gerekebilir.

show ip ospf | inc transmission|pacing
LSA group pacing timer 240 secs
Interface flood pacing timer 33 msecs
Retransmission pacing timer 66 msecs

Exponential throttle timers for LSA :

İnterface down/flap benzer bir konudur. Alınan bir hatanın ne kadar zaman sonra raporlanacağı şeklinde düşünülebilir. Çok hızlı up/down olan bir interface kararlı olana kadar raporlamak istemiyebilirsiniz, bir kere down raporunu geçip kararlı bir şekilde up olana kadar beklersiniz. Burada sorun ne kadar zaman hata bildirimini tutup, ne zaman bildireceğimizdir. Cisco bu konuda exponential back-off timer denilen bir yöntem kullanmaktadır. Bu yöntemde 3 adet farklı zaman kullanılır.

start interval : Hatanın ne kadar zaman sonra bildirileceği .

increment : ikinci, üçüncü, ve sonraki hata bildiriminin ne kadar zaman sonra yapılacağını göstere çarpan.

max_wait : Bir hata bildirimi için en fazla ne kadar beklenebileceği.

OSPF LSA Throttling
OSPF LSA Throttling

Show ip ospf ile bakıldığında;

“Initial SPF schedule delay…,” “Minimum hold time between two consecutive SPFs…,” ve “Maximum wait time between two consecutive SPFs….”  görülen değerler throttle timer’larını gösterir.

LSA arrival interval (reception delay) : İlk alınan LSA dışında, gelen aynı LSA’larin kabulu için (dikkat LSA gönderen router’da değil, kabul eden de) geçmesi gereken süreyi belirtir. Eğer LSA throttle timer’ları değiştirilmiş ise bu değerinde hesaplanması gerekir. Zira eğer LSA hold time’den daha düşük bir değer verilir ise, LSA drop edilebilir.

LSA processing delay : LSA’in flood listesine konması için gecikme süresi. Hızlı yakınsama için SPF processin çalışmasından önce LSA’ler flood edilmelidir. Cisco’da OSPF için SPF çalışmadan önce LSA flood edilmesini sağlıyacak bir mekanızma yok. Fakat LSA flood pacing timer kullanılabilir. timers pacing flood bu işlem için kullanılır (varsayılan değeri 55msec).

http://www.cisco.com/en/US/docs/ios/12_2s/feature/guide/fs_spftrl.html

Exponential throttle timers SPF : Ağ’ın hata sonrası yeni yapıya hızlı olarak yakınsaması her cihazın aynı veri tabanına sahip olması ile açıklanabilir. Bunun için;

iSPF : Sadece ağın hatadan etkilenen kısımlarının SPF çalıştırması olarak açıklanabilir.

Hızlı yakınsama için SPF’nin çalışma süresini kısa tutmak gereklidir. Fakat ne kadar kısa olacağı başka sorunlara yol açar. En azından LSA flood süresinden uzun olmalıdır, ilk olarak hatayı ağ’a yay, daha sonra hesapla.

Incremental SPF : Ağın sadece hata’dan etkilenen kısmının SPF çalıştırması için.

Loop-Free Alternate Fast Reroute, Remote LFA :

 

Önerilen :

router ospf x
router-id x
ispf
log-adjacency-changes detail
nsf
timers throttle spf 50 50 5000
timers throttle lsa 10 20 5000
timers lsa arrival 10 ! IOS XR gerek yok.
timers pacing flood 5
mpls traffic-eng router-id Loopback0
mpls traffic-eng area 0

interface GigabitEtherneX
description ### backbone interface ###
bandwidth 5000
ip mtu 1500
ip ospf network point-to-point
ip ospf bfd
ip ospf cost 15
mpls ip
mpls label protocol ldp
mpls traffic-eng tunnels
bfd interval 200 min_rx 200 multiplier 3

Linkler :

http://www.ciscopress.com/articles/article.asp?p=1763921&seqNum=6

Which Routing Protocol? IPv4 and IPv6 Perspective BRKIPM-3010

http://blog.ine.com/2009/12/31/tuning-ospf-performance/

http://blog.ine.com/2010/06/02/ospf-fast-convergenc/

Routed Fast Convergence and High Availability

Leave a Reply

Your email address will not be published.