Drzewo splay

Ten artykuł od 2014-06 zawiera treści, przy których brakuje odnośników do źródeł.

Należy dodać przypisy do treści niemających odnośników do źródeł. Dodanie listy źródeł bibliograficznych jest problematyczne, ponieważ nie wiadomo, które treści one uźródławiają.
Sprawdź w źródłach: Encyklopedia PWN • Google Books • Google Scholar • Federacja Bibliotek Cyfrowych • BazHum • BazTech • RCIN • Internet Archive (texts / inlibrary)
Dokładniejsze informacje o tym, co należy poprawić, być może znajdują się w dyskusji tego artykułu.
Po wyeliminowaniu niedoskonałości należy usunąć szablon {{Dopracować}} z tego artykułu.

Drzewo splay (drzewo rozchylane, drzewo Sleatora-Tarjana^[1]) – struktura danych w formie samodostosowującego się drzewa poszukiwań binarnych (BST), wynaleziona przez Daniela Sleatora i Roberta Tarjana, reprezentująca zbiór elementów z porządkiem liniowym.

Wykonywanie podstawowych operacji na drzewie splay wiąże się z wykonaniem procedury $\mathrm {Splay} (T,x),$ która powoduje taką zmianę struktury drzewa $T,$ że węzeł $x$ zostaje umieszczony w korzeniu przy zachowaniu porządku charakterystycznego dla drzewa BST.

W porównaniu do innych drzew BST, drzewa splay zmieniają swoją strukturę również podczas wyszukiwana kluczy (a nie tylko dodawania lub usuwania), przesuwając znaleziony węzeł w kierunku korzenia, dzięki temu często wyszukiwane węzły stają się szybsze do znalezienia. Z tego powodu drzewa splay bywają wykorzystywane w systemach typu cache. Drzewa splay nie są samorównoważące, ponieważ ich wysokość nie jest ograniczona przez ${\mathcal {O}}(\log n)$ – można np. tak wykonać operacje, że drzewo zdegeneruje się do listy.

Podstawowe operacje na drzewie splay, tj. wyszukiwanie elementu oraz wstawianie i usuwanie, są wykonywane w zamortyzowanym czasie ${\mathcal {O}}(\log n),$ gdzie $n$ jest liczbą elementów w drzewie^[2]. Oznacza to, że dla dowolnego ciągu $m$ operacji na drzewie splay, łączny koszt wykonania tych operacji jest rzędu ${\mathcal {O}}(m\log n).$

Operacja Splay

Operacja Splay jest procedurą kluczową dla działania drzewa typu splay. Polega ona na wykonaniu sekwencji kroków, z których każdy przybliża element $x$ do korzenia. Każdy krok polega na wykonaniu jednej lub dwóch rotacji względem krawędzi wchodzących w skład początkowej ścieżki od $x$ do korzenia.

W każdym kroku procedury $\mathrm {Splay} (T,x)$ niech $p$ oznacza ojca węzła $x,$ a jeśli $p$ nie jest korzeniem, niech $g$ oznacza z kolei jego ojca (i dziadka $x$ ). Wyróżniamy trzy przypadki kroków procedury Splay, w zależności od tego czy $p$ jest korzeniem i od wzajemnego położenia węzłów $x,$ $p$ i $g$ ^[2]:

Krok zig

Wykonywany kiedy $p$ jest korzeniem, polega na rotacji drzewa względem krawędzi $(p,x).$ Ten krok może być wykonany tylko jako ostatni krok procedury Splay.

Krok zig-zig

Wykonywany kiedy $p$ nie jest korzeniem, a $(p,x)$ i $(g,p)$ są krawędziami w jedną stronę, tj. $x$ jest lewym synem $p,$ który jest lewym synem $g,$ albo $x$ jest prawym synem $p,$ a $p$ – prawym synem $g.$ Polega na rotacji względem krawędzi $(g,p)$ łączącej ojca i dziadka wierzchołka $x,$ a potem względem krawędzi $(p,x)$ łączącej $x$ z jego ojcem.

Krok zag-zig

Wykonywany kiedy $p$ nie jest korzeniem, oraz $x$ jest lewym synem $p,$ a $p$ – prawym synem $g$ lub odwrotnie. W tym kroku najpierw wykonuje się rotację względem krawędzi $(p,x),$ a następnie względem krawędzi $(g,x),$ która powstaje w wyniku pierwszej rotacji.

Implementacje podstawowych operacji

W opisie implementacji operacji na drzewie splay będziemy utożsamiali wierzchołek z przechowywaną w nim wartością.

Wyszukiwanie

Wyszukiwanie wierzchołka zawierającego daną wartość odbywa się jak w drzewie BST, przy czym jeżeli wyszukiwanie zakończyło się powodzeniem, a szukana wartość znajduje się w węźle $x,$ to wywołujemy $\mathrm {Splay} (T,x).$ W przeciwnym wypadku wykonujemy $\mathrm {Splay} (T,y),$ gdzie $y$ jest ostatnim węzłem drzewa odwiedzonym przy wyszukiwaniu.

Wstawienie

Aby wstawić do drzewa $T$ wartość $x,$ wyszukujemy $x$ w $T$ jak powyżej, wskutek czego w korzeniu znajduje się wartość $y.$ Jeżeli $x=y,$ to wstawienie jest zakończone, ponieważ oznacza to, że przed wstawieniem w $T$ już znajdowało się $x.$ W przeciwnym wypadku przyjmijmy, że $y<x$ (sytuacja odwrotna jest symetryczna). Odcinamy od $y$ jego prawe poddrzewo $R$ i tworzymy nowy węzeł zawierający $x,$ którego lewym synem czynimy $y,$ a prawym – korzeń poddrzewa $R$ ^[3].

Usuwanie

Aby usunąć z drzewa $T$ wartość $x,$ wyszukujemy $x$ jak powyżej. Teraz $x$ znajduje się w korzeniu i ma poddrzewa: lewe $L$ i prawe $R.$ Usuwamy wierzchołek $x,$ a następnie wyszukujemy w $L$ wartości $x,$ co powoduje przemieszczenie do korzenia $L$ największej wartości w poddrzewie $L.$ Do korzenia $L$ podłączamy $R$ jako prawe poddrzewo^[3].

Inne operacje

W drzewach splay szczególnie łatwo jest zaimplementować operacje split – dzielenia drzewa $T$ na dwa drzewa $A$ i $B$ tak, że wszystkie elementy w $A$ są mniejsze, a w $B$ – większe od zadanej wartości $x,$ oraz join – połączenia dwóch drzew $A$ i $B$ takich, że każdy element w $A$ jest mniejszy niż każdy element w $B.$

$\mathrm {Split} (T,x){:}$ wyszukaj w $T$ element $x$ zgodnie z algorytmem podanym powyżej, następnie w zależności od tego, czy w korzeniu jest obecnie wartość większa czy mniejsza od $x$ dzielimy drzewo, usuwając krawędź z korzenia do lewego bądź prawego syna.

$\mathrm {Join} (T_{1},T_{2}){:}$ W $T_{1}$ wyszukujemy dowolny element z $T_{2},$ w wyniku czego w korzeniu $T_{1}$ pojawia się wierzchołek z największą wartością z $T_{1},$ który nie ma prawego syna. Jako jego prawego syna podłączamy korzeń drzewa $T_{2}.$

Zalety i wady drzew splay

Drzewo splay charakteryzuje się asymptotycznie takim samym średnim kosztem dostępu, co samorównoważące się drzewa BST, w tym drzewa AVL oraz drzewa czerwono-czarne. Mimo to, w przypadku jednakowych prawdopodobieństw dostępu do poszczególnych elementów, drzewa splay działają w praktyce (choć nie asymptotycznie) wolniej niż inne tego typu drzewa, które dodatkowo posiadają ograniczenia na pesymistyczny koszt operacji. Zaletą drzew splay jest optymalizowanie dostępu przez przesuwanie wartości, do których ostatnio uzyskiwano dostęp, blisko korzenia, co powoduje ich dużą przydatność w implementacji pamięci cache i algorytmów odśmiecania.

Inną zaletą drzew splay w stosunku do drzew AVL i czerwono-czarnych jest łatwiejsza implementacja oraz niski nakład pamięciowy na przechowywanie drzewa. Sleator i Tarjan w swojej pracy^[2] o drzewach typu splay opracowali sposób implementacji drzew splay wymagający takiej samej pamięci, jak standardowa implementacja drzew BST, w której w węźle przechowywane są jedynie: przechowywany element oraz dwa wskaźniki.

W przeciwieństwie do innych wyważonych drzew BST łatwo zaimplementować wariant drzew typu splay, który może przechowywać powtarzające się wartości (reprezentuje multizbiór).

Zobacz też

Przypisy

↑ Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, Clifford Stein ↓, s. 432.
↑ ^a ^b ^c D. Sleator, R. Tarjan, Self-Adjusting Binary Search Trees [1].
↑ ^a ^b K. Diks, A. Malinowski, W. Rytter, T. Waleń, Algorytmy i struktury danych – słowniki, materiały dydaktyczne w serwisie wazniak.mimuw.edu.pl [2].