sobota, 8 września 2012

Mediana zysków jako kryterium optymalizacji – przykład dla hierarchicznego dwupoziomowego systemu transakcyjnego dla EURUSD


Rozpoczęte niedawno formułowanie założeń i oznaczeń dla systemu transakcyjnego o trzech poziomach hierarchii jest zadaniem złożonym. Samo formalne zdefiniowanie struktur danych i zależności funkcyjnych pomiędzy nimi zapewne zajmie kilka wpisów, a implementacja algorytmów optymalizacji i generowania trajektorii dla poszczególnych układów parametrów również będzie zadaniem dość czasochłonnym. Ponieważ długie serie rozważań czysto teoretycznych mogą być nieco męczące, dziś proponuję jako przerywnik powrót do modelu o dwóch poziomach hierarchii. Aby totalnie nie spisywać tego systemu na straty, przeprowadziłem symulację gry na tym samym zbiorze danych jak poprzednio z tą różnicą że do optymalizacji parametru p zastosowałem inną funkcję celu.



Funkcją, która podlegała maksymalizacji ze względu na parametr p, był jak pamiętamy iloraz skumulowanych zysków na końcu okresu m interwałów przez maksymalne nominalne obsunięcie w tym samym czasie. Podejście to można łatwo uogólnić, przyjmując jako miarę optymalności iloraz pewnego wskaźnika zysku przez pewien wskaźnik ryzyka. Zauważmy przy tym, że łączny skumulowany zysk jest odpowiednikiem średniej próbkowej ciągu zysków na wszystkich interwałach – różnica polega jedynie na podzieleniu przez liczbę interwałów, która przy ustalonym okresie optymalizacji nie ma znaczenia. Jak pamiętamy z elementarnego kursy statystyki i rachunku prawdopodobieństwa, średnia próbkowa jest estymatorem wartości oczekiwanej zmiennej losowej. Nie jest to jednak jedyny estymator tej wielkości – innym, znanym ze względu na własność odporności na skrajne odchylenia, jest mediana ciągu obserwacji. Samo wyznaczenie tej oceny jest proste, wymaga wykonania operacji sortowania odpowiedniej sekwencji zysków.

A jaką wielkość przyjąć jako wskaźnik ryzyka? Oczywiście nic nie stoi na przeszkodzie, aby nadal używać maksymalnego obsunięcia. Jednak przy okazji eksperymentu z modyfikacją funkcji celu, warto wprowadzić kolejny wskaźnik. W pierwszej kolejności warto zauważyć, że jedną z własności mediany jest to, że minimalizuje ona sumę wartości bezwzględnych różnic od wszystkich obserwacji w rozpatrywanej sekwencji:


W konsekwencji tego prostego faktu narzuca się równie prosty i intuicyjny pomysł, aby właśnie tę wartość, która po podzieleniu przez długość sekwencji jest również znanym ze statystyki odchyleniem bezwzględnym, zastosować jako miarę ryzyka, co prowadzi w ostateczności do następującej formuły dla optymalizacji parametru p


Przyjąłem tutaj, dla uproszczenia zapisu, że symbol med(p) oznacza medianę sekwencji zysków wygenerowanych dla zadanej wartości parametru p.

Co do eksperymentu symulacyjnego, to jego warunki są identyczne jak w przypadku pierwszego testu opisanego tutaj. Wyniki w postaci charakterystyk przedstawia poniższy wykres.



Zgodnie z konwencją, przedstawioną np. przy okazji pierwszego wykresu zbiorczego, strategie podążające za trendem oznaczam kolorem niebieskim, antytrendowe – czerwonym, ich połączenie – zielonym. Czarna przerywana linia oznacza tutaj MDD strategii połączonej.

Wnioski z analizy wykresów pozostawiam czytelnikowi, między innymi dlatego, że w kolejnym wpisie przedstawię podobny wykres, uzyskany dla jeszcze innej funkcji celu, którą chciałbym przy tej okazji wprowadzić.

Kontynuacja wątku tutaj.

2 komentarze:

  1. Wykres bardzo niestabilny, może dałoby się to jakoś mierzyć. Odchylenie standardowe nie jest raczej dobre, ale może średnia z modułów różnicy pomiędzy kolejnymi punktami?

    OdpowiedzUsuń
    Odpowiedzi
    1. Też sądzę że warto to jakoś ująć liczbowo. Ponieważ mam w planie przedstawić analogiczne wykresy jeszcze dla 2-3 propozycji funkcji kryterium, w międzyczasie pomyślę nad jakimś podsumowaniem liczbowym. Będzie można to zebrać w tabelce i porównać, bo ocena wzrokowa czasami jest łudząca.

      Usuń