poniedziałek, 24 września 2012

Podsumowanie badań empirycznych dwupoziomowego systemu transakcyjnego

Na przestrzeni kilku niedawnych wpisów przedstawiałem wyniki badań skuteczności systemu transakcyjnego o dwupoziomowym algorytmie adaptacji parametrów działania. Działanie systemu było przebadane dla czterech wybranych par walutowych. Wyniki podawałem w postaci wykresów charakterystyk skuteczności systemu, jak również liczbowych jej ocen zebranych w tabelach. Znaczna ilość danych liczbowych zasługuje na choćby krótkie podsumowanie i omówienie, co spróbuję uczynić w dzisiejszym wpisie.



Na początek przytoczę odnośniki do tekstów zawierających zestawienia wyników dla poszczególnych rozpatrywanych par, tak aby można było łatwo i szybko do nich sięgnąć:


Porównanie zawartości tabel, szczególnie z rozbiciem na strategie podążające za trendem (Foll) oraz strategie antytrendowe (Cont) każe stwierdzić w pierwszej kolejności, że tylko dla pary EURUSD system wychodzi z badania obronną ręką. Przy tym stosunkowo słabo wypada przy zastosowaniu funkcji kryterium opartej o medianę, szczególnie w połączeniu z oceną ryzyka za pomocą klasycznych lub pozycyjnych miar rozrzutu. Znajduje to również potwierdzenie pod względem miar zróżnicowania sąsiednich punktów na charakterystykach, liczonych z modułem (diffmod) czy też z kwadratem(diffsqr). Ich wysokie wartości oznaczają niską stabilność wyników w zależności od parametru m metody, co przekłada się na „poszarpany” kształt charakterystyk.

Podobne zjawisko, przynajmniej w odniesieniu do strategii połączonej (Joint) zachodzi w przypadku AUDUSD. Tam również funkcje kryterium oparte o medianę dawały kiepskie wyniki, również pod względem stabilności. Kształty charakterystyk, z ich zygzakowatymi oscylacjami wokół osi na poziomie zero, również nie wygląda zachęcająco.

Najsłabiej wypadły wyniki dla pary NZDUSD, gdzie wszystkie funkcje kryterialne, zarówno dla pro- jak i antytrendowych wersji dawały wyniki negatywne, w sensie przeważających ujemnych wartości zysku końcowego. Uwagę jedynie przyciągają widoczne na wykresach maksima lokalne, dla których skumulowany zysk strategii połączonej zaledwie zrównuje się z wielkością maksymalnego obsunięcia. Ewentualnie może stanowić to pewien punkt startowy do poszukiwań ciekawych metod adaptacji parametru m w modelu trójpoziomowym, którego rozwój i implementacja właśnie trwają.


Interesujące są natomiast wyniki dla GBPUSD. Pojawiają się tam słabe, można wręcz powiedzieć fatalne efekty działania wersji podążającej, które jednak są rekompensowane stosunkowo dobrymi wynikami strategii kontrariańskiej. Dodatkowo kształt wykresów, na których pojawiają się zakresy w miarę stabilnie występujących wartości dodatnich, sprawia dość optymistyczne wrażenie.

Te krótkie spostrzeżenia mają na celu między innymi znalezienie jakichś „punktów zahaczenia” oraz inspiracji dla optymalizacji systemów na kolejnych poziomach hierarchii. Ostatecznie działanie algorytmów uczących system na trzecim poziomie opierać się będzie między innymi na analizie skuteczności systemu na niższym szczeblu, czyli między innymi badaniu takich charakterystyk i wskaźników jak omawiane tutaj. Oczywiście analizie realizowanej automatycznie na podstawie odpowiednich formuł.

3 komentarze:

  1. Moje wnioski pochodzą też z troszeczkę innych testów, gdyż na interwale godzinnym. Testowana na blogu ilość interwałów to raptem kilka dni przy interwale godzinnym, a ja puszczałem testy w okresie 11 lat.

    Kryteria oparte o medianę, nie dość że najczęściej dają słabsze wyniki, to potrafią też odstawiać niespodziewane numery jak np. MEDIAN/MDD dla AUDUSD. Część takich patologii eliminuje użycie logarytmów zamiast dzielenia w funkcji jakości.

    System trójpoziomowy oparty na pokazanych wzorach najpierw integrujących po m a potem wybierających p, dawał wyniki lepsze od średniej dla systemu dwupoziomowego. Myślę że to jest dobry wynik i rozsądne oczekiwanie, dlatego też wstrzymuję się z implementacją według zaproponowanych na blogu wzorów. Wymagałoby to zmian w architekturze kodu, używało jednego więcej parametru, dla q=1 wyniki są nieciekawe i nie wiadomo jak bardzo się polepszą dla wyższych...

    OdpowiedzUsuń
    Odpowiedzi
    1. Kiedy już zakończę implementacją systemu 3L, to pewnie też przebadam go na różnych interwałach. Wtedy będzie okazja porównać wyniki.
      A na czym polegały wspomniane patologie?

      Usuń
  2. Patologie polegały na tym, że przy wynikach ujemnych są one dużo bardziej ujemne.

    OdpowiedzUsuń