środa, 5 września 2012

Prognozowanie indeksu S&P – minirecenzja artykułu

Na moim blogu planuję zamieszczać od czasu do czasu informacje o interesujących – przynajmniej moim zdaniem – artykułach naukowych o tematyce związanej z szeroko rozumianą dziedziną ekonomii i finansów. Oczywiście szczególnie takich, które opisują wyniki uzyskiwane z wykorzystaniem metod statystycznych oraz inteligencji obliczeniowej. Krótkie omówienia takich artykułów będę opatrywać swoimi własnymi uwagami i przemyśleniami. Cel takich wpisów jest dwojaki. Z jednej strony pozwolą przybliżyć nieco czytelnikom świat teorii naukowych, często postrzegany jako hermetyczny i oderwany od rzeczywistości. A zarazem, odwołując się do opisywanych tam pojęć i metod, rozszerzyć nasz warsztat systemów o nowe narzędzia, bez konieczności powielania treści już raz przez innych napisanych. Dzisiaj pierwszy tekst z tej serii.


Omawiany artykuł to Lahmiri S. Wavelet Transform, Neural Networks and The Prediction of S&P Price Index: A Comparative Study of Backpropagation Numerical Algorithms. Business Intelligence Journal, July 2012, Vol.5 No.2, pp. 235-234. Czasopismo, w którym został opublikowany należy do kategorii czasopism bezpłatnie dostępnych online, inaczej określanych jako open-access. Można w tym miejscu zdziwić się, dlaczego podkreślam ten fakt. Ostatecznie w sieci jest mnóstwo materiałów dostępnych za darmo, zaczynając od blogów, poprzez fora aż do portali. Jedynie niektóre zawierają części płatne, w przypadku tematyki finansowej zazwyczaj związane z dostępem do komunikatów i notowań bez opóźnień bądź też rekomendacjami renomowanych analityków. Jednak w przypadku czasopism naukowych darmowy dostęp jest raczej wyjątkiem niż normą – wydawnictwo, szczególnie o wysokiej renomie, musi realizować proces recenzji i redagowania. A chcąc zachować wysoki poziom, wyrażany np. wskaźnikiem impact factor musi ponosić niemałe koszty tego procesu, które docelowo przerzuca na czytelnika. Natomiast w modelu „open access” koszty te, o ile nie są pokrywane przez jakiegoś sponsora, ponosi nierzadko – choć może to się wydawać zaskakujące - sam autor. Z punktu widzenia nas, czytelników, istotny jest w każdym razie fakt, że stanowi to źródło ciekawych i wartościowych tekstów.

Co do samego artykułu, to jego autor przyjął za cel porównanie skuteczności predykcji, czyli inaczej prognozowania wartości S&P500, a dokładnie kontraktu na ten indeks z wykorzystaniem kombinacji sieci neuronowych oraz analizy falkowej. Połączenie tych podejść polega na wyznaczeniu w pierwszej kolejności transformacji falkowej dla danych wejściowych. W dalszej kolejności następuje uczenie sieci neuronowej za pomocą metody wstecznej propagacji błędu. Ma to na celu jak najlepsze odwzorowanie w komórkach sieci informacji zawartej w przeszłych notowaniach tak, aby móc uzyskać skuteczne i dobre prognozy dla interwałów przyszłych. Co inaczej można określić jako wzmiankowaną przeze mnie wcześniej zdolność uogólniania. Ponieważ tę wielkość należy jakoś skwantyfikować, w teorii prognozowania istnieją klasyczne wskaźniki, które wyrażają liczbowo błędy i rozrzut prognoz, a więc przez to pozwalają ocenić ich skuteczność.

I właśnie jednym z powodów, dla których warto sięgnąć po ten artykuł jest zestawienie takich podstawowych wskaźników wraz ze wzorami, które autor zawarł na dole str. 239 czasopisma. W ogóle zakres metod stosowanych przez autora jest szeroki, zatem ich opis jest z konieczności bardzo skrótowy. Jednak to stanowi właśnie, w moim odczuciu, zaletę tekstu, ponieważ pozwala zdobyć wstępną wiedzę i intuicję na temat pewnych metod z dziedziny inteligencji obliczeniowej. Z całą pewnością jest to bardziej przystępna droga do poznania czegoś nowego, niż zaczynanie od studiowania kilkusetstronicowych podręczników i monografii, które mogą zniechęcać do lektury już od pierwszego spojrzenia.

Innym elementem artykułu, na który zwracam uwagę, jest zwięzły opis funkcji autokorelacji, któremu towarzyszą uwagi na temat jej interpretacji. Funkcja to została wykorzystana przez autora do oceny liczby opóźnionych obserwacji indeksu, niezbędnych do dalszej obróbki w procesie predykcji. Ponieważ funkcja ta będzie przydatna w dalszych naszych badaniach, traktuję ten wpis jako okazję do pierwszej wzmianki na jej temat.

Organizacja eksperymentów numerycznych jest zgodna z kanonem obowiązującym w tej dziedzinie. Zbiór przetwarzanych danych został podzielony na część uczącą (przeznaczoną do trenowania sieci) oraz część testową (do oceny jakości prognozy). Wyniki zostały szeroko omówione, włącznie z dyskusją na temat szybkości zbieżności i złożoności czasowej obliczeń.

Natomiast lektura tego artykułu stanowi dla mnie pretekst do krótkiej uwagi, że metoda prognozowania, choćby najlepsza, sama w sobie nie jest jeszcze systemem transakcyjnym. Co więcej, możliwa jest taka konstrukcja systemu, że nie wymaga on stawiania prognoz explicite. Co nie oznacza bynajmniej, że nie warto takich metod poszukiwać i doskonalić. Jednak aby na bazie prognoz otrzymywać systemy transakcyjne, należy metody takie uzupełniać o zestawy niezbędnych reguł działania. Co, jak się nietrudno domyślić, stanowi zagadnienie złożone i niełatwe, zatem będę do niego niejednokrotnie powracać.

2 komentarze:

  1. "Finally, unlike the literature, we found that, previous price index values outperforms wavelet approximation signals to predict future prices of the S&P500 market."
    Czyli tak jak tu http://www.mql5.com/en/articles/318 lepiej podać ostatnią cenę niż stosować zaawansowaną metodę. Wskaźnik RelMAE pozwala jednym rzutem oka stwierdzić czy metoda ma sens.

    OdpowiedzUsuń
    Odpowiedzi
    1. Koncepcja ostatniej wartości jako prognozy na kolejny interwał interesuje mnie w kontekście porównania systemów transakcyjnych opartych na prognozowaniu z takimi, które takiej prognozy w ogóle nie potrzebują (jak np. opisywane przeze mnie dotychczas na obu blogach). A stosując jako prognozę ostatnią wartość mam "de facto" brak prognozy, czyli płynne przejście od jednej koncepcji do drugiej. Pomysł takiego badania "chodzi za mną" od jakiegoś czasu, więc pewnie kiedyś zrobię jakiś wątek na ten temat na blogu. Stąd też ta minirecenzja - na razie w charakterze "zahaczenia" tematu.

      Usuń