Omawiany
artykuł to Lahmiri S. Wavelet Transform, Neural Networks and The Prediction of S&P Price Index: A Comparative Study of Backpropagation Numerical Algorithms. Business Intelligence
Journal, July 2012, Vol.5 No.2, pp. 235-234. Czasopismo, w którym został opublikowany należy do kategorii
czasopism bezpłatnie dostępnych online, inaczej określanych jako
open-access. Można
w tym miejscu zdziwić się, dlaczego podkreślam ten fakt.
Ostatecznie w sieci jest mnóstwo materiałów dostępnych za darmo,
zaczynając od blogów, poprzez fora aż do portali. Jedynie niektóre
zawierają części płatne, w przypadku tematyki finansowej
zazwyczaj związane z dostępem do komunikatów i notowań bez
opóźnień bądź też rekomendacjami renomowanych analityków.
Jednak w przypadku czasopism naukowych darmowy dostęp jest raczej
wyjątkiem niż normą – wydawnictwo, szczególnie o wysokiej
renomie, musi realizować proces recenzji i redagowania. A chcąc
zachować wysoki poziom, wyrażany np. wskaźnikiem impact factor musi ponosić niemałe koszty tego procesu, które docelowo
przerzuca na czytelnika. Natomiast w modelu „open access” koszty
te, o ile nie są pokrywane przez jakiegoś sponsora, ponosi
nierzadko – choć może to się wydawać zaskakujące - sam autor.
Z punktu widzenia nas, czytelników, istotny jest w każdym razie
fakt, że stanowi to źródło ciekawych i wartościowych tekstów.
Co
do samego artykułu, to jego autor przyjął za cel porównanie
skuteczności predykcji, czyli inaczej prognozowania wartości
S&P500, a dokładnie kontraktu na ten indeks z wykorzystaniem
kombinacji sieci neuronowych oraz analizy falkowej. Połączenie tych
podejść polega na wyznaczeniu w pierwszej kolejności transformacji
falkowej dla danych wejściowych. W dalszej kolejności następuje
uczenie sieci neuronowej za pomocą metody wstecznej propagacji
błędu. Ma to na celu jak najlepsze odwzorowanie w komórkach sieci
informacji zawartej w przeszłych notowaniach tak, aby móc uzyskać
skuteczne i dobre prognozy dla interwałów przyszłych. Co inaczej
można określić jako wzmiankowaną przeze mnie wcześniej zdolność uogólniania. Ponieważ tę wielkość należy jakoś
skwantyfikować, w teorii prognozowania istnieją klasyczne
wskaźniki, które wyrażają liczbowo błędy i rozrzut prognoz, a
więc przez to pozwalają ocenić ich skuteczność.
I
właśnie jednym z powodów, dla których warto sięgnąć po ten
artykuł jest zestawienie takich podstawowych wskaźników wraz ze
wzorami, które autor zawarł na dole str. 239 czasopisma. W ogóle
zakres metod stosowanych przez autora jest szeroki, zatem ich opis
jest z konieczności bardzo skrótowy. Jednak to stanowi właśnie, w
moim odczuciu, zaletę tekstu, ponieważ pozwala zdobyć wstępną
wiedzę i intuicję na temat pewnych metod z dziedziny inteligencji
obliczeniowej. Z całą pewnością jest to bardziej przystępna
droga do poznania czegoś nowego, niż zaczynanie od studiowania
kilkusetstronicowych podręczników i monografii, które mogą
zniechęcać do lektury już od pierwszego spojrzenia.
Innym
elementem artykułu, na który zwracam uwagę, jest zwięzły opis
funkcji autokorelacji, któremu towarzyszą uwagi na temat jej
interpretacji. Funkcja to została wykorzystana przez autora do oceny
liczby opóźnionych obserwacji indeksu, niezbędnych do dalszej
obróbki w procesie predykcji. Ponieważ funkcja ta będzie przydatna
w dalszych naszych badaniach, traktuję ten wpis jako okazję do
pierwszej wzmianki na jej temat.
Organizacja
eksperymentów numerycznych jest zgodna z kanonem obowiązującym w
tej dziedzinie. Zbiór przetwarzanych danych został podzielony na
część uczącą (przeznaczoną do trenowania sieci) oraz część
testową (do oceny jakości prognozy). Wyniki zostały szeroko
omówione, włącznie z dyskusją na temat szybkości zbieżności i
złożoności czasowej obliczeń.
Natomiast
lektura tego artykułu stanowi dla mnie pretekst do krótkiej uwagi,
że metoda prognozowania, choćby najlepsza, sama w sobie nie jest
jeszcze systemem transakcyjnym. Co więcej, możliwa jest taka
konstrukcja systemu, że nie wymaga on stawiania prognoz explicite.
Co nie oznacza bynajmniej, że nie warto takich metod poszukiwać i
doskonalić. Jednak aby na bazie prognoz otrzymywać systemy
transakcyjne, należy metody takie uzupełniać o zestawy niezbędnych
reguł działania. Co, jak się nietrudno domyślić, stanowi
zagadnienie złożone i niełatwe, zatem będę do niego
niejednokrotnie powracać.
"Finally, unlike the literature, we found that, previous price index values outperforms wavelet approximation signals to predict future prices of the S&P500 market."
OdpowiedzUsuńCzyli tak jak tu http://www.mql5.com/en/articles/318 lepiej podać ostatnią cenę niż stosować zaawansowaną metodę. Wskaźnik RelMAE pozwala jednym rzutem oka stwierdzić czy metoda ma sens.
Koncepcja ostatniej wartości jako prognozy na kolejny interwał interesuje mnie w kontekście porównania systemów transakcyjnych opartych na prognozowaniu z takimi, które takiej prognozy w ogóle nie potrzebują (jak np. opisywane przeze mnie dotychczas na obu blogach). A stosując jako prognozę ostatnią wartość mam "de facto" brak prognozy, czyli płynne przejście od jednej koncepcji do drugiej. Pomysł takiego badania "chodzi za mną" od jakiegoś czasu, więc pewnie kiedyś zrobię jakiś wątek na ten temat na blogu. Stąd też ta minirecenzja - na razie w charakterze "zahaczenia" tematu.
Usuń