Niedawne rozważania na temat roli wnioskowania indukcyjnego w
tworzeniu systemów transakcyjnych podsumowałem stwierdzeniem, które
stanowi argument na rzecz poszukiwań odpowiednich metod
optymalizacji. Odpowiednich to znaczy takich, które przyniosą coś
więcej niż tylko zadowalający efekt po zakończeniu samego procesu
poszukiwania. Takim efektem jest wysoka wartość funkcji jakości,
albo alternatywnie niski poziom błędu, czy też pewnej funkcji
strat, ponieważ takie kryteria też są stosowane. Jednak wspólną
cechą uzyskiwanych wyników jest to, że dotyczą one wyłącznie
określonego, zamkniętego zbioru danych historycznych, dostępnych w
chwili przeprowadzania optymalizacji. Natomiast upragnionym celem
gracza poszukującego strategii działania na rynku jest taki zbiór
reguł działania, który będzie się sprawował jak najlepiej w
przyszłości, dla danych nieznanych w chwili jego tworzenia.
Opisana powyżej własność w języku dziedziny nauki zwanej teorią uczenia maszynowego nosi nazwę zdolności uogólniania. Proces doboru parametrów metody jest w niej postrzegany jako zadanie uczenia się czyli wyciągania wniosków na podstawie danych wejściowych, w myśl zasady indukcji. Jak wspomniałem w jednym z tekstów wprowadzających obliczenia inteligentne są w obiegowych opiniach często utożsamiane z sieciami neuronowymi. Jednak akurat w tym kontekście to porównanie ma swoje zalety z punktu widzenia poglądowości. Sieć neuronowa, jako przykład systemu zdolnego do nauki, ma za zadanie tak „nauczyć się” na podstawie przedstawionych jej danych, aby móc w przyszłości radzić sobie z zadaniami wnioskowania, rozpoznawania wzorców bądź też predykcji. Zaś wspólną cechą tych zadań jest to, że obejmują sytuacje, które w procesie uczenia sieci były nieznane.
Jednym
z podejść do konstrukcji metod uczenia systemów, zwanych uczeniem
maszynowym, jest teoria Vapnika-Chervonenkisa sformułowana przez
dwóch matematyków pochodzących z ówczesnego Związku
Radzieckiego. Ścisłe ujęcie wyników uzyskanych przez tych
uczonych można znaleźć w znakomitej książce autorstwa jednego z
nich. Ponieważ jednak poziom matematyczny
opisywanych tam treści chwilowo wykracza poza ramy naszych
początkowych rozważań, skupię się jedynie na najbardziej
elementarnym ich aspekcie, który spróbuję wyrazić poniżej w
przystępnej formie.
Kluczem
do uzyskania wysokiej zdolności uogólniania jest zachowanie
kompromisu pomiędzy prostotą stosowanego modelu matematycznego a
jego dopasowaniem do danych ze zbioru uczącego. Modele zbyt
prymitywne nie będą w stanie odwzorować rzeczywistości, w jakiej
powinny działać. Z kolei model bardzo złożony, opisywany dużą
liczbą parametrów, znakomicie dopasuje się do danych ze zbioru
uczącego, jednak zwykle nie będzie zdolny do ogarnięcia ogólnych
prawidłowości kierujących badanymi procesami. Niczym ktoś, kto
przyglądając się z bliska korze drzewa traci w pola widzenia cały
las.
Na
chwilę obecną spróbuję podać praktyczną konkluzję z powyższych
rozważań dla pierwszych prostych systemów, których używałem
jako przykłady początkowe. Analiza wyników stwarza oczywistą
motywację do doskonalenia ich własności, np. poprzez wprowadzanie
dodatkowych kryteriów odwracania pozycji, złożonych warunków,
filtrów, etc. Natomiast należy pamiętać, że każdy nowy warunek
zwykle oznacza jeden lub więcej dodatkowych parametrów. A te, w
kontekście teorii V-C, należy oszczędzać niczym każdy kubek wody
na środku pustyni w drodze do oazy. W tym duchu zatem będziemy
realizować proces uczenia naszych systemów transakcyjnych.
Brak komentarzy:
Prześlij komentarz