sobota, 25 sierpnia 2012

Systemy transakcyjne też powinny się uczyć – jaka edukacja jest najlepsza?

Niedawne rozważania na temat roli wnioskowania indukcyjnego w tworzeniu systemów transakcyjnych podsumowałem stwierdzeniem, które stanowi argument na rzecz poszukiwań odpowiednich metod optymalizacji. Odpowiednich to znaczy takich, które przyniosą coś więcej niż tylko zadowalający efekt po zakończeniu samego procesu poszukiwania. Takim efektem jest wysoka wartość funkcji jakości, albo alternatywnie niski poziom błędu, czy też pewnej funkcji strat, ponieważ takie kryteria też są stosowane. Jednak wspólną cechą uzyskiwanych wyników jest to, że dotyczą one wyłącznie określonego, zamkniętego zbioru danych historycznych, dostępnych w chwili przeprowadzania optymalizacji. Natomiast upragnionym celem gracza poszukującego strategii działania na rynku jest taki zbiór reguł działania, który będzie się sprawował jak najlepiej w przyszłości, dla danych nieznanych w chwili jego tworzenia.

Opisana powyżej własność w języku dziedziny nauki zwanej teorią uczenia maszynowego nosi nazwę zdolności uogólniania. Proces doboru parametrów metody jest w niej postrzegany jako zadanie uczenia się czyli wyciągania wniosków na podstawie danych wejściowych, w myśl zasady indukcji. Jak wspomniałem w jednym z tekstów wprowadzających obliczenia inteligentne są w obiegowych opiniach często utożsamiane z sieciami neuronowymi. Jednak akurat w tym kontekście to porównanie ma swoje zalety z punktu widzenia poglądowości. Sieć neuronowa, jako przykład systemu zdolnego do nauki, ma za zadanie tak „nauczyć się” na podstawie przedstawionych jej danych, aby móc w przyszłości radzić sobie z zadaniami wnioskowania, rozpoznawania wzorców bądź też predykcji. Zaś wspólną cechą tych zadań jest to, że obejmują sytuacje, które w procesie uczenia sieci były nieznane.

Jednym z podejść do konstrukcji metod uczenia systemów, zwanych uczeniem maszynowym, jest teoria Vapnika-Chervonenkisa sformułowana przez dwóch matematyków pochodzących z ówczesnego Związku Radzieckiego. Ścisłe ujęcie wyników uzyskanych przez tych uczonych można znaleźć w znakomitej książce autorstwa jednego z nich. Ponieważ jednak poziom matematyczny opisywanych tam treści chwilowo wykracza poza ramy naszych początkowych rozważań, skupię się jedynie na najbardziej elementarnym ich aspekcie, który spróbuję wyrazić poniżej w przystępnej formie.

Kluczem do uzyskania wysokiej zdolności uogólniania jest zachowanie kompromisu pomiędzy prostotą stosowanego modelu matematycznego a jego dopasowaniem do danych ze zbioru uczącego. Modele zbyt prymitywne nie będą w stanie odwzorować rzeczywistości, w jakiej powinny działać. Z kolei model bardzo złożony, opisywany dużą liczbą parametrów, znakomicie dopasuje się do danych ze zbioru uczącego, jednak zwykle nie będzie zdolny do ogarnięcia ogólnych prawidłowości kierujących badanymi procesami. Niczym ktoś, kto przyglądając się z bliska korze drzewa traci w pola widzenia cały las.

Na chwilę obecną spróbuję podać praktyczną konkluzję z powyższych rozważań dla pierwszych prostych systemów, których używałem jako przykłady początkowe. Analiza wyników stwarza oczywistą motywację do doskonalenia ich własności, np. poprzez wprowadzanie dodatkowych kryteriów odwracania pozycji, złożonych warunków, filtrów, etc. Natomiast należy pamiętać, że każdy nowy warunek zwykle oznacza jeden lub więcej dodatkowych parametrów. A te, w kontekście teorii V-C, należy oszczędzać niczym każdy kubek wody na środku pustyni w drodze do oazy. W tym duchu zatem będziemy realizować proces uczenia naszych systemów transakcyjnych.

Brak komentarzy:

Prześlij komentarz