Opinacija optimizavimui: „Alpha Predator ™“ problema

Autorius: „Blockforce Capital Research“

Ankstesniame mūsų pranešime [APM I] mes pristatėme Alpha Predator ™ modelį (APM), skirtą sisteminei skaitmeninio turto prekybai; pasinaudojimas sudėtingumu ir lankstumu, siekiant patraukti alfa ir aplenkti rinkas. Nepaisant to, kad alfa plėšrūnas yra daugialypis fantastiškas grobuonis, jis tuo pat metu yra geranoriškas žvėris, siekiantis paskleisti savo alfa platinimąsi po derlingos pagerintos rinkos ekosistemos liekanas. Naudodami šias alfa sėklas visų rūšių investuotojams, norėdami auginti „blockchain“ sektorių, pirmiausia turime pasitelkti mašininio mokymosi algoritmus, kad optimizuotume geriausią kelią į daigumą.

Norėdami greitai priminti, čia yra APM sprendimų medis, kurį anksčiau parodėme APM I:

Turime daug pasirinkimų, kad nustatytume, kaip APM priima sprendimus, šakojančius nuo šaknies (rinkos kryptis) viršuje iki lapų (stochastiniai osciliatoriai) apačioje. Dabartine forma būtent šie stochastiniai generatoriai [sužinokite daugiau čia ir čia] galiausiai priima prekybos sprendimus, ir mes norėtume optimizuoti jų parametrus, kad priimtume geriausius įmanomus prekybos sprendimus.

Techniškai kalbant, APM turi dinaminius parametrus, fizikoje žinomus kaip laisvės laipsnius, ir mes turime rasti optimaliausią jų pasirinkimą. Kiekvienas laisvės laipsnis yra viena nepriklausoma kryptis, kuria sistema gali judėti, o optimali yra tai, kas mums suteikia aukščiausią investicijų grąžą kontroliuojamo lygio rizikoje. Turime rasti subtilų balansą, kuriame viskas sustingsta kartu teisingu būdu, kad tai pasiektume. Mes ieškome parametrų vietos ir testo našumo vykdydami atgalinius testus, kurie taiko APM istoriniams duomenų duomenims ir matuoja jo našumą.

Padarykime greitą laisvės laipsnių skaičiavimą, remdamiesi dabartine APM versija, pavaizduota grafike:

Rinkos diagnostikai turime kryptį, kintamumą ir sklaidą. Kitame būsimame įraše taip pat kalbėsime apie šios diagnostikos detales. Šiuo metu mes skaičiuojame jų parametrus: Kryptis turi penkis, kintamumas - keturis, o sklaidą - taip pat keturis, iš viso 13 laisvės laipsnių. Tipiškas parametras yra prekybos laikotarpio, kuriuo grindžiama diagnozė, pasirinkimas. Šis laikotarpis gali būti 30 minučių. Kiti parametrai dažnai yra sveikieji to laikotarpio, per kurį atliekami visi skaičiavimai, kartotiniai. Be to, jos taip pat gali būti ribinės vertės, viršijančios ar žemesnės už tam tikras sąlygas.

13 laisvės laipsnių, 10 trilijonų galimybių ir Visatos amžius

Trumpam pasilikime prie diagnostikos ir šiek tiek suskaičiuokime. Norime rasti tokius parametrų pasirinkimo variantus, kurie kuo geriau apibūdintų rinką. Mes tai galime padaryti iš esmės bandydami ir suklysdami. Tarkime, kad norime išmėginti 10 skirtingų verčių kiekvienam diagnostikos parametrui, norėdami pamatyti, kur tai veda. Tada galėtume išbandyti visus įmanomus derinius ir sekti geriausius. Apskaičiuokime, kur tai mus pateiks:

Kryptis turi 5 parametrus su 10 pasirinkimų. Tai išeina iš 10 x 10 x 10 x 10 x 10 = 10 = 100 000 skirtingų padangų. Neblogai. Kiekvieną nepastovumo parametrą su dešimčia pasirinkimų gauname iki 10 000. Tas pats ir „Spread“. Vėlgi, tai nėra labai blogai.

Tačiau štai sugavimas: „Kryptis“, „Kintamumas“ ir „Sklaida“ dirba kartu, kad nustatytų APM sprendimų medį. Taigi, mes susiduriame su 100 000 x 10, 000 x 10, 00 = 10 ³, arba žodžiais tariant, 10 trilijonų skirtingų pasirinkimų, kuriuos turėtume išbandyti!

Niekada neturėtų nuvertinti vien tik milžiniško susidorojimo su trilijonais. Pavyzdžiui, viena trilijono dolerių vekseliai, išdėstyti nuo galo iki galo, viršytų atstumą tarp Žemės ir Saulės, o 10 trilijonų yra vienas viso Visatos galaktikų skaičiaus įvertinimas [sužinokite daugiau čia]. „Alpha Predator“ gali pasirinkti iš šių 10 trilijonų pasirinkimų, jei kiekvienas skaičiavimas užtruks 10 sekundžių ir mes naudosime vieną kompiuterį, mes būtume juo šiek tiek daugiau nei 3 milijonai metų. Be to, tai tik rinkos diagnostika.

Einant palei sprendimų medį, kiekviena šaka veda į 18 skirtingų lapų, o ant kiekvieno lapo yra stochastinis osciliatorius, kuris priima prekybos sprendimus. Paprastai kiekvienam stochastiniam osciliatoriui yra keturi parametrai. Laimei, kiekvienas osciliatorius yra nepriklausomas nuo kitų, todėl pridėjus 18 lapų prie problemos, ji tampa „tik“ 18 000 kartų sunkesnė: 54 milijardai metų išbandyti visus įmanomus APM sprendimų medžio parametrus.

54,8 milijardo metų yra ilgesnis nei Visatos amžius (13,8 milijardo metų)! Nors mus apibūdina patobulintas paciento temperamentas, mus čia riboja Visatos amžius, todėl mes neturime pasirinkimo. Mums reikės geresnio būdo, kaip APM optimizuoti daug anksčiau.

Mašinų mokymasis naudojant Bajeso optimizavimą

Laimei, mūsų skaičiavimo ir duomenų mokslininkų komanda turi stiprią patirtį mokantis mašinų. Tai populiarėjanti mokslo ir inžinerijos disciplina, išnaudojanti šiuolaikinių kompiuterių galią ir pažangias matematinio modeliavimo technologijas, leidžiančias kompiuterių algoritmams mokytis ir priimti pagrįstus sprendimus.

Daugelis mašininio mokymosi algoritmų neturi nežinomų parametrų, kuriuos reikia kuo geriau pakoreguoti. Geriausias įmanomas būdas yra kai kurios nuostolių funkcijos (žr. 1 pav.), Kurias norite sumažinti. Mūsų atveju tai gali būti neigiama kaupiamoji grąža. Taigi, norėdami sumažinti nuostolių funkciją, turime optimizuoti parametrus. Tačiau dirbdami su neišsiskiriančiais fantastiškais žvėrimis, turime pasitelkti tam tikrą mašininio mokymosi metodą, žinomą kaip Bajeso optimizavimas.

Bajeso kalbos optimizavimas šiek tiek skiriasi nuo įprastų įpročių, tokių kaip Niutono metodas arba Ribotos atminties BFGS, nes tai yra mašininio mokymosi metodas optimizavimui. Priežastis naudoti jį vietoj kažko labiau standartinio yra todėl, kad APM yra keista funkcija. Atsižvelgdami į duomenis, optimizuojame APM parametrus, kad padidintume grąžą. Tai netaikoma įprastesniems optimizavimo metodams, nes tai užtrunka labai ilgai (minutės, palyginti su sekundėmis tradiciniame metode), ir jūs negalite paimti pradinės funkcijos gradiento (jums tikrai reikia gradiento kad padarytum mažus žingsnius iki maksimumo / min.). Bajeso optimizavimas suformuoja šią surogatinę funkciją, kuri yra sklandi ir diferencijuojama. Surogatinio funkcijos konstravimas yra mašininio mokymosi dalis. Sumažintos surogatinės funkcijos įgyvendinimas yra optimizavimas.

1 pav. Dvimatio surogatinio paviršiaus pavyzdys. Mažiausias nuostolis gaunamas iš surogatinio paviršiaus minimumo - tamsiausio mėlynojo rajono, kuriame 𝜃_1 = -2 ir 𝜃_2 = 2.

Štai kaip tai veikia. Matematiškai kalbant, APM atgalinio bandymo rezultatas (pvz., Bendra grąža, maksimalus lėšų panaudojimas [sužinokite daugiau čia ir čia] arba bet kuri kita jūsų pasirinkta veikimo metrika) yra kintamųjų x = {x1, x2, x3, x4,…}, atspindintys įvairius APM laisvės laipsnius. Paprastumo dėlei pažymėkime, kad bendra grąža = f (x). Norime maksimaliai padidinti bendrą grąžą suradę parametrus x, kurie suteikia bendrą f (x) maksimumą.

Priežastis, dėl kurios „Bayes“ optimizavimas veikia šią problemą, remiasi dviem prielaidomis: parametrų erdvėje yra tam tikras lygumo lygis ir tas lygumo lygis yra izotropinis (visur tas pats). Glotnumas arba „panašumo lygis“ tarp parametrų erdvės kaimyninių regionų yra išmoktas optimizavimo proceso metu, kad būtų galima tam tikru laipsniu patikrinti pirmąją prielaidą. Kitas taškas parametrų erdvėje pasirenkamas subalansavus du tikslus: tyrinėjimą ir maksimizavimą. Pakaitinėje funkcijoje dominuoja netikrumas parametrų erdvės regionuose, kurie nebuvo ištirti. Kartais jis pasirinks tašką netoliese, kuris padidins f (x), kartais bandys tašką regione, kuris dar nėra ištirtas.

Kaip indėlį į optimizavimo procesą, turime pateikti galimą reikšmių diapazoną, kurį gali užtrukti kiekvienas x parametras. Pvz., Mes galime nuspręsti, kad norime vidutinį rodiklio kiekį per n rinkos laikotarpius, kai galime leisti, kad n svyruoja nuo 100 iki 300. Taigi mūsų diapazonas šiam parametrui yra nuo 100 iki 300. Mes nustatome visų parametrų diapazoną. Tai suteikia aukšto matmens hipercube, apibrėžiančią erdvę, kurioje veiks optimizatorius. Be to, galime nustatyti apribojimus ryšių tarp parametrų atžvilgiu. Pvz., Galime užtikrinti, kad vienas parametras visada yra mažesnis už kitą, o tai yra būtina dirbant su ilgalaikiu ir trumpalaikiu slenkamuoju vidurkiu.

Mes parengiame Bajeso optimizavimą, paimdami parametrų reikšmes x iš hiperkubo, kad būtų pavaizduoti visi hiperkubo regionai. Tada vykdome APM, kad apskaičiuotume f (x). Šis pavyzdys suteikia optimizatoriui pradinį x ir f (x) rinkinį, su kuriais reikia dirbti. Vėlgi, mūsų tikslas yra rasti x vertę, maksimaliai padidinančią f (x).

Tada, remdamasis pradiniu x ir f (x) rinkiniu, optimizatorius sukuria statistinį modelį, kuris maždaug apibūdina, kaip f priklauso nuo x. Tai vadinama surogatiniu modeliu. Pakaitinis modelis naudojamas prognozuoti naują x reikšmę, kuri padidina f (x) tikimybę. APM vykdomas su šiuo nauju x, o gauta f (x) įrašoma ir naudojama kitame žingsnyje.

Iš pradžių prognozės nėra labai tikslios, tačiau procesas kartojamas. Su kiekvienu pakartojimu daugiau informacijos pridedama prie surogatinio modelio, ir jis tobulėja.

Tai mokosi!

Tokiu būdu mes galime rasti optimalius APM parametrus, turėdami tik kelis šimtus f (x) įvertinimų, palyginti su trilijonais, kurių reikia, jei mes naudojome paprastą brutalios jėgos metodą be mašinų mokymosi.

Bajeso srities optimizavimas yra tvirta technika, todėl nenuostabu, kad jis pasirodo daugelyje mokslo ir inžinerijos sričių. Pavyzdžiui, Bajeso srities optimizavimas buvo naudojamas siekiant optimizuoti eksperimentinių tyrimų sąrankas ir rasti geriausius skysčių dinamikos ar geofizikos prognozės modelių parametrus. Mūsų darbas su APM parodo, kaip Bajeso optimizavimas gali būti efektyvus kiekybinių finansų įrankis.

Išvada

Kadangi plėšrūnas lėtai nubėga, už jaunatviško alfa platinimo sodo, kurį kantriai augino, mums suteikiama akimirka atsikvėpti ir apmąstyti tai, ko išmokome. Naudodamiesi mašininio mokymosi technika, kuria siekiama optimizuoti Bajeso kalbą, galime sumažinti matematinio surogatinio paviršiaus, kurį alfa plėšrūno modelis apima parametrų erdvėje, praradimo funkciją, leisdami mums optimizuoti savo investicijų grąžą kontroliuojamu rizikos lygiu. Šis APM optimizavimas ir įgyvendinimas yra tik viena mūsų bendros „Alpha Predator“ kiekybinės ekosistemos „Blockforce Capital“ dalis, kurioje mes taip pat naudojame arbitražą ir patentuotą „Token Rotation“ modelį [abu bus aptarti būsimuose straipsniuose].

Tuo tarpu stebėkite savo žingsnį, kai išeisite iš sodo, nes plėšrūnas tyko.

„Blockforce Capital“ neketina čia pateikti informacijos naudoti kaip sprendimo dėl investavimo pagrindo. Informacija pateikiama santraukos forma ir nereiškia, kad ji yra išsami. Vienintelis šios medžiagos tikslas yra informuoti ir jokiu būdu nėra skirtas siūlymas ar raginimas pirkti ar parduoti vertybinius popierius, kitas investicijas ar paslaugas, pritraukti lėšų ar indėlių, taip pat jokie vertybiniai popieriai negali būti siūlomi ar parduodami. bet kuriam asmeniui bet kurioje jurisdikcijoje, kurioje pasiūlymas, prašymas, pirkimas ar pardavimas būtų neteisėtas pagal tokios jurisdikcijos įstatymus. Bet koks toks pasiūlymas būtų teikiamas kvalifikuotiems akredituotiems investuotojams tik pateikiant oficialius siūlymo dokumentus, kurių sąlygos visais atžvilgiais būtų reglamentuojamos. Ši informacija nėra bendras ar asmeninis patarimas investuoti, joje nėra atsižvelgiama į ją skaitančių asmenų individualias finansines aplinkybes ar investavimo tikslus ar finansines sąlygas. Jus įspėja, kad ši informacija nebus naudojama kaip pagrindas priimant sprendimą pirkti bet kokį vertybinį popierių. Ankstesni rezultatai negarantuoja rezultatų ateityje.

Iš pradžių paskelbta tinklalapyje www.blockforcecapital.com.