Friday, October 14, 2016

Mark Data Voorspelling Met 'N Aanpasbare Kalman Filter Volgens Rick Martinelli , Haiku Laboratories , Decemb

MARK DATA VOORSPELLING MET 'n aanpasbare Kalman FILTER Inleiding Voorspelling wetenskap het sy grondslag in wiskundige statistiek waar, tot onlangs, voorspellings behels 'n groot aantal berekeninge gebaseer op ingewikkelde wiskundige modelle en het min praktiese toepassings. In die 1950's, toe groot hoeveelhede radar en ander data is ingesamel, en net so rekenaars is beskikbaar raak, die behoefte aan verskillende voorspelling metodes wat meer geskik is vir die nuwe tegnologie was duidelik geword. Nuwe lineêre voorspelling algoritmes is ingestel deur wetenskaplikes en ingenieurs om hierdie behoefte te bevredig. Een van hierdie is bekend as die Kalman filter geword, vernoem na die skrywer, R. E. Kalman, wat dit in 1960 bekendgestel (sien verwysing [1]). Mark data is gewoonlik beskikbaar as 'n tabel op of skryf time-reeks, van die prys vir 'n spesifieke mark item. A Kalman filter is 'n toestel wat 'n tyd-reeks in twee komponente, een genoem sein en die ander genoem geraas kan skei. Die terme "sein" en "geraas" gebruik word omdat gewone dop data van missiele, duikbote, ens bestaan ​​uit 'n 'ware 'n waarde vir die ligging van die voorwerp (die sein) wat reeds besmet is met vreemde "geraas" van 'n verskeidenheid van bronne. Dit is net vir skattings van ware waardes is beskikbaar wat die volgende plek mag voorspel met enige akkuraatheid. In die toepassing van hierdie metodes om die markte, maak ons ​​seker stilswyende aannames oor ons tyd-reeks. Ons is die veronderstelling daar is 'n gladde tendens lyn binne die data wat in 'n sekere sin, verteenwoordig die 'waar 'n waarde van ons mark item voordat dit verwoes deur' mark geraas. In hierdie manier waarop ons naboots die gedrag van, sê, 'n duikboot stuur lawaaierige sonar seine na 'n vyand wie se taak is om volgende posisie die duikboot se voorspel. Deur pas die laaste paar tendens-lyn waardes om 'n geskikte model, kan ons dan uit te brei die model om die volgende keer-waarde, en genereer 'n voorspelling. A Kalman filter spore 'n tyd-reeks met 'n twee-stadium proses. 1. By elke punt in die tyd-reeks, is 'n voorspelling gemaak van die volgende waardegebaseerde 'n paar van die mees onlangse ramings, en op die data-model in die Kalman filter vergelykings. 2. Dan, die volgende werklike data punt gelees word, en 'n kompromie waarde tussen die voorspelde en werklike waardes is bereken gebaseer op die bedrag van die geraas in die tyd-reeks. Dit kompromie waarde dien as die volgende 'waar' waarde vir voorspelling. Vir & quot; vandag se & quot; data punt, & quot; môre se & quot; waarde is nie beskikbaar nie en ons neem die voorspelde waarde van die eerste fase as ons voorspelling van die prys van môre. Die algoritme hou ook 'n skatting van die akkuraatheid van hierdie voorspelling, wat gebaseer is op die geskiedkundige akkuraatheid, en is gerapporteer as die standaard afwyking van die voorspelling. Vir aansoeke in die mark-data voorspelling, is die Alfa aanwyser ingestel as 'n manier vir die opwekking van koop / verkoop seine. Hierdie aanwyser sluit 'n mark item se voorspelde prys verandering, en die onsekerheid van die voorspelling, in 'n enkele nommer. 'N Portefeulje van die mark items kan gesorteer word deur hul Alfa waardes vir verdere oorweging, of die Alfa se mag gebruik word in samewerking met ander mark aanwysers in 'n handel stelsel. 'N Tweede aanwyser, bekend as die Fortune, is ingestel vir toegang tot historiese sukses van die algoritme in die voorspelling van die regte rigting 'n item sal beweeg in die volgende blok. Die Fortune aanwyser kan gebruik word op enige skema wat 'n voorspelling op elke blok maak. Tydreekse en Seinverwerking 'N tyd-reeks word gedefinieer as 'n stel van getalle in chronologiese volgorde gerangskik, met die dieselfde tyd interval tussen enige naburige denim getalle. As 'n konkrete voorbeeld sal ons 'n jaar van die daaglikse toemaak (264 datapunte) van IBM voorraad eindig 10/23/95 gebruik (sien Figuur 1). Vir ons doeleindes die datum bereik van die grafiek is onbelangrik; ons betref net met die voorspelling van & quot; môre se & quot; prys van data deur middel van vandag. Soos reeds in die inleiding, 'n Kalman filter skei 'n tyd-reeks in twee komponente, een genoem tendens, of sein, en die ander genoem geraas. Figuur 1. IBM daaglikse sluitingspryse vir 'n tydperk 264 dag eindig 10/23/95 Kom ons verteenwoordig ons tyd-reeks deur die volgorde van getalle waar N = 264 in ons geval, en aanvaar dit is wat deur 'n model van die vorm waar die onderskrif N is die tyd veranderlike en neem waardes van 1 tot N (sien verwysing [2] vir meer inligting). Die letter X word 'n staat vektor en, in ons geval, die besit van die afgelope paar tendens-lyn (sein) skattings. Die letter A verteenwoordig 'n matriks wat die model waarvolgens tendens waardes opgedateer bevat. In teorie, is hierdie updates dan beskadig deur B N. genoem model geraas, na die volgende staat vektor produseer. Die meetkunde matriks C vat die staat vektor na 'n nommer en uiteindelik D N. genoem waarneming geraas, word by die waargeneem Z waarde te produseer. Die staat model-update matriks A, en sy verwante toestand vektor X, is wat maak hierdie Kalman filter uniek onder alle ander Kalman filters. A afleiding van matriks A en 'n bespreking van sy eienskappe is vervat in [3]. Eintlik, is die sein veronderstel om 'n (ander) polinoom op elke sub-segment van vaste lengte, waar die graad van 'n bepaal die graad van die polinoom en die lengte van die sub-segmente wees. Simulasie resultate op hierdie filter is vervat in [4], en resultate op die gebruik van hierdie filter op te spoor militêre teikens is vervat in [5]. Vir 'n geskikte begin staat X 0. die filter kan beskou word as 'n swart boks wat Z genereer uit die vaste data model vervat in A en C, en die geraas terme. Hierdie geraas terme het elk 'n sekere onbekende afwyking, of intensiteit, wat uiteindelik word weerspieël in die wisselvalligheid van die mark item. As hulle bekend is, kan die Kalman filter aangepas, of ingeskakel om die data wisselvalligheid deur aanvanklik spesifiseer die verhouding van die geraas afwykings. As V B verteenwoordig die variansie van B N en V D is die variansie van D N. hul verhouding staan ​​bekend as die opsporing parameter T en word gedefinieer as T = V B / V D. (Sien ook [6].) Soos die filter gaan oor die data genereer skattings van X, dit skat ook die waardes van V B en V D. By elke data wys dan die filter gebruik hierdie ramings te T. pas Hierdie vermoë om die dop parameter aan te pas by die data te pas tydens die dop is wat die filter 'aanpasbaar. Om die beste T waarde vir elke mark item te vind, is die algoritme toegelaat om Itereer deur 100 waardes van T 0,1-10,0 en vind die beste waarde in die sin dat voorspel pryse algehele is die naaste aan die werklike, historiese pryse die item. In die algemeen, is kleiner T waardes gevind met meer wisselvallige mark items. Die data in Figuur 1 is nagespoor met 'n derde graad Kalman filter, met die dop parameter outomaties gekies as hierbo beskryf. Figuur 2 toon die afgelope 25 datapunte in detail, tesame met die Kalman voorspellings by elke punt. Let daarop dat die filter presteer wanneer die data is relatief glad. maar misluk wanneer die data maak 'n skielike rigting te verander. Dit is omdat die filter kan nie "sien" in die toekoms en verwag dat die data van sy huidige tendens in stand te hou. Toekomstige voorspellings, soos prys, word geëkstrapoleer, geraas-Vrystaat waardes "môre se": en so aan, tesame met hul standaardafwykings. Drie toekoms voorspellings word ook getoon in Figuur 2. Figuur 2. Kalman voorspellings (+) vir die afgelope 25 IBM datapunte, shownwith die data (soliede lyn), en voorspellings vir 3 punte in die toekoms. Koop-verkoop seine en die ALFA aanwyser Die Kalman skema bied voorspellings op elke keer punt in die data reeks (behalwe die eerste paar begin punte), en standaardafwykings vir elke voorspelling. As die filter gaan oor die data, hierdie standaardafwykings is geneig om 'n gemiddelde waarde wat verband hou met die afwykings wat T in Afdeling 2 omskryf, hierbo. Gevolglik, wanneer 'n voorspel prysverandering hierdie gemiddelde oorskry deur 'n beduidende hoeveelheid, dit waardig aandag die handelaar se. Die voorspelde prys verandering en die gepaardgaande standaardafwyking kan in een statistiek word opgeneem, genaamd ALFA, en aangedui deur A, wat ons definieer hier as die voorspelde prys verandering gedeel deur die standaardafwyking van die voorspelling Gedefinieer op hierdie manier, 'n is 'n genormaliseerde aanwyser en so gebruik kan word om te vergelyk tussen verskillende mark items, eerder as om net binne een item histories. 'N Portefeulje van die mark items kan gesorteer word deur hul huidige 'n waarde (met die minusteken verwyder vir die vermindering van items) om die grootste voorspel veranderinge en / of kleinste onsekerhede te openbaar. Items naby die top van die lys kan dan verder bestudeer word. Wanneer 'n meer as een, byvoorbeeld, die voorspelde prys verandering is meer as een standaardafwyking, dit wil sê die gemiddelde standaardafwyking wat reeds "deur die filter op ervaar 'tydens sy scan. Figuur 3. Historiese Alfa waardes vir IBM data. Figuur 3. Programme historiese n vir die IBM data. As die eerste 50 punte geïgnoreer, te danke aan begin filtreer, sien ons dat 'n selde meer as een, en slegs een keer 'n waarde van twee bereik. In die praktyk, 'n dis groter as tien gevind. Sulke groot waardes gewoonlik beteken die item is trending in dieselfde rigting vir 'n paar dae Figuur 3 dui die volgende koop / verkoop vlae: koop toe 'n meer as 'n voorafbepaalde waarde; verkoop wanneer dit minder as die ander is. pre-gedefinieerde waarde. In die onderstaande voorbeeld word hierdie waardes vasgestel op 1,8 en -1,8, onderskeidelik, en die koop en verkoop aangeteken. 'N Opsomming van die prestasie van die filter se onder hierdie toestande word verskaf deur die Fortune aanwyser, gedefinieer volgende. Terug-toetsing en die Fortune aanwyser A handel stelsel kan beskou word hier as toevoer-afvoer toestel vir die opwekking van koop / verkoop seine wanneer dit met 'n mark grafiek. Terug-toets is 'n algemene prosedure vir die toets van die potensiaal doeltreffendheid van 'n handel stelsel. Die idee is om die skema van toepassing is op historiese data oor verteenwoordiger portefeulje kaarte. Dit is eenvoudig die koop aan te teken en verkoop aangedui deur die skema, sonder om werklik te belê, en hou van die winste en verliese. Om 'n visuele rekord van die historiese prestasie van die skema verskaf, definieer ons 'n aanduiding genoem die Fortune soos volg. Ons begin deur die modellering van 'n handel stelsel as 'n eenvoudige dobbel stelsel. Veronderstel elke mark item het sy eie & quot; roulette wiel & quot ;, waar die waardes op die wiel verteenwoordig moontlike sluiting pryse, en die wiel is een keer elke dag tol na die volgende prys te bepaal. By elke draai die handelaar kan 'n enkele verbintenis van een verbintenis eenheid te plaas op óf swart (vir prysverhoging), of rooi (vir 'n afname), na gelang van die koop / verkoop seine uit die handel stelsel. As 'n weddenskap is plek, en indien die filter die regte rigting van die prys beweging het geraai, is ons terug ons belegging plus alles bedrag die toename of afname verteenwoordig in breuke van 'n verbintenis eenheid. Indien nie, kry ons ons belegging terug minus dieselfde bedrag. Let daarop dat die handelaar 'n wins wanneer die filter reg raai, ongeag die rigting van die prys beweging. Na elke weddenskap, ons teken die opgehoopte aantal verbintenis eenhede as ons Fortune tot op datum. 'N Grafiek van die Fortune aanwyser vir die IBM data word in Figuur 4. Om hierdie scan, is die waarde van 'n aanduiding van 'n koop (die koop vlag) vasgestel op 1,8, en die verkoop vlag is ingestel op -1,8. Ook, met die doel om te belê, die eerste 50 dae van die scan is geïgnoreer, terwyl die filter is om te stabiliseer. Figuur 4. Die Fortune aanwyser vir IBM data. Alfa koop vlae = 1.8, verkoop vlag = -1,8. Op dag 102. 'n groter as die koop vlag by 2.01 (sien Figuur 3), en 'n eenheid belê. Maar die prys laer gesluit die volgende dag (soos gesien kan word op deeglike inspeksie van Figuur 1) en die gevolglike verlies word getoon as 'n druppel van ongeveer 0,6% in die Fortune. Op dag 139, 'n regverdige oorskry die koop vlag by 1.86. Hierdie keer is die belegging tot gevolg gehad dat 'n wins van 1,7%. Ten slotte, vir twee agtereenvolgende dae, 222 en 223, 'n se onder die verkoop vlag by -1,82 en -1,86 tot gevolg gehad dat winste van 0,9% en 1,6% onderskeidelik. Die ooreenstemmende down-tendens kan gesien word in Figuur 1, en is weer in Figuur 5 saam getoon met die Kalman voorspellings. Figuur 5. IBM data (soliede lyn) en Kalman voorspellings (+) vir 'n tydperk van 20 dae met 'n winsgewende down-tendens. opsomming Conclosions Adaptive Kalman filters wat so nuttig in militêre programme het bewys, het hier reeds gewys dat ook effektief in die mark voorspellings wees, wanneer dit gebruik word in samewerking met 'n geskikte aanwysers, en wanneer dit behoorlik aangepas. Om die filters in 'n belegging omgewing te evalueer, die n aanwyser omskryf in Artikel 3 is ontwerp om 'n koop / verkoop aanwyser in 'n handel stelsel wat die Kalman voorspellings in diens wees. Die Fortune aanwyser omskryf in Artikel 4 is ontwerp om 'n grafiese vertoon van die resultate te lewer. 'N arbitrêr gekies mark item getoets en 'n waardes is bevind dat winsgewende beleggings gelei drie uit vier keer. Maar hierdie skema is van beperkte waarde as 'n praktiese belegging skema. In die praktyk, 'n handelaar in diens 'n voorspelling skema moet altyd ingryp wanneer 'n skynbaar trending item gevind, en soek vir bykomende nuus op die item. Ook die wat hier beskryf skema vereis 'n enkele dag draai rondom, en geen kommissie op transaksies, sowel nie-realistiese toestande. Laastens, gegewe die aard van die markte, die waarde van hierdie of enige ander voorspelling skema, is te betwyfel wanneer dit toegepas word om net 'n handjievol van die mark items. Tog het die huidige tegnologie data gemaak vir baie duisende mark items wat beskikbaar is aan die publiek teen billike pryse. Die resultate in hierdie memorandum dui daarop dat, deur te soek so 'n groot portefeuljes en die plasing van voldoende beperkings op die keuringsproses betekenisvol trending mark items kan gevind word met aangepaste Kalman filters. Verwysings [1]. Kalman, R. E. & Quot; 'n Nuwe benadering tot lineêre filter en voorspelling probleme & quot ;, ASME Transaksies, Series D, 82, 35-45, (1961). [3]. Martinelli, R. & quot; krommepassing en die Kalman filter & quot ;, Kentron Internasionale departementele korrespondensie, 2 Desember 1978. [4]. Martinelli, R. & Quot; wiskundige beskrywing van 3D baan voorverwerker & quot ;, Honeywell Marine Systems Center Tegniese Memorandum, H476-90-001, 30 Maart 1979. [5]. Parker. J. D. & quot; Dop filters vir Precision Elektroniese Support Systems & quot ;, verdediging Tegniese Inligting Sentrum. Cameron Station, Alexandria. Virginia 22304. DTIC # A264 089, 1992. [6]. Kalata. Volksrepubliek & quot; Die dop Index: A generarized parameter vir AB en ABG Target Trackers ", IEEE Transactions on Lugdiens en elektroniese stelsels, Vol AES-20, p174, 1984.


No comments:

Post a Comment