Minería de secuencias de datos

320
-1

Published on

Documentación de mi proyecto fin de máster.

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
320
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
6
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Minería de secuencias de datos

  1. 1. Minería de secuencias de datos Autor: Manuel Martín Salvador 9 de diciembre de 2011 „utoresX vuis wF de g—mpos y ƒilvi— e™id I
  2. 2. P
  3. 3. Índice1. Introducción 52. Los datos 5 PFIF ƒe™uen™i—s de d—tos F F F F F F F F F F F F F F F F F F F F F F F F F F S PFPF g—m˜ios de ™on™epto F F F F F F F F F F F F F F F F F F F F F F F F F T3. Algoritmos de clasicación de secuencias de datos 8 QFIF eprendiz—je online F F F F F F F F F F F F F F F F F F F F F F F F F F V QFPF we™—nismos de olvido F F F F F F F F F F F F F F F F F F F F F F F F W QFQF „—xonomí— de métodos de —prendiz—je F F F F F F F F F F F F F F F IH QFRF iv—lu—™ión del pro™eso de —prendiz—je F F F F F F F F F F F F F F F II4. Aplicaciones 145. Revisión de métodos de aprendizaje con disparadores 15 SFIF elgoritmos ™on dete™™ión de ™—m˜io F F F F F F F F F F F F F F F F IS SFIFIF hhw @hrift hete™tion wethodA F F F F F F F F F F F F F F F IS SFIFPF ihhw @i—rly hrift hete™tion wethodA F F F F F F F F F F IV SFIFQF wétodo de uifer F F F F F F F F F F F F F F F F F F F F F F F IV SFIFRF eh‡sx @ed—ptive ‡indowingA F F F F F F F F F F F F F F F IW SFPF elgoritmos ™on vent—n— de entren—miento F F F F F F F F F F F F F PP SFPFIF wétodo de ulinken˜erg F F F F F F F F F F F F F F F F F F F PQ SFPFPF psƒr @unipied snst—n™e ƒele™tion —lgoritrmA F F F F F F F PR6. Aportaciones 26 TFIF woreirrorswoving F F F F F F F F F F F F F F F F F F F F F F F F F F PT TFPF w—xwoving F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PV TFQF wovingever—ge F F F F F F F F F F F F F F F F F F F F F F F F F F F F PW7. MOA (Massive Online Analysis) 34 UFIF il entorno F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QR UFPF qener—™ión de se™uen™i—s de d—tos F F F F F F F F F F F F F F F F F QS UFQF wétodos de ™l—si(™—™ión F F F F F F F F F F F F F F F F F F F F F F F QW UFRF wétodos de ev—lu—™ión F F F F F F F F F F F F F F F F F F F F F F F F QW UFRFIF roldout F F F F F F F F F F F F F F F F F F F F F F F F F F F F QW UFRFPF snterle—ved „estE„henE„r—in @o €requenti—lA F F F F F F F F RH Q
  4. 4. 8. Experimentación 41 VFIF gonjuntos de d—tos re—les F F F F F F F F F F F F F F F F F F F F F F RI VFPF f—terí— de prue˜—s F F F F F F F F F F F F F F F F F F F F F F F F F F RP VFQF ‚esult—dos F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RQ9. Conclusión y trabajo futuro 5710.Bibliografía 59 R
  5. 5. 1. Introducciónin este tr—˜—jo v—mos — tr—t—r el pro˜lem— del —prendiz—je —utomáti™o so˜rese™uen™i—s de d—tosF in un entorno ™lási™o se dispone de un— ˜—se de d—tos™omplet— y estáti™—D y el o˜jetivo es —prender un modelo que represente lo más(elmente posi˜le di™hos d—tosF in ™—m˜ioD ™u—ndo en lug—r de disponer de todoslos d—tos —l tiempoD estos v—n lleg—ndo de t—nto en t—ntoD en un— se™uen™i— ded—tosD — priori de longitud in(nit—D tenemos que —˜ord—r el pro˜lem— del —prenEdiz—je de diferente m—ner—F il pro˜lem— diverge —ún más ™u—ndo l— distri˜u™iónde los d—tos que se v— re™i˜iendo v—rí— — lo l—rgo del tiempo y por t—nto se h—™ene™es—rio —just—r el modelo dur—nte todo el pro™esoF€or elloD en primer lug—r será ne™es—rio ™on™ret—r este ™on™epto de d—tos que™onstituye l— entr—d— — un nuevo sistem— de —prendiz—je que se des™ri˜e en l—ƒe™™ión PF e ™ontinu—™iónD se est—˜le™en los requerimientos de ™u—lquier —lgoEritmo de ™l—si(™—™ión so˜re se™uen™i—s de d—tos y l— estru™tur— gener—l de ™ómose —˜ord— este pro˜lem— en l— liter—tur— @ƒe™™ión QAF v— minerí— de se™uen™i—sde d—tos tiene un gr—n ™—mpo de —pli™—™ión ™omo se muestr— en l— ƒe™™ión RFentes de expli™—r nuestr—s propuest—s en l— ƒe™™ión TD se h—™e un— revisión delos tr—˜—jos más dest—™—dos en l— dete™™ión de ™—m˜ios de ™on™epto @ƒe™™iónSAF €—r— l— p—rte experiment—l h— sido ne™es—rio est—˜le™er un m—r™o de tr—˜—joque puede ser referen™i— p—r— futur—s experiment—™iones y se h— utiliz—do p—r—re—liz—r el estudio ™omp—r—tivo de los diferentes métodos sele™™ion—dos @ƒe™™iónVAF „odo ello h— sido des—rroll—do dentro un entorno softw—re que tr—˜—j— so˜re™l—si(™—™ión ™on se™uen™i—s de d—tosD que se expli™—rá en l— ƒe™™ión UF pin—lEmenteD de l— p—rte experiment—l se extr—en ™on™lusiones y se est—˜le™en nuevoso˜jetivos p—r— tr—˜—jos futuros en l— ƒe™™ión WF2. Los datos2.1. Secuencias de datosh—do un pro˜lem— de un dominio determin—doD un— se™uen™i— de d—tos @datastream A está ™ompuest— por un— serie de inst—n™i—s que lleg—n —l sistem— — dis™reE™iónD de un— en un— o en p—quetes de t—m—ño regul—r o v—ri—˜leF v—s inst—n™i—sque ™omponen l—s se™uen™i—s de d—tos en un pro˜lem— orient—do — l— ™l—si(™—E™iónD suelen est—r form—d—s por un ™onjunto de v—ri—˜les o˜serv—d—s x1 , ..., xn yun— ™l—se y F in prin™ipio est—s se™uen™i—s tienen un t—m—ño ilimit—do y —demáses posi˜le que el pro˜lem— presente ™—m˜ios en l— distri˜u™ión su˜y—™ente — lol—rgo del tiempo que se re)ejen en l— se™uen™i—D por lo que no se pueden us—rlos enfoques tr—di™ion—les de minerí— de d—tosF il entorno de tr—˜—jo ne™es—riop—r— oper—r ™on se™uen™i—s de d—tos de˜e ™umplir ™iert—s restri™™iones ‘frzIH“X IF xo se pueden —lm—™en—r todos los d—tos en memori—F ƒolo se permite registr—r un— pequeñ— ™—ntid—d de inst—n™i—sD mientr—s que el resto se v—n elimin—ndo un— vez pro™es—d—sF PF v— velo™id—d ™on l— que se re™i˜en los d—tos impli™— que el pro™es—miento de˜e h—™erse en tiempo re—lF S
  6. 6. QF v— distri˜u™ión de los d—tos puede v—ri—r en el tiempoD de m—ner— que los d—tos —ntiguos se vuelven irrelev—ntes p—r— l— et—p— —™tu—lFv— restri™™ión I impli™— limit—r el t—m—ño de l— memori— utiliz—d— dur—nte el—prendiz—jeD mientr—s que l— P limit— el tiempo de pro™es—miento de ™—d— muesEtr—F in —quellos entornos en los que l—s se™uen™i—s de d—tos se—n evolutiv—s@presenten ™—m˜iosAD h—y que tener en ™uent— l— restri™™ión Q en el pro™eso de—prendiz—je e in™orpor—r métodos de dete™™ión de ™—m˜ios que permit—n evoluE™ion—r el modeloF2.2. Cambios de conceptoh—do un pro˜lem— de un dominio determin—doD se denomin— ™—m˜io de ™on™epto@concept drift A — l— situ—™ión que se produ™e ™u—ndo los d—tos de un— se™uen™i—p—s—n de tener un— distri˜u™ión de pro˜—˜ilid—d S1 — otr— distri˜u™ión S2 Ddonde S1 y S2 son de orígenes diferentes @ver pigur— IAF iste tipo de se™uen™i—sde d—tos se suelen denomin—r evolutiv—s o dinámi™—sD frente — l—s estáti™—sD queno present—n ™—m˜ios de ™on™eptoFpigur— IX ‚epresent—™ión visu—l de un ™—m˜io de ™on™epto gr—du—l — lo l—rgo deltiempo ‘liIH—“v— n—tur—lez— del ™—m˜io de ™on™epto es imprede™i˜leD por lo que no se tr—t— de™—m˜ios ™on periodi™id—d ™ono™id—D si no que l— suposi™ión prin™ip—l ™u—ndo se—˜ord— este pro˜lem— es l— in™ertidum˜re so˜re el futuroF il ™—m˜io de ™on™eptose puede d—r por tres ™—us—s ‘ureWW“X IF g—m˜io en l—s pro˜—˜ilid—des — priori de l—s ™l—ses P (c1 ), . . . , P (ck ) PF g—m˜io en l—s distri˜u™iones de pro˜—˜ilid—d ™ondi™ion—d—s P (X|ci )D i = 1, . . . , k T
  7. 7. QF g—m˜io en l—s pro˜—˜ilid—des — posteriori P (ci |X)D i = 1, . . . , kgomo ejemplos de ™—m˜io de ™on™epto se pueden ™onsider—r los ™orreos ˜—sur—@spam AD que intent—n v—ri—r su ™ontenido p—r— s—lt—rse los (ltros de ™orreoD o l—evolu™ión de l— s—lud de un p—™iente —l in™luir un nuevo medi™—mentoFƒe pueden en™ontr—r en l— liter—tur— ‘frzIH“ h—st— seis tipos de ™—m˜ios so˜reun— v—ri—˜le — lo l—rgo del tiempoD t—l y ™omo se puede o˜serv—r en l— pigur— PFv— primer— grá(™— @Sudden A muestr— un ™—m˜io —˜ruptoD en el que ™—m˜i— elv—lor de l— ™l—se de form— inst—ntáne—F v—s siguientes grá(™—s muestr—n ™—m˜iosque se produ™en más lent—menteF v— diferen™i— entre in™rement—l y gr—du—l r—Edi™— en si ™—m˜i—n los v—lores de l—s v—ri—˜les o ˜ien l— distri˜u™ión de l— ™l—seD—unque h—˜itu—lmente se us—n ™omo sinónimosF in l— (l— de —˜—jo tenemos l—primer— grá(™— @Recurring A ™on un ™—m˜io tempor—l y que vuelve — su est—donorm—l tr—s un interv—lo de tiempoF v— siguiente grá(™— @Blip A represent— unevento ex™ep™ion—l y no de˜e tr—t—rse ™omo un ™—m˜io de ™on™eptoF v— últim—grá(™— @Noise A muestr— ™—m˜ios —le—toriosD — los que ll—m—remos ruido y t—mEpo™o de˜en ™onsider—rse ™omo un ™—m˜io en l— distri˜u™iónF in l— liter—tur— lomás fre™uente es en™ontr—rse ™on tr—˜—jos que ™onsider—n t—n solo los ™—m˜ios—˜ruptosD gr—du—les o in™rement—lesFF pigur— PX „ipos de ™—m˜ios U
  8. 8. 3. Algoritmos de clasicación de secuencias de datosvos ™l—si(™—dores de se™uen™i—s de d—tos de˜en ser ™—p—™es de —prender de losd—tos de form— in™rement—l en vez de por lotes @batch A y re—™™ion—r —nte los™—m˜ios de ™on™eptoF em˜os requisitos se ™onsiguen —pli™—ndo aprendizajeonline y mecanismos para olvidar los d—tos que y— no son relev—ntesF3.1. Aprendizaje onlineil —prendiz—je onlineD t—m˜ién ll—m—do —prendiz—je in™rement—lD se ™entr— en elpro™es—miento de inst—n™i—s de form— se™uen™i—l tr—t—ndo de que el ™l—si(™—dorentren—do se— t—n pre™iso ™omo si se hu˜iese entren—do ™on todo el ™onjuntode d—tos — l— vez @en batch AF …n ˜uen —lgoritmo de —prendiz—je online de˜erí—tener est—s ™u—lid—des ‘frzIH“X IF sn™rement—lX el —lgoritmo de˜e ser ™—p—z de leer y pro™es—r d—tos — lo l—rgo del tiempo sin tener que disponer de todos los d—tos desde el prin™ipioF PF „r—t—r ™—d— inst—n™i— en un— p—s—d—X el —lgoritmo solo puede re—liz—r un— le™tur— so˜re los d—tos y luego li˜er—r el esp—™ioF QF vimit—™ión de tiempo y memori—X ™—d— vez que se pro™ese un ejemplo de˜e h—™erse en el menor tiempo posi˜le y l— ™—ntid—d de memori— ne™es—ri— p—r— el pro™es—miento de˜e ser ™onst—nteF RF il —lgoritmo de˜e propor™ion—r un modelo ™ompleto en ™u—lquier inst—nte de tiempoF in un ™—so ide—lD el ™l—si(™—dor entren—do in™rement—lmente h—st— un inst—nte t de˜e ser equiv—lente —l mismo entren—do de form— tr—di™ion—l ™on tod—s l—s inst—n™i—s disponi˜les h—st— el inst—nte tF€—r— s—tisf—™er est—s restri™™iones de po™os d—tos — l— vez y disponi˜ilid—d delmodelo en ™u—lquier inst—nteD se suelen —pli™—r té™ni™—s de resumen — los d—Etos t—les ™omo sliding windows @vent—n—s desliz—ntesAD sampling @muestreoA osketching @es˜ozoAD —lgun—s de l—s ™u—les se ™onsider—rán en este tr—˜—joFv—s prin™ip—les diferen™i—s entre el pro™eso de ™l—si(™—™ión ™on todos los d—tosen un modo tr—di™ion—l y un pro™eso de ™l—si(™—™ión p—r— se™uen™i—s de d—tosse pueden ver — modo de resumen en el gu—dro IF Tradicional Secuencial xúmero de p—s—d—s wúltiple …n— „iempo de pro™es—miento slimit—do ‚estringido …so de memori— slimit—do ‚estringido „ipo de result—do €re™iso eproxim—do gon™epto istáti™o ivolutivogu—dro IX gomp—r—tiv— de minerí— de d—tos tr—di™ion—l frente — l— minerí— dese™uen™i—s de d—tos ‘qqHU“ V
  9. 9. in gener—lD el pro™eso de —prendiz—je puede verse ™omo en l— pigur— QF pigur— QX €ro™eso de —prendiz—je in™rement—l en el inst—nte t ‘liIH˜“F3.2. Mecanismos de olvidosn™orpor—r me™—nismos de olvido es un —spe™to que tiene espe™i—l interés ense™uen™i—s evolutiv—sD y— que existe un modelo —ntes y otro distinto después dedete™t—rse el ™—m˜ioF €or t—ntoD un ™l—si(™—dor de˜e ser ™—p—z de re—™™ion—r—nte un ™—m˜io de ™on™epto y olvid—r —quello que y— no se— relev—nteD ™omolos d—tos que son de ™on™eptos —ntiguosF il prin™ip—l pro˜lem— es ™ómo s—˜erqué de˜e olvid—rF v— solu™ión más sen™ill— es ir olvid—ndo p—ul—tin—mente losd—tos —ntiguos y us—r un— ventana ™on los ejemplos más re™ientes p—r— entren—rel ™l—si(™—dorF isto permite —demás m—ntener redu™ido el número de inst—n™i—sne™es—ri—s p—r— el entren—mientoF iste primer enfoque de vent—n—s de t—m—ño™onst—nte en los d—tos más re™ientesD present— un ™ompromiso entre est—˜ilid—dy )exi˜ilid—dD y— que si l— vent—n— es dem—si—do pequeñ— re—™™ion—rá rápido —los ™—m˜iosD pero — l— vez ˜—j—rá l— pre™isión porque está entren—ndo ™on po™osd—tosF in ™—m˜ioD si l— vent—n— es muy gr—ndeD el ™l—si(™—dor será más est—˜lepero t—rd—rá más en dete™t—r los ™—m˜ios ‘uunHV“Fytro enfoque ™onsiste en —just—r el t—m—ño de l— vent—n— de —prendiz—je ™u—ndose dete™te un ™—m˜io de ™on™epto p—r— tr—t—r de en™ontr—r un equili˜rio entrepre™isión y )exi˜ilid—dF istos métodos fun™ion—n mejor ™u—ndo h—y ™—m˜ios˜rus™osF…n enfoque —ltern—tivo ™onsiste en ponder—r l—s muestr—s ™on un peso que irádisminuyendo — lo l—rgo del tiempo p—r— v—ri—r l— in)uen™i— de l—s mism—sdur—nte el pro™esoF iste enfoque se denomin— fading factor @f—™tor de olvidoAF W
  10. 10. €—r— nuestros métodos v—mos — us—r vent—n—s de t—m—ño (jo y— que nos f—™ilit—nl— interpret—˜ilid—d de los result—dosF3.3. Taxonomía de métodos de aprendizajee ™ontinu—™ión present—mos un— posi˜le ™l—si(™—™ión de métodos de —prendiz—jede se™uen™i—s de d—tos evolutiv—sD propuest— en ‘liIH˜“F IF Algoritmos de aprendizaje con disparadores (Learner with triggers)X dependen de un— señ—l que indi™— que es ne™es—rio —™tu—liz—r el modeloF a A Detección de cambio (Change detectors) X son los más fre™uentes en l— ˜i˜liogr—fí—F istos métodos fun™ion—n mejor en entornos ™on ™—mE ˜ios ˜rus™os en los que se suele re™onstruir el modelo por ™ompleto en vez de —™tu—liz—rloF vo más ™omún es monitoriz—r los d—tosD los p—rámetros del ™l—si(™—dor o l— s—lid— del —lgoritmo de —prendiz—jeF ‘ƒƒHVD qwg‚HRD fqdgep+ HT“ in el supuesto de que l—s se™uen™i—s de d—tos se—n estáti™—s @sin ™—m˜iosAD l—s té™ni™—s de dete™™ión de ™—m˜ios t—m˜ién pueden ser utiliz—d—s p—r— dete™t—r diferen™i—s signi(™—tiv—s respe™to —l modelo que se está entren—ndo y se tr—t—rí— de ™omplet—r el —nterior p—r— lleg—r — un modelo mejor —just—doF b A Ventana de entrenamiento (Training windows) X estos métodos se ˜—s—n en heurísti™—s p—r— —just—r el t—m—ño de l— vent—n— de entreE n—mientoF ‘‡uWTD rƒhHID fwHV“ c A Muestreo adaptativo (Adaptive sampling) X ˜—sándose en l— rel—E ™ión entre l— inst—n™i— de prue˜— y unos prototipos prede(nidos o ˜ien el históri™o de inst—n™i—s entren—d—sD se sele™™ion— un ™onjunto de entren—miento —de™u—doF ‘‰‡HVD €ruHV“ PF Algoritmos de aprendizaje evolutivos (Evolving learners)X estos méE todos —™tu—liz—n el modelo de form— gr—du—l y no requieren de un dete™tor de ™—m˜ios de ™on™eptoF a A Conjuntos adaptativos (Adaptive ensembles) X son los más popul—E resD y ˜ási™—mente ™om˜in—n l— s—lid— de distintos ™l—si(™—dores del ™onjunto p—r— d—r un— de™isión (n—lF ‘uwHUD ƒt—HQD xuHI“ b A Ponderación de instancias (Instance weighting) X estos —lgoritmos no ™om˜in—n regl—s de de™isiónD sino que l— —d—pt—˜ilid—d se ™onsigue modi(™—ndo el ™onjunto de entren—mientoF …tiliz— ide—s de boostingD d—ndo más import—n™i— — —quell—s inst—n™i—s m—l ™l—si(™—d—sF ‘uoyHHD ƒHVD gHR“ c A Espacio de características (Feature space) X estos métodosD próE ximos — l— sele™™ión de ™—r—™terísti™—sD ™onsiguen l— —d—pt—˜ilid—d sele™™ion—ndo de form— dinámi™— l—s ™—r—™terísti™—s emple—d—s p—r— l— ™l—si(™—™iónF ‘porHTD ‡qgHTD eerHV“ d A Dependientes del modelo (Base model specic) X estos métodos se —d—pt—n modi(™—ndo los p—rámetros del modelo que estén us—ndoF ‘xnpwHUD ureWWD ƒvƒWW“ IH
  11. 11. 3.4. Evaluación del proceso de aprendizajeƒegún v—rios —utores ‘qƒ—‚HW“D h—y tres —spe™tos import—ntes — tener en ™uent—— l— hor— de ev—lu—r —lgoritmos de —prendiz—je de se™uen™i—s de d—tosX Espacio o™up—do en memori— — lo l—rgo del pro™eso de —prendiz—jeF Tiempo de pro™es—miento de un— muestr— @esto puede limit—r l— fre™uenE ™i— de re™ep™ión de los d—tosAF €oder de generalizaciónX efe™tivid—d del modelo —l represent—r el ™onE ™epto su˜y—™ente de los d—tosFxosotros nos v—mos — o™up—r úni™—mente de ev—lu—r y ™omp—r—r —lgoritmospor el último ™riterioD según su efe™tivid—d dur—nte l— ™l—si(™—™iónF ƒin em˜—rgo—unque no tr—t—mos de minimiz—r ™onsumo de memori—D ni tiempo de pro™eEs—mientoD sí se respet—n los requerimientos de —prendiz—je onlineD de un— sol—p—s—d— so˜re los d—tos y que l—s muestr—s no se —™umul—n tod—s en memori—Fxuestro propósito por t—nto esD ev—lu—r —lgoritmos propios y —jenos por l— efe™Etivid—d del modelo —prendidoD p—r— poder est—˜le™er ™omp—r—™iones y r—nkingsde los mismos y extr—er ™on™lusiones so˜re los modelos —prendidosFvos métodos de ev—lu—™ión de —lgoritmos de —prendiz—je en ˜—t™hD —prendenso˜re un ™onjunto de entren—miento @training A y utiliz—˜—n un ™onjunto de testindependiente so˜re los que estim—r l— pro˜—˜ilid—d de error holdoutF in el ™—sode no disponerse de —m˜osD se estim— l— pro˜—˜ilid—d de error del modelo o˜teEnido — p—rtir del ™onjunto de tr—ining medi—nte té™ni™—s de v—lid—™ión ™ruz—d—y sus v—ri—ntes @leaving-one-out A o bootstrapF ƒin em˜—rgoD en el ™ontexto de seE™uen™i—s donde los d—tos son poten™i—lmente in(nitosD l— v—lid—™ión ™ruz—d— y l—sestr—tegi—s de muestreo no son —pli™—˜lesF edemásD el he™ho de que los ™on™eptosde l—s se™uen™i—s de d—tos pued—n ™—m˜i—r en el tiempo tiene impli™—™iones enl—s té™ni™—s de ev—lu—™iónFƒe ne™esit—n por t—nto nuev—s estr—tegi—s de ev—lu—™iónF il prin™ip—l pro˜lem—™onsiste en monitoriz—r l— evolu™ión del pro™eso de —prendiz—jeF xos en™ontr—mos™on dos —ltern—tiv—sX IF HoldoutX ™omo en su homólogo en ˜—t™hD se tr—t— de un ™onjunto de test que se —pli™— —l modeloD pero en este ™—so extr—ído — interv—los regul—resD p—r— estim—r l—s t—s—s de errorD lo que es —de™u—do p—r— se™uen™i—s dináE mi™—sF r—y que (j—r fre™uen™i— y —n™hur— del ™onjunto de test so˜re l— se™uen™i—F ƒe tr—t— de un estim—dor no sesg—doD pues —l moverse — lo l—rgo de l— se™uen™i— no d— lug—r — so˜re—justeF PF PrequentialX t—m˜ién ™ono™ido ™omo test-then-train ‘fuHW—“F il término prequenti—l proviene de €redi™tive ƒequenti—l ‘h—wVR“F il error del modelo n se estim— so˜re l— se™uen™i— de d—tosX S = i=1 L(yi , yi ) donde L es ˆ l— fun™ión de pérdid— tr—s h—˜er predi™ho l— ™l—se de form— ™orre™t— o in™orre™t—F ƒe ™ono™e que este estim—dor es pesimist—D es de™irD en l—s mism—s ™ondi™ionesD l— estr—tegi— holdout v— — d—r mejores v—loresF il error estim—do ™on prequenti—l v— — est—r in)uen™i—do por los errores que se h—y—n podido ™ometer —l prin™ipio de l— se™uen™i— de d—tosF €or elloD se h—n us—do me™—nismos de olvido t—les ™omoX II
  12. 12. a A Ventanas temporales (time window): en lug—r de m—ntener un ™ál™ulo de l—s t—s—s de éxito —™umul—do desde el ini™io de l— se™uen™i—D se re—liz— est— estim—™ión p—r™i—l so˜re un— vent—n— de t—m—ño k D (jo @— (j—r — prioriAD que se v— despl—z—ndoF iste me™—nismo ™onverge más rápid—mente —l método holdoutF b A Factores de olvido (fading factor): se introdu™e un f—™tor de olvido α p—r— que l— in)uen™i— de ™—d— error en l— estim—™ión v—y— de™—yendo ™onforme —ument— l— dist—n™i—F he est— m—ner—D podemos ™—l™ul—r el L +α·S error prequenti—l ™omo Ei = Bi = nii+α·Bi−1 donde S1 = L1 y ni S i i−1 es el número de ejemplos us—dos p—r— ™—l™ul—r Li F in el ™—so de que α = 1 impli™— que no h—y olvidoF iste me™—nismo tiene l— vent—j— de que requiere po™— memori—D y— que solo requiere —lm—™en—r el v—lor —nterior y el —™tu—lD frente —l uso de vent—n—s donde se tienen que —lm—™en—r k v—lores de pérdid—F em˜os me™—nismos están muy rel—™ion—dosD y por ende sus p—rámetrosF esíD p—r— v—lores ˜—jos de k y de αD l—s estim—™iones he™h—s son más — ™orto pl—zo y ™omo ™onse™uen™i— l—s os™il—™iones de l—s estim—™iones son m—yoresF €or otro l—doD p—r— v—lores —ltos de k @m—yor vent—n—A y de α @™er™—nos — IAD v—n — intervenir más d—tos en l—s estim—™iones de los erroresFin nuestr— experiment—™ión hemos us—do l— estim—™ión prequenti—l y— que es l—más extendid—D de˜ido — que no se ex™luye ningún d—to en el entren—mientoD yse ev—lú— puntu—lmente ™on ™—d— muestr— de l— se™uen™i—D por lo que se o˜tienede un estim—dor no sesg—doFe l— hor— de ™omp—r—r el rendimiento que present—n dos —lgoritmos @e y fAfrente — l— mism— se™uen™i— de d—tos podemos us—r el est—dísti™o Qi (A, B) = 1−S Alog 1−Si D donde Si y Si son los v—lores de l— fun™ión de pérdid— —™umuE B A B il—dos de ™—d— —lgoritmoF il v—lor de Qi es útil p—r— ™ompro˜—r l—s diferen™i—sentre —m˜os —lgoritmosD de m—ner— que si el —lgoritmo e present— un mejor™omport—miento que el fD v—mos — o˜tener v—lores positivosD mientr—s que en™—so ™ontr—rio o˜tendremos v—lores neg—tivosD y si son igu—les será ™eroFil pro˜lem— de est—s medid—s es que evolu™ion—n — lo l—rgo del tiempo y esposi˜le que visu—lmente no pod—mos re™ono™er qué método es mejor que otroy— que uno se puede ™omport—r mejor en un— p—rte de l— se™uen™i—D mientr—sque otro lo h—g— en otr— o™—siónF €or elloD p—r— d—r un v—lor (n—l en nuestr—experiment—™ión hemos us—do ™omo medid— el áre— ˜—jo l— ™urv— @e…gA delos v—lores o˜tenidos ™on l— estr—tegi— prequenti—l desde el ini™io de l— se™uen™i—h—st— que (n—liz—F he est— m—ner—D si tenemos dos —lgoritmos @e y fAD de(nimos NAU CA = i=0 ni · (1 − Ei ) donde ni es el número de ejemplos us—dos p—r— A™—l™ul—r Ei y N el número de v—lores de Ei disponi˜les @ídem p—r— fAF hiremos A Aque e es mejor que f si AU CA AU CB Fytro —spe™to interes—nte — ev—lu—r en el ™—so de que tr—˜—jemos ™on se™uen™i—ssintéti™—s ™on ™—m˜ios de ™on™eptos ™ono™idos es el número de drifts ™orre™t—Emente dete™t—dosD los f—lsos positivosD los f—lsos neg—tivosD —sí ™omo l— dist—n™i—tr—ns™urrid— desde que se produ™e un ™—m˜io h—st— que se dete™t—F il ™ál™ulo deest— dist—n™i— v— — ser diferente dependiendo del tipo de ™—m˜io que presente l— IP
  13. 13. se™uen™i—D y— que h—y que tener en ™uent— que los ™—m˜ios gr—du—les se produ™en— lo l—rgo de un— vent—n— donde se entremez™l—n muestr—s de —m˜os ™on™eptosFv— dist—n™i— se ™—l™ul— entre el punto de drift re—l y el drift dete™t—do más™er™—no — élF in ™—so de h—˜er más de un drift dete™t—doD se ™—l™ul— l— dist—n™i—del primero y el resto se ™onsider—n f—lsos positivosF ƒi el ™—m˜io es gr—du—lDel punto de ™—m˜io re—l ™onsider—mos que ™orresponde ™on l— ™ot— inferior delinterv—lo de ™—m˜ioF ƒe puede ver un ejemplo en l— pigur— RF Cambios Abruptos Cambios Graduales0 10 20 30 40 50 0 10 20 30 40 50 Instancias Instanciaspigur— RX in l— grá(™— de l— izquierd— s—˜emos que h—y P ™—m˜ios —˜ruptos enPH y RH @líne—s roj—s ™ontínu—sAF il método —pli™—do h— dete™t—do Q drifts enPSD QH y RP @líne—s —zules dis™ontínu—sAF hiremos que h— dete™t—do dos drifts™orre™t—mente @en los puntos PS y RPA y un f—lso positivo @QHAF v— dist—n™i— —lprimer drift será de 25 − 20 = 5 y —l segundo de 42 − 40 = 2F €or otro l—doD enl— grá(™— de l— dere™h— h—y P ™—m˜ios gr—du—les que tienen lug—r en ‘ISD PS“ y‘QSD RS“F in este ™—so diremos que h— dete™t—do dos drifts ™orre™t—mente @IS yRPA y dos f—lsos positivos @PI y QHAF v— dist—n™i— —l primer drift será 15 − 15 = 0y —l segundo 42 − 35 = 7F IQ
  14. 14. 4. Aplicacionese ™ontinu—™ión present—mos distint—s áre—s de —pli™—™ión p—r— el —prendiz—jeo l— ™l—si(™—™ión de se™uen™i—s de d—tos ™on ™—m˜ios de ™on™eptoF „odos ellostienen en ™omún l— —)uen™i— ™onst—nte de nuevos d—tos y un— posi˜le evolu™iónde los ™on™eptos en el tiempoF Monitorización y controlX en l—s —pli™—™iones de monitoriz—™ión y ™onE trol se tr—˜—j—n ™on ™—ntid—des de d—tos muy gr—ndes que ne™esit—n pro™eE s—rse en tiempo re—lF ƒe pueden diferen™i—r dos tipos de t—re—sX preven™ión y prote™™ión frente — —t—quesD o monitoriz—™ión ™on propósitos de gestiónF ˆ ƒegurid—d informáti™—X dete™™ión de intrusosF ‘vfWW“ ˆ ƒe™tor (n—n™ieroX preven™ión de fr—udesF ‘honHR“ ˆ „r—nsporteX gestión del trá(™oF ‘wƒthHW“ ˆ €osi™ion—mientoX r—streo inter—™tivoF ‘v€puHU“ ˆ sndustri—X monitoriz—™ión de pro™esos de produ™™iónF ‘†yq+ HV“ Información y asistencia personalizadaX est—s —pli™—™iones org—niz—n o person—liz—n un )ujo de inform—™iónF ˆ esisten™i— person—lX (ltr—do de inform—™iónF ‘qƒgwHU“ ˆ €er(les de ™lientesX segment—™ión de ™lientesF ‘vrgHV“ ˆ snform—™iónX org—niz—™ión de do™umentosF ‘fvHT“ Toma de decisionesX est—s —pli™—™iones no ne™esit—n que l—s de™isiones se—n en tiempo re—lD pero sí que su respuest— se— pre™is— y— que los ™ostes de ™ometer un error pueden ser muy —ltosF ˆ ƒe™tor (n—n™ieroX predi™™ión de morosid—dF ‘‚‚HU“ ˆ fiomedi™in—X efe™tos de medi™—mentos en p—™ientesF ‘„€g€HV“ Inteligencia articial y robóticaX el ™—m˜io de ™on™epto en est—s —pliE ™—™iones se suele de˜er — ™—m˜ios en el entornoF ˆ ƒistem—s móviles y ro˜óti™osX diseño de ro˜ots ™—p—™es de —d—pt—rse —l entornoF ‘€wqHW“ ˆ ƒistem—s inteligentesX solu™iones p—r— domóti™—F ‘‚gHW“ ˆ ‚e—lid—d virtu—lX diseño de videojuegos y simul—doresF ‘gww+ HS“ IR
  15. 15. 5. Revisión de métodos de aprendizaje con dis- paradores…n— vez expuesto el ™ontexto en el que se des—rroll— el tr—˜—joD v—mos — re—liz—run estudio det—ll—do so˜re el pro˜lem— ™on™reto del —prendiz—je ™on disp—r—EdoresD en espe™i—l los dos primeros —p—rt—dos que nom˜r—mos en l— t—xonomí—Xutiliz—ndo detección de cambio y ventanas de entrenamientoFƒ™hlimmer y qr—nger present—ron en IWVT el pro˜lem— del —prendiz—je in™remenEt—l so˜re d—tos ™on ruido y pu˜li™—ron el —lgoritmo ƒ„eqqi‚ ‘ƒqVT“F hesdeque introdujeron el término ™on™ept driftD h— h—˜ido tres pi™os de interés enl— investig—™iónX en IWWV ™on un— edi™ión espe™i—l de l— revist— Machine Lear-ning ‘h‡uWV“D en PHHR ™on un espe™i—l en l— revist— Intelligent Data Analysis‘ƒuHU“ y el ter™ero ™omenzó en PHHU ™omo result—do de l— ™ontinu— produ™™iónde se™uen™i—s de d—tos en l— industri— y que ™omo se h— det—ll—do —nteriormenteprosigue —ún en l— —™tu—lid—dF5.1. Algoritmos con detección de cambioin el ™—so de se™uen™i—s dinámi™—s de d—tosD el propósito de estos —lgoritmos esdete™t—r un ™—m˜io de ™on™epto en los d—tos que v—n lleg—ndo y —vis—r —l —lgoritEmo de —prendiz—je que indu™e el modelo de que de˜e —™tu—liz—r o re™onstruir sumodelo p—r— —just—rse mejor — los nuevos d—tosF €or otro l—do si se tr—˜—j—n ™onse™uen™i—s estáti™—s de d—tosD el o˜jetivo de estos —lgoritmos es —™tiv—r el pro™esode —prendiz—je p—r— —just—rse mejor —l —porte de d—tos —di™ion—lesF vo h—˜itu—les que los —lgoritmos de dete™™ión de ™—m˜ios —™túen — priori so˜re los d—tosDesto esD (ltren l— se™uen™i— de d—tos y —™tiven los pro™esos de —prendiz—je @muE™hos más pes—dos ™omput—™ion—lmenteA ™on l— lleg—d— de nuevos ™on™eptosF …n—lgoritmo de dete™™ión de ™—m˜ios puede —fe™t—r —l rendimiento del ™l—si(™—dorFv— form— de pro™eder de un dete™tor de ™—m˜ios es re—liz—r un test est—dístiE™o que ™omprue˜e si el error del ™l—si(™—dor o l— distribución de l— ™l—se sem—ntienen ™onst—ntes en el tiempoFvos primeros tests propuestos p—r— tr—t—r ™on se™uen™i—s numéri™—s fueron g…Eƒ…w @Cumulated Sum A ‘€—gSR“ y qwe @Geometric Moving Average A ‘‚o˜SW“Fil primero de ellos l—nz— un— señ—l de —l—rm— si l— medi— de los d—tos de enEtr—d— es signi(™—tiv—mente distint— de ™eroD mientr—s que qwe ™omprue˜— sil— medi— ponder—d— de los ejemplos de un— vent—n— es m—yor que un determiEn—do um˜r—lF €—r— se™uen™i—s ™on estru™tur—s más ™omplej—s se h—n propuestotests ™omo el de Kolmogorov-SmirnovF e ™ontinu—™ión veremos —lgunos de losmétodos de dete™™ión de ™—m˜io más re™ientes que pueden —pli™—rse — ™u—lquier—lgoritmo de minerí— so˜re se™uen™i—s de d—tosF5.1.1. DDM (Drift Detection Method)q—m— et —lF ‘qwg‚HR“ present—n el método de dete™™ión de ™—m˜io @hhwAque monitoriz— l— t—s— de error us—ndo un Shewhart P-ChartD un— herr—mient— IS
  16. 16. est—dísti™— de ™ontrol de ™—lid—dD ™uyos prin™ipios se ˜—s—n en l— distri˜u™ión˜inomi—lFƒe di™e que un— v—ri—˜le X sigue un— distri˜u™ión ˜inomi—l si ™umple l—s siEguientes ™ondi™ionesX IF g—d— o˜serv—™ión es l— re—liz—™ión de un— v—ri—˜le —le—tori— de fernoulli ™on dos posi˜ilid—des @éxito o f—lloA y un p—rámetro p @pro˜—˜ilid—d de f—lloAF PF v—s diferentes o˜serv—™iones son independientes entre síF QF il número de o˜serv—™iones n es (joFhe est— m—ner— podemos o˜tener l— medi— y l— desvi—™ión típi™— de l— distri˜uE p(1−p)™ión ™omo µ = p y σ = n Fƒi n ≥ 30D l— distri˜u™ión se puede —semej—r — un— xorm—l y —pli™—r los límitesde ™ontrol del €Egh—rtX CL @genter vineAX µ UWL @…pper ‡—rning vimitAX µ + α · σD ™on 0 α 3 UCL @…pper gontrol vimitAX µ + 3 · σ @—proxim—d—menteD el WWFU 7 de l—s o˜serv—™iones de˜erí—n est—r en este um˜r—lAistos límitesD sirven p—r— de(nir unos niveles de ™ontrolD ™omo puede o˜serv—rseen l— pigur— SF v— líne— ™entr—l gv represent— l— medi— de l— ™u—lid—d que seesté midiendoF ƒi en —lgún momento se so˜rep—s— el límite …‡v se est—˜le™e unnivel de —viso @warning AD indi™—ndo de est— m—ner— que es posi˜le que se v—y—— produ™ir un ™—m˜io de ™on™eptoF ƒi sigue l— tenden™i— y so˜rep—s— el límite…gvD se est—˜le™e el nivel de ™—m˜io de(nitivo @drift AF v—s inst—n™i—s re™i˜id—sen el interv—lo que tr—ns™urre desde que se —™tiv— el nivel de —viso y h—st— el quese —™tiv— nivel de drift se —lm—™en—n en un— memori— — ™orto pl—zoD y se us—ránp—r— re™onstruir o —™tu—liz—r el modelo ™u—ndo se— ne™es—rioF ƒi se h— disp—r—doel nivel de —viso y el v—lor ™ontrol—do vuelve — des™enderD situándose —lrededorde l— líne— ™entr—l gv @l— medi—AD se di™e que se h— produ™ido un— f—ls— —l—rm—y se reini™i— l— memori— — ™orto pl—zoF€—r— —just—r dinámi™—mente estos v—lores ™u—ndo l— medi— no es un— ™onst—nteD™omo en un entorno prequentialD se est—˜le™en pmin y smin ™omo l— medi— y desEvi—™ión típi™— menores h—st— el momentoF g—d— vez que lleg— un nuevo ejemploDse —™tu—liz—rán estos v—lores si pi + si pmin + smin F in est— situ—™iónD el nivelde —viso @warning A se —l™—nz—rá ™u—ndo pi + si ≥ pmin + 2 · smin D mientr—s queel nivel de ™—m˜io de(nitivo @drift A se d—rá en pi + si ≥ pmin + 3 · smin F in l—pigur— T podemos ver un ejemplo grá(™o del —juste de estos límitesF IT
  17. 17. 11.0 UCL UWL Quality characteristic 10.0 CL LWL LCL 9.0 3 6 9 12 15 Samplepigur— SX vímites de ™ontrol de Shewhart P-ChartF vos puntos de l— grá(™— estántodos en los límites de lo esper—doD s—lvo el punto II que super— el límite …‡vde —visoD pero se tr—t— de un— f—ls— —l—rm—Fpigur— TX €Egh—rt ™on —juste dinámi™oF v— ™u—lid—d que se mide —quí es l— t—s—de errorD por lo que niveles por de˜—jo de l— medi— signi(™— que el ™l—si(™—dores ™orre™to @no h—y ™—m˜ios de ™on™eptoAD de m—ner— que no es ne™es—rio tenerlímites de ™ontrol inferiores ™omo hemos visto —nteriormente en l— pigur— SF‘g—sHV“iste método se puede us—r ™on ™u—lquier ™l—si(™—dorD y los mismos —utores loin™orpor—ron —l AdPreqFr4SL @—d—pt—™ión dinámi™— de k-Dependence BayesianClassiers A ‘gqHT“F vos niveles de ™—m˜io d—n lug—r — distintos gr—dos de —jusEte del modeloX un —viso impli™— l— —™tu—liz—™ión p—r—métri™— o de estru™tur—D IU
  18. 18. mientr—s que un drift supone un ™—m˜io en el modelo ™on un —umento en l—™omplejid—d del modeloF5.1.2. EDDM (Early Drift Detection Method)v— propuest— de f—en—Eq—r™í— et —lF ‘fqdgep+ HT“ es simil—r —l método hhwDpero en vez de ™ontrol—r l— t—s— de errorD monitoriz— l— distancia entre erroresde clasicación @número de inst—n™i—s ™orre™t—mente ™l—si(™—d—s de form—™onse™utiv—AFƒe denot— pi adist—n™i— medi— entre dos errores y si adesvi—™ión típi™—Fƒe de(nen pmax y smax ™omo v—lores máximos y se —™tu—liz—n ™u—ndo pi +2·si pmax + 2 · smax ™—d— vez que lleg—n nuevos d—tosFil método ™omienz— — fun™ion—r después de que se h—y—n produ™ido QH erroresde ™l—si(™—™iónF iste es el mínimo número de v—lores ne™es—rios p—r— estim—rl— distri˜u™ión de l—s dist—n™i—s entre errores y poder h—™er ™omp—r—™ionesF heest— form— pmax + 2 · smax represent— el WS 7 de l— distri˜u™iónF…s—ndo estos v—loresD se —just—n dos um˜r—les de ™ontrolX Aviso @warning AX (pi + 2 · si )/(pmax + 2 · smax ) α donde α = 0,95F v—s inst—n™i—s se v—n —lm—™en—ndo p—r— ser ™onsider—d—s por el —lgoritmo de —prendiz—je en el ™—so de d—rse por de(nitivo el ™—m˜io de ™on™eptoF Cambio denitivo @drift AX (pi + 2 · si )/(pmax + 2 · smax ) β donde β = 0,90F ƒe re—prende un nuevo modelo us—ndo l—s inst—n™i—s que se h—n ido —lm—™en—ndo dur—nte el nivel de —viso previoF „—m˜ién se reini™i—n los v—lores de pmax y smax Fƒi p—s—do el nivel de —viso se vuelve — l— norm—lid—d @esto esD l— fun™ión so˜rel— dist—n™i— entre errores regres— — niveles inferiores —l límite de —visoAD se eliEmin—n l— se™uen™i— de inst—n™i—s —lm—™en—d— h—st— el momento y se ™ontinú—eje™ut—ndo el métodoFvos v—lores de α y β se (j—n —d ho™ tr—s re—liz—r diferentes experimentosF5.1.3. Método de Kiferil método de uifer et —lF ‘ufdqHR“ no solo tr—t— de dete™t—r el ™—m˜io de™on™eptoD si no t—m˜ién de ™u—nti(™—rloD de m—ner— que se pued— des™ri˜ir l—n—tur—lez— del mismoF €—r— elloD utiliz—n un— medid— de dist—n™i— entre dosdistri˜u™iones de d—tos P1 y P2 D de l—s que —l menos se dispondrá de n puntosde ™—d— un— p—r— poder re—liz—r un— dete™™ión de ™—m˜ioFƒe present— un nuevo método @ver elgoritmo IAD que estim— l— distri˜u™ión depro˜—˜ilid—d de dos vent—n—s W1 e W2 so˜re l— se™uen™i— de d—tosD donde W1es un— vent—n— de t—m—ño m1 ≥ n (j—d— en el inst—nte c0 D mientr—s que W2 esun— vent—n— de t—m—ño m2 ≥ n que se despl—z—rá — lo l—rgo de l— se™uen™i—D™omenz—ndo en c0 + m1 D de m—ner— que no se sol—pen l—s muestr—s entre —m˜—svent—n—sF gu—ndo l— dist—n™i— entre l— distri˜u™ión de d—tos de W1 y l— de W2 IV
  19. 19. es m—yor que un ™ierto um˜r—l αD se est—˜le c0 —l inst—nte —™tu—lD se reini™i—liz—n l—s vent—n—s y se noti(™— que se h— produ™ido un ™—m˜io de ™on™epto en el inst—nte c0 F v— ele™™ión del p—rámetro α de(nirá el equili˜rio entre sensi˜ilid—d y ro˜ustez de l— dete™™iónD por lo que v—lores pequeños serán ™—p—™es de dete™t—r ™—m˜ios —˜ruptosD pero se tendrá más riesgo de dete™t—r f—lsos ™—m˜iosF v— fun™ión de dist—n™i— de˜e ser —de™u—d— p—r— ™u—nti(™—r el gr—do de ™—m˜io y de un— form— intuitiv—F in el —rtí™ulo ‘ufdqHR“ se pueden ™onsult—r l—s nuev—s propuest—s de medid—s de dist—n™i— entre dos distri˜u™iones de d—tosF Algorithm 1 wet—E—lgortimo de uifer p—r— dete™t—r ™—m˜ios de ™on™eptoF il uso de l— v—ri—˜le i permite eje™ut—r h—st— k —lgoritmos ™on diferentes p—rámeE tros de form— p—r—lel—F I f o r i = 1...k do P c0 ← 0 Q W indow1,i ← f i r s t m1,i p o i n t s from time c0 R W indow2,i ← next m2,i p o i n t s i n stre—m S end f o r T w h i l e not — t end o f stre—m do U f o r i = 1...k do V ƒ l i d e W indow2,i ˜y I p o i n t W i f distance(W indow1,i , W indow2,i ) αi thenIH c0 ← ™ u r r e n t timeII ‚eport ™h—nge — t time c0IP g l e — r — l l windows —nd qy„y s t e p IIQ end i fIR end f o rIS end w h i l e 5.1.4. ADWIN (Adaptive Windowing) eF fifet y ‚F q—v—ldà ‘fqHU“D que t—m˜ién h—˜í—n p—rti™ip—do en el des—rrollo de ihhwD present—n el método eh‡sxD que us— un— vent—n— desliz—nte W p—r— monitoriz—r l— t—s— de error del modelo y poder dete™t—r ™—m˜iosF e diferen™i— del método de uiferD expli™—do —nteriormenteD est— vent—n— solo ™ontiene v—lores ˜in—rios @—™ierto o f—llo en l— predi™™ión de ™—d— inst—n™i—A y —demás se modi(™— su t—m—ño de form— dinámi™—F wientr—s no h—y— ningún ™—m˜io de ™on™epto en l— distri˜u™ión de los d—tosD l— vent—n— ™re™e h—st— el momento en que se dete™te un ™—m˜ioD que disminuyeF v— ide— de l— dete™™ión ™onsiste enX ™u—ndo dos su˜vent—n—s su(™ientemente gr—ndes de W tienen medi—s su(™ientemente distint—sD se puede ™on™luir que los v—lores esper—dos de ™—d— su˜vent—n— se—n diferentesF vos v—lores su(™ienE temente se pre™is—rán ™u—ndo se es™oj— el test est—dísti™o y dependerá del nivel de ™on(—nz— δ ∈ (0, 1)F il test est—dísti™o utiliz—do p—r— ™omp—r—r l—s distri˜u™iones de l—s su˜vent—n—s W0 y W1 D ™omprue˜— si l— diferen™i— de l—s medi—s de —m˜—s su˜vent—n—s es m—yor — un determin—do um˜r—l cut @ver elgoritmo PAF IW
  20. 20. Algorithm 2 elgoritmo eh‡sxI s n i t i — l i z e ‡indow WP f o r e—™h t 0Q do W ← W ∪ xt @ i F e F D —dd xt t o t h e he—d o f ‡AR r e p e — t hrop e l e m e n t s from t h e t — i l o f WS u n t i l |ˆW0 − µW1 | cut h o l d s µ ˆT f o r e v e r y s p l i t o f W i n t o W = W0 · W 1U output µW ˆ il v—lor de cut p—r— un— p—rti™ión W0 · W1 de W se ™—l™ul— de l— siguiente form—X ƒe—n n0 y n1 l—s longitudes de W0 y W1 respe™tiv—menteF v— longitud de W es n = n0 + n1 F ƒe—n µW0 y µW1 l—s medi—s de los v—lores en W0 y W1 respe™tiv—menteF ‰ ˆ ˆ µW0 y µW1 sus v—lores esper—dosF €—r— g—r—ntiz—r el rendimiento del método de(nimosX ˆ m= 1 1/n0 +1/n1 @medi— —rmóni™— de n0 y n1 A ˆ δ = δ n @p—r— evit—r pro˜lem—s ™on múltiples hipótesisA il um˜r—l se ™—l™urá ™omo cut = 1 2m · ln δ F 4 ƒe puede ver un ejemplo del fun™ion—miento de este método en el gu—dro PF ƒi µt se m—ntiene ™onst—nte en W D l— pro˜—˜ilid—d de que se reduz™— l— vent—n— en el inst—nte t es ™omo mu™ho de δ D ™on lo que se limitan los falsos positivosF ƒuponiendo que p—r— —lgun— p—rti™ión de W en W0 y W1 D tenemos que |µW0 − µW1 | 2 · cut F inton™esD l— vent—n— W se redu™irá —l t—m—ño de W1 D o menorD ™on pro˜—˜ilid—d 1 − δ D por lo que se limitan así los falsos negativosF PH
  21. 21. W0 W1 µW0 ˆ µW1 ˆ |ˆW0 − µW1 | µ ˆ m cut |ˆW0 − µW1 | ≥ µ ˆ cut [1] [01010110111111] 1/1 10/14 0.2857 0.9333 0.8617 No [10] [1010110111111] 1/2 10/13 0.2692 1.7333 0.6323 No [101] [010110111111] 2/3 9/12 0.0833 2.4 0.5374 No [1010] [10110111111] 2/4 9/11 0.3181 2.9333 0.4861 No [10101] [0110111111] 3/5 8/10 0.2 3.3333 0.4560 No [101010] [110111111] 3/6 8/9 0.3888 3.6 0.4387 No [1010101] [10111111] 4/7 7/8 0.3035 3.7333 0.4308 No [10101011] [0111111] 5/8 6/7 0.2321 3.7333 0.4308 No [101010110] [111111] 5/9 6/6 0.4444 3.6 0.4387 Sí [1010101101] [11111] 6/10 5/5 0.4 3.3333 0.4560 No [10101011011] [1111] 7/11 4/4 0.3636 2.9333 0.4861 No [101010110111] [111] 8/12 3/3 0.3333 2.4 0.5374 No [1010101101111] [11] 9/13 2/2 0.3076 1.7333 0.6323 No[10101011011111] [1] 10/14 1/1 0.2857 0.9333 0.8617 No gu—dro PX ijemplo del fun™ion—miento de eh‡sxF †ent—n— —™tu—lX W = [101010110111111]F δ = 1F el h—˜erse dete™t—do un ™—m˜ioD l— vent—n— disE minuirá su t—m—ño p—r— el próximo inst—nte de tiempoF il pro˜lem— de este método es que es ™omput—™ion—lmente ™ostoso porque tiene que ™ompro˜—r tod—s los posi˜les p—res de su˜vent—n—s de W F €—r— mejor—rloD los —utores present—ron un— nuev— versión ll—m—d— eh‡sxP más e(™iente en tiempo y memori—F ADWIN2 (Adaptive Windowing 2) €—r— redu™ir el ™oste ™omput—™ion—l de eh‡sxD en vez de m—ntener un— vent—n— W en memori—D tiene un— estru™tur— de d—tos ™ompuest— por ™u˜os @buckets A que —lm—™en—n v—lores ˜in—riosF g—d— ™u˜o de˜e ™ontener un— poten™i— de P de I9sF ƒe (j— un p—rámetro M ™omo el máximo número de ™u˜os ™on el mismo t—m—ñoD p—r— ™ontrol—r —sí l— ™—ntid—d de memori—F ƒe puede ver un ejemplo en el gu—dro QF PI
  22. 22. ƒuponemos un— vent—n— de t—m—ño W = 14 ™on v—lores ˜in—rios @—™ierto y f—llode ™l—si(™—™iónA y est— serí— su estru™tur— en form— de ™u˜osX gu˜osX IHIHIHI IHI II I I gontenidoX R P P I I g—p—™id—dX U Q P I Ivleg— un nuevo elementoX gu˜osX IHIHIHI IHI II I I I gontenidoX R P P I I I g—p—™id—dX U Q P I I I„eniendo en ™uent— que M = 2D es ne™es—rio ™omprimir dos de los tres últimos™u˜osD y— que tienen el mismo ™ontenidoF gu˜osX IHIHIHI IHI II II I gontenidoX R P P P I g—p—™id—dX U Q P P Ihespués de ™omprimir dos ™u˜osD nos en™ontr—mos de nuevo ™on que tenemostres ™u˜os ™on el mismo ™ontenidoD por lo que volvemos — ™omprimirF he est—form— se est—rí—n form—ndo l—s su˜vent—n—sF gu˜osX IHIHIHI IHIII II I gontenidoX R R P I g—p—™id—dX U S P Iƒi se dete™t— un ™—m˜ioD se elimin— el ™u˜o más —ntiguoX gu˜osX IHIII II I gontenidoX R P I g—p—™id—dX S P I gu—dro QX ijemplo de fun™ion—miento de eh‡sxPv— e(™ien™i— —hor— es de O(M · log(W/M )) p—l—˜r—s de memori—D y el tiempo depro™es—miento por ™—d— ejemplo es O(log W ) en el peor ™—so y O(1) en el mejorFy˜tiene l— ™—ntid—d de I9s de tod—s los ™u˜os en O(1)F gon ello el número desu˜vent—n—s — ev—lu—r disminuye y se —pli™—n los tests más rápid—mente — l—sse™uen™i—s en los ™u˜osF5.2. Algoritmos con ventana de entrenamientoil uso de vent—n—s permite limit—r el número de inst—n™i—s que se —prendensimultáne—menteD —demásD sirven p—r— elimin—r —quellos d—tos que son de ™onE™eptos —ntiguosF il pro™edimiento ˜ási™o de vent—n— desliz—nte que se us— enminerí— de se™uen™i—s de d—tos se puede ver en el elgoritmo QF g—d— nuev—inst—n™i— se —ñ—de — l— vent—n—D y ™u—ndo el ™l—si(™—dor se —™tu—liz— utiliz—l—s inst—n™i—s de di™h— vent—n— p—r— el —prendiz—jeF il —spe™to ™l—ve de estos—lgoritmos reside en ™ómo se de(ne este tipo de vent—n—sFil enfoque más simple es us—r un— vent—n— de t—m—ño (jo e in™luir solo losejemplos más re™ientes de l— se™uen™i— de d—tos y dese™h—r por l— p—rte más—ntigu—F ehor— ˜ienD se present— un ™ompromiso — l— hor— de es™oger el t—m—ñode l— mism—F ƒi l— vent—n— es de pequeño t—m—ñoD el ™l—si(™—dor será ™—p—zde —just—rse rápid—mente — los ™—m˜iosD pero perderá pre™isión en periodos deest—˜ilid—dF il pro™eso de —prendiz—je se ˜—s— en po™os d—tos y por t—ntoD est—rá PP
  23. 23. sujeto — más os™il—™ionesF in ™—m˜ioD si se es™oge un t—m—ño gr—nde o™urrirá lo ™ontr—rioD el pro™eso de —prendiz—je es más inmune — ™—m˜ios menores o ruidoD pero por el ™ontr—rio tiene más iner™i—D por t—nto será más lento — l— hor— de —d—pt—rse — los ™—m˜iosF €or est— r—zónD se propusieron distintos métodos de —juste dinámi™o de l— —n™hur— de l— vent—n—F Algorithm 3 elgoritmo ˜ási™o ™on vent—n—I intr—d— X S X s e ™ u e n ™ i — de d — t o sP W X vent—n— de e j e m p l o sQ ƒ — l i d — X C X ™ l — s i f i ™ — d o r ™ o n s t r u i d o ™on l o s d — t o s de WRS i n i ™ i — l i z — r vent—n— W YT p—r— t o d o s l o s e j e m p l o s xi en S XU W ← W ∪ xi YV e l i m i n — r e j e m p l o s — n t i g u o s de W s i e s n e ™ e s — r i o YW r e ™ o n s t r u i r o — ™ t u — l i z — r C us—ndo W Y 5.2.1. Método de Klinkenberg il método de ulinken˜erg et —lF ‘u‚WV“ está orient—do — l— ™l—si(™—™ión de do™uE mentos por lotes @batch A en entornos ™—m˜i—ntes @™onsider— ™—m˜ios gr—du—les y —˜ruptosAD y fue uno de los primeros en monitoriz—r diversos indi™—doresD ™on™reE t—mente l— pre™isión @accuracy AD l— espe™i(™id—d @precision A y l— exh—ustivid—d @recall AF €—r— —just—r l— vent—n— de entren—miento en primer lug—r se ™—l™ul— l— medi— y l— desvi—™ión típi™— p—r— ™—d— uno de los indi™—dores @e™™ a e™™ur—™yD ‚e™ a ‚e™—ll y €re™ a €re™isionA en ˜—se — los M últimos lotesD y — ™ontinu—™ión se utiliz— l— siguiente heurísti™—X ƒi —lguno de los indi™—dores ex™ede de su medi— α ve™es su desvi—™ión típi™—D se di™e que se h— s—lido de su interv—lo de ™on(—nz— y h— o™urrido un ™—m˜ioF €—r— ™ono™er l— n—tur—lez— del ™—m˜io @˜rus™o o gr—du—lAD se ™omprue˜— si el indi™—dor en el inst—nte t h— experiment—do un— ™—íd— β del v—lor del mismo en el inst—nte t − 1 ˆ ƒi el ™—m˜io es ˜rus™oD se redu™e l— vent—n— de entren—miento —l mínimo @B a I ˜—t™hAF ˆ ƒi el ™—m˜io es gr—du—lD se redu™e l— vent—n— en ˜—se — un p—rámetro γ de(nido — prioriF in el elgoritmo R se det—ll— en pseudo™ódigo l— heurísti™— emple—d—F ƒi h— o™urrido un ™—m˜io ˜rus™oD es de™irD se veri(™— l— primer— ™ondi™ión @líne—s P — RA y se redu™e l— vent—n— —l mínimo @I ˜—t™hAF in otro ™—soD si el ™—m˜io dete™t—do es gr—du—l @se ™umple l— segund— ™ondi™iónD que —˜—r™— l—s líne—s T — PQ
  24. 24. VA l— vent—n— se redu™e —l t—m—ño γ · 100 %F he no dete™t—rse ningún ™—m˜ioD el t—m—ño de l— vent—n— ™re™e un lote másF Algorithm 4 reurísti™— de ulinken˜erg p—r— —just—r el t—m—ño de l— vent—n— de entren—mientoF I €ro ™edure heterminexew‡indowƒize @ |Wt | D M D α D β D γ A P i f ((Acct AvgM (Acc) − α · StdErrM (Acc)) and (Acct β · Acct−1 )) or Q ((Rect AvgM (Rec) − α · StdErrM (Rec)) and (Rect β · Rect−1 )) or R ((P rect AvgM (P rec) − α · StdErrM (P rec)) and (P rect β · P rect−1 )) S then |Wt+1 | := |B| Y T else i f (Acct AvgM (Acc) − α · StdErrM (Acc) or U (Rect AvgM (Rec) − α · StdErrM (Rec) or V (P rect AvgM (P rec) − α · StdErrM (P rec) W then |Wt+1 | := max(|B|, |Wt | − γ · |Wt |) YIH else |Wt+1 | := |Wt | + |B| YII return |Wt+1 | Y 5.2.2. FISH (uniFied Instance Selection algoritHm) ¢ sF lio˜—ité propuso un— nuev— f—mili— de —lgoritmos ll—m—d— psƒr ‘liIH—“D que us— simil—rid—des de tiempo y esp—™io entre inst—n™i—s p—r— —just—r dinámi™—E mente l— vent—n— de entren—mientoF €—r— expli™—rlo podemos ˜—s—rnos en el siguiente ejemplo ilustr—tivo de l— pigur— UF ƒe tr—t— de un pro˜lem— de ™l—siE (™—™ión ˜in—ri— @puntos ˜l—n™os y negrosA en el que l—s fuentes de gener—™ión de d—tos v—rí—n — lo l—rgo del tiempo de form— gr—du—l ™on l— rot—™ión de un hiperpl—noF €—r— un ™ierto áre— @™ir™unferen™i— roj—AD vemos que l— ™l—se ™orre™E t— en ™—d— inst—nte es diferenteF iste ejemplo muestr— que l— simil—rid—d en un dominio del pro˜lem— dinámi™o depende del tiempo y del esp—™ioF pigur— UX ijemplo de rot—™ión de hiperpl—noF szquierd—X fuente ini™i—l ƒIF gentroX fuente ƒP tr—s rot—r RSºF here™h—X fuente ƒQ tr—s rot—r WHºF v— —utor— propuso sele™™ion—r los ejemplos de l— vent—n— de entren—miento ˜—E sándose en un— medid— de dist—n™i— Dij que se de(ne de est— form—X PR
  25. 25. (s) (t) Dij = a1 dij + a2 dijdonde d(s) es l— dist—n™i— en el esp—™ioD d(t) l— dist—n™i— en el tiempo y a1 , a2son los ™oe(™ientes de ponder—™iónF €—r— dos ejemplos xi , xj D l— —utor— proponel— dist—n™i— eu™líde— ™omo dist—n™i— en el esp—™io y el número de ejemplos quelos sep—r—n ™omo dist—n™i— en el tiempoF were™e l— pen— dest—™—r que si a2 = 0Dl— medid— se ™onvierte en un— sele™™ión de inst—n™i—sD mientr—s que si a1 =0D tenemos un— vent—n— ™uyos pesos disminuyen ™on el tiempoF ƒe es™ogerán—quell—s inst—n™i—s ™on m—yor v—lor de dist—n™i— p—r— ™omponer l— vent—n— deentr—mientoFv— f—mili— de —lgoritmos está ™ompuest— porX psƒrIX el t—m—ño de l— vent—n— de entren—miento se (j— — prioriF psƒrPX el t—m—ño de l— vent—n— de entren—miento se —just— de form— dinámi™—D pero los pesos a1 , a2 se (j—n — prioriF psƒrQX idénti™o — psƒrPD s—lvo que los p—rámetros a1 , a2 se re™—l™ul—n dinámi™—mente — lo l—rgo del tiempoF PS
  26. 26. 6. Aportacionesin primer lug—r v—mos — de(nir el m—r™o de nuestro tr—˜—joF gomo hemos™oment—do —nteriormenteD est—mos en un entorno in™rement—l @ver pigur— VAF in™—d— inst—nte t tenemos un— se™uen™i— de d—tos etiquet—dos X H = (X1 , ..., Xt )D™on l— que se ™onstruye un ™l—si(™—dor Lt F gu—ndo lleg— un— nuev— inst—n™i—Xt+1 h—y que prede™ir su ™l—se yt+1 F†—mos — tr—˜—j—r ™on se™uen™i—s de d—tos que in™luyen ™—m˜ios de ™on™eptoFg—d— inst—n™i— Xt es gener—d— por un origen St F wientr—s este origen se m—ntenEg— ™onst—nte diremos que el ™on™epto no h— ™—m˜i—doD pero ™u—ndo St = St+1 Dnuestro propósito es dete™t—r di™ho ™—m˜io en el inst—nte más próximo —l puntoen que se produjo en l— se™uen™i—F pigur— VX v—s inst—n™i—s de d—tos se pro™es—n de form— in™rement—l ‘liIH˜“F€—r— nuestr—s diferentes propuest—sD nos hemos ˜—s—do en l— heurísti™— del métoEdo hhw de q—m— en el que se utiliz— l— herr—mient— Shewhart P-Chart —pli™—d—so˜re distint—s ™u—lid—desF in primer lug—r se est—˜le™e un nivel de —viso @war-ning A que ™u—ndo se —™tive v— — empez—r — —lm—™en—r inst—n™i—s en un— memori—— ™orto pl—zoD —sí ™omo un nivel de ™—m˜io @drift AD que forz—rá — que se re—prend—el ™l—si(™—dor ™on los ejemplos —lm—™en—dos en di™h— memori—F he est— m—ner—se ™onsigue que —nte un ™—m˜io de ™on™eptoD el ™l—si(™—dor olvide inform—™ión—nti™u—d— y —prend— ™on inst—n™i—s que pertene™en —l nuevo ™on™eptoFe ™ontinu—™ión v—mos — present—r diferentes —ltern—tiv—s que hemos pl—nte—dosiguiendo estos supuestos de tr—˜—jo y de l—s que se llev—ron — ™—˜o su impleEment—™ión y experiment—™iónF6.1. MoreErrorsMoving€—r— nuestr— primer— propuest—D que hemos denomin—do woreirrorswovingDse tr—t— de monitoriz—r los errores de ™l—si(™—™iónF €—r— ello ™ont—mos ™on unhistóri™o Hi = {ei−n , . . . , ei } ™on los n últimos result—dos de ™l—si(™—™ión en elinst—nte ti @ei = 0 en ™—so de —™iertoD ei = 1 en ™—so de f—lloAF †—mos — est—˜le™erel siguiente supuestoX si se produ™e un ™—m˜io de ™on™eptoD el ™l—si(™—dor v— —ver deterior—do su rendimiento y— que no será ™—p—z de ™l—si(™—r ™orre™t—mentelos nuevos d—tosF v— t—re— de dete™™ión que proponemos es ™ontrol—r el número PT
  27. 27. de errores de ™l—si(™—™ión que se v—n produ™iendo — lo l—rgo del tiempoD h—™iendouso del históri™o Hi F n ejƒe— ci = j=0 |ej ∈ Hi l— t—s— de error del históri™o en el inst—nte de tiempo nti F in ™—d— inst—nte de tiempoD se ™omprue˜— si ci−1 ci @se h— in™rement—doel número de errores en el históri™oA y en este ™—so se di™e que h— o™urridoun empeor—miento e in™rement—mos el ™ont—dor de empeor—mientosF in ™—so™ontr—rioD si ci−1 ci D quiere de™ir que se h— redu™ido el número de errores en elhistóri™oD por lo que se ™onsider—rá un— mejor— y se reini™i—liz— — H el ™ont—dorde empeor—mientos ™onse™utivosF in el ™—so de que se m—nteng— el v—lor de cDes de™irD si ci−1 = ci D el ™ont—dor de empeor—mientos se m—ntiene ™on el v—lor—nterior que tuvieseF €odemos ver un— represent—™ión grá(™— de los v—lores quetom— ci — lo l—rgo del tiempo en l— pigur— WF pigur— WX ‚epresent—™ión de l— t—s— de error del históri™o @naWAFe™tu—mos según l— siguiente heurísti™—X ƒi se produ™en k empeor—mientos ™onse™utivosD —™tiv—remos el nivel de —viE so @warning A y ™omenz—remos — —lm—™en—r l—s inst—n™i—s en un— memori— — ™orto pl—zoF @U W L = k A ƒi se produ™en k + d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de ™—m˜io @drift AF e ™ontinu—™iónD se reini™i—liz— el históri™o y los diferentes ™ont—dores @de erroresD inst—n™i—s y empeor—mientosAD —sí ™omo l— memori— — ™orto pl—zoF @U CL = k + dA in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE m—lid—dF ƒe reini™i—liz— el ™ont—dor de empeor—mientos y l— memori— — ™orto pl—zoF @CL = 0A…n ejemplo ilustr—tivo se puede ver en l— pigur— IH donde k = 2 y d = 2F PU
  28. 28. 10 memoria a drift corto plazo detectado warning activadoEmpeoramientos UCL=k+d 5 UWL=k 0 CL=0 10 20 30 40 50 Instancias pigur— IHX €Egh—rt p—r— woreirrorswovingF in l— inst—n™i— QVD se h— dete™t—do un ™—m˜io de ™on™epto porque se h— super—do el um˜r—l …gvF in l—s inst—nE ™i—s PH y SHD —l produ™irse un— mejor— del rendimiento se vuelve —l nivel de norm—lid—d y se reini™i—liz— el ™ont—dor de empeor—mientosF €—r— l— eje™u™ión de este método h—y que de(nir los v—lores de los p—rámetros nD k y d — prioriF 6.2. MaxMoving …n— nuev— propuest—D denomin—d— w—xwovingD tr—t— de monitoriz—r l—s t—s—s de éxito del ™l—si(™—dorF istá ˜—s—d— en l— siguiente suposi™iónX mientr—s el origen del ™on™epto se m—nteng— ™onst—nteD el ™l—si(™—dor v— — mejor—r su pre™isión — lo l—rgo del tiempo @mientr—s sig— re™i˜iendo inst—n™i—sAD pero en el momento en que se produz™— un ™—m˜io @drift AD l—s t—s—s de éxito empez—rán — empeor—r y— que el modelo —™tu—l no prede™irá ™orre™t—mente l— ™l—se de l—s nuev—s inst—n™i—sF f—sándonos en estoD m—ntenemos un históri™o Hi = {ai−n , . . . , ai } ™on l—s n últim—s t—s—s de éxito —™umul—d—s desde el último ™—m˜ioF ƒe— ai = 1 − Nii l—e t—s— de éxito —™umul—d— h—st— el inst—nte ti D donde ei y Ni son el número de errores de ™l—si(™—™ión y el número de inst—n™i—s pro™es—d—s h—st— el inst—nte ti D respe™tiv—menteF ƒe— mi = m´x{aj |aj ∈ Hi } l— mejor t—s— de éxito del históE a ri™o en el inst—nte ti F wientr—s se estén ™l—si(™—ndo inst—n™i—sD ™ompro˜—mos si mi−1 mi D y si es —síD ™onsider—mos que se está mejor—ndo l— t—s— de éxito —™uE mul—d—F in ™—so ™ontr—rioD en el que el nuevo máximo es menor que el —nteriorD diremos que h— empeor—do e in™rement—mos un ™ont—dor de empeor—mientosF ƒi mi−1 = mi D es de™irD el máximo en el históri™o —nterior y el —™tu—l no h— ™—m˜ioD m—ntenemos el v—lor que y— tuviese el ™ont—dor de empeor—mientosF il uso del máximo so˜re el históri™o Hi de t—m—ño nD nos permite —mortigu—r l—s pequeñ—s os™il—™iones del tipo ai−1 ai ai+1 D ™—so en el que l— t—s— de éxito ™omienz— — des™enderD pero luego remont— rápid—menteF ƒe puede ver un— represent—™ión grá(™— de los distintos v—lores que tom— mi — lo l—rgo del tiempo en l— pigur— IIF PV
  29. 29. Máximo del histórico de tasas de éxito 1.0 0.8 0.6 Max. Accuracy 0.4 0.2 0.0 0 10000 20000 30000 40000 50000 Instancespigur— IIX ‚epresent—™ión de l—s mejores t—s—s de éxito —™umul—d—s en el hisEtóri™o — lo l—rgo del tiempoF v—s ™—íd—s del rendimiento se de˜en — ™—m˜ios de™on™eptoFv— ™u—lid—d que v—mos — ™ontrol—r en el €Egh—rt es el número de empeor—mienEtosD de m—ner— que pod—mos dete™t—r ™uándo el modelo y— no es —de™u—ndop—r— los d—tos que se están re™i˜iendo y es ne™es—rio re—prenderF gonsider—mosl— siguiente heurísti™—X ƒi se produ™en k empeor—mientos ™onse™utivosD —™tiv—remos el nivel de —viE so @warning A y ™omenz—remos — —lm—™en—r l—s inst—n™i—s en un— memori— — ™orto pl—zoF @U W L = k A ƒi se produ™en k + d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de ™—m˜io @drift AF e ™ontinu—™iónD se reini™i—liz— el históri™o y los diferentes ™ont—dores @de erroresD inst—n™i—s y empeor—mientosAD —sí ™omo l— memori— — ™orto pl—zoF @U CL = k + dA in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE m—lid—dF ƒe reini™i—liz— el ™ont—dor de empeor—mientos y l— memori— — ™orto pl—zoF @CL = 0A€—r— l— eje™u™ión del dete™tor w—xwoving es ne™es—rio est—˜le™er — priori losv—lores de los p—rámetros n, k y dF6.3. MovingAverage„r—s re—liz—r diversos experimentos ™on los dos métodos —nterioresD nos dimos™uent— de que se produ™í—n mu™hos f—lsos positivosD es de™irD se dete™t—˜—n ™—mE˜ios inexistentes en l— se™uen™i— de d—tosF isto se de˜í— — que l—s dos fun™ionesmonitoriz—d—s present—˜—n mu™h—s os™il—™iones @grá(™—s en dientes de sierr—A PW
  30. 30. que en o™—siones er—n tom—d—s erróne—mente ™omo ™—m˜iosF €—r— intent—r p—Eli—r este defe™toD —pli™—mos el método est—dísti™o de l—s medi—s móviles @movingaverage A que ™onsiste en ™re—r series de promedios d—do un ™onjunto de puntosFin nuestro ™—soD queremos promedi—r l—s t—s—s de éxito us—ndo un— vent—n— desu—viz—do de t—m—ño m p—r— que l— grá(™— presente un ™omport—miento ™onmenos os™il—™iones @ver ejemplo de l— pigur— IPAF Original Moving Average (100) 100 100 80 80 60 60 Accuracy Accuracy 40 40 20 20 0 0 0 5000 10000 15000 20000 0 5000 10000 15000 20000 Instances Instances Moving Average (500) Moving Average (1000) 100 100 80 80 60 60 Accuracy Accuracy 40 40 20 20 0 0 0 5000 10000 15000 20000 0 5000 10000 15000 20000 Instances Instancespigur— IPX v— primer— grá(™— @—rri˜— izquierd—A es l— origin—lD mientr—s que enel resto se represent— en rojo l— medi— móvil simpleD ƒweD ™on su—viz—do demaIHHD SHH y IHHHD respe™tiv—mente —pli™—do so˜re los v—lores de l— líne— gris@origin—lAFfási™—mente h—y dos tipos de medi—s móvilesX IF Media móvil simple (SMA)X que se ™—l™ul— ™omo l— medi— —ritméti™— de l—s últim—s m o˜serv—™ionesF st = m 1 m−1 xt +xt−1 +xt−2 +···+xt−(m−1) n=0 xt−n = m = xt −xt−m st−1 + m PF Media móvil ponderada (WMA)X se ™—l™ul— utiliz—ndo un ™onjunto de m pesos @que en tot—l sum—n IA que se —pli™—n — ™—d— o˜serv—™iónF m−1 st = n=0 wn xt−n = w0 xt + w1 xt−1 + · · · + wm−1 xt−(m−1)in nuestro método solo hemos us—do el primer tipo @ƒweAD —unque p—r— untr—˜—jo futuro serí— interes—nte pro˜—r el segundo @‡weAD de m—ner— que se—justen los pesos p—r— d—rle más import—n™i— — los o˜serv—™iones más re™ientesF QH
  31. 31. v—s o˜serv—™iones — promedi—r en nuestro método wovingever—ge v—n — ser l—s t—s—s de —™ierto —™umul—d—s de l—s m últim—s muestr—sF e l— hor— de dete™t—r ™—m˜ios hemos pl—nte—do dos heurísti™—s diferentes que tr—t—n de ™—r—™teriz—r dos tipos de ™—m˜ios en los d—tosX gr—du—les y —˜ruptosF v— primera heurística es —de™u—d— p—r— ™—m˜ios gr—du—lesD que ™onsider— que se h— produ™ido un empeor—miento si st st−1 y fun™ion— de l— siguiente m—ner— @ver ejemplo en gu—dro RAX ƒi dur—nte k ve™es ™onse™utiv—s h— empeor—do l— t—s— promedi—d—D —™tiv—E mos el nivel de —viso @warning A y ™omenz—mos — —lm—™en—r l—s inst—n™i—s re™i˜id—s en un— memori— — ™orto pl—zoF ƒi se produ™en k+d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de ™—m˜io @drift AF in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE m—lid—d y se elimin—n l—s inst—n™i—s de l— memori— — ™orto pl—zoF Instancias →Predicción 0 1 0 0 1 1 1 0 0 0 0 0 0 1 1Tasa de acierto 0/1 1/2 1/3 1/4 2/5 3/6 4/7 4/8 4/9 4/10 4/11 4/12 0/1 1/2 2/3Media móvil - - 0.27 0.36 0.32 0.38 0.49 0.52 0.50 0.44 0.40 0.36 - - 0.38Empeoramientos 0 0 0 0 1 0 0 0 1 2 3 4 0 0 0Nivel N N N N N N N N N W W D N N N gu—dro RX ijemplo de fun™ion—miento de l— primer— heurísti™— del método woE vingever—geF v— (l— de predi™™ión ™ontiene I si se h— —™ert—do o H si h— f—ll—doF v— t—s— de —™ierto es l— —™umul—d— desde el prin™ipio @o desde el último drift dete™t—doAF v— medi— móvil se re—liz— ™on m = 3 últim—s t—s—s de —™iertoF il nivel de w—rning @‡A se —™tiv— ™u—ndo h—y k = 2 empeor—mientos ™onse™utivos y el de drift @hA ™u—ndo h—y R @d = 2AD en otro ™—so se en™uentr— en norm—lid—d @xAF in ™—so de tr—t—rse de ™—m˜ios ˜rus™os entre ™on™eptos muy distintosD l— t—s— de —™ierto no de™—e progresiv—menteD si no de form— drásti™—D por lo que ™on l— heurísti™— —nterior o˜tendrí—mos f—lsos neg—tivos —l no dete™t—rse medi—nte empeor—mientos su™esivosF €or elloD implement—mos un— segunda heurística ˜—s—d— en el s—lto o diferen™i— en los v—lores de l—s t—s—s de éxito p—r— poder dete™t—r est— ™—íd— de rendimiento @ver ejemplo en gu—dro SAF sgu—l que —ntesD se monitoriz— l— t—s— de —™ierto —™umul—d— promedi—d— de l—s m últim—s muestr—sD pero —demás m—ntenemos un históri™o de t—m—ño n ™on estos v—lores promediosF ehor—D p—r— ™—d— inst—nte de tiempo t: ƒe o˜tiene smax ™omo el mejor v—lor del históri™oD —sí ™omo l— t—s— de —™ierto promedi—d— —™tu—l st F ƒi l— diferen™i— entre st y smax super— un ™ierto um˜r—l uD —™tiv—remos el nivel de —viso @warning AF wientr—s que si super— un um˜r—l v D —™tiv—remos el nivel de ™—m˜io @drift AF ƒe de˜e ™umplir que u v F istos v—lores reE present—n el por™ent—je de ™—íd— de rendimiento frente — smax y tom—rán v—lores entre H y IF QI
  32. 32. ƒi no se d— ninguno de estos dos ™—sosD se est—˜le™e el nivel de norm—lid—dF Instancias →Predicción 0 1 0 0 1 1 1 0 0 0 0 0 1 1Tasa de acierto 0/1 1/2 1/3 1/4 2/5 3/6 4/7 4/8 4/9 4/10 4/11 0/1 1/2 2/3Media móvil - - 0.27 0.36 0.32 0.38 0.49 0.52 0.50 0.44 0.40 - - 0.38Máx. media móvil - - - - 0.36 0.38 0.49 0.52 0.52 0.52 0.50 - - -Diferencia - - - - 0.04 0 0 0 0.02 0.08 0.10 - - -Nivel N N N N N N N N N W D N N N gu—dro SX ijemplo de fun™ion—miento de l— segund— heurísti™— del método woE vingever—geF v— (l— de predi™™ión ™ontiene I si se h— —™ert—do o H si h— f—ll—doF v— t—s— de —™ierto es l— —™umul—d— desde el prin™ipio @o desde el último drift dete™t—doAF v— medi— móvil se re—liz— ™on m = 3 últim—s t—s—s de —™iertoF il históri™o ne™es—rio p—r— ™—l™ul—r el máximo está ™ompuesto por n = 3 últim—s medi—s móvilesF il nivel de w—rning @‡A se —™tiv— ™u—ndo l— diferen™i— es m—yor o igu—l que u = 5 % y el de drift @hA ™u—ndo es m—yor o igu—l que v = 10 %D en otro ™—so se en™uentr— en norm—lid—d @xAF pin—lmente ™om˜in—mos —m˜—s heurísti™—s en el método wovingever—ge p—r— poder dete™t—r ™u—lquier— de los dos ™—m˜ios men™ion—dosF €—r— ello se de˜e tener en ™uent— el sol—p—miento de los niveles de —viso y de ™—m˜io de ™—d— un— de l—s heurísti™—sF ƒe—n ω1 y ω2 los niveles de —visoD δ1 y δ2 los niveles de drift y η1 y η2 los niveles de norm—lid—d de l—s heurísti™—s I y P respe™tiv—menteF he(nimos pues los niveles de nuestr— heurística híbrida ™omoX IF xivel de norm—lid—dX ηH = η1 ∧ η2 ⇒!ω1 ∧!ω2 ∧!δ1 ∧!δ2 F PF xivel de —viso @warning AX ωH = ω1 ∨ ω2 F QF xivel de ™—m˜io @drift AX δH = δ1 ∨ δ2 F in el elgoritmo S se puede ver el pseudo™ódigo de este métodoF QP
  33. 33. Algorithm 5 elgoritmo woving ever—ge rí˜rido I δ1 a δ2 a ω1 a ω2 a pevƒi Y P — ™ ™ u r — ™ y a I − e r r o r s G numsnst—n™es Y Q window F —dd @ — ™ ™ u r — ™ y A Y GG remove o l d e s t i f window F s i z e m R i f window F s i z e aa mX S ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e a window F — v e r — g e @ A T U GG −− ˜ e g i n f i r s t h e u r i s t i ™ −− GG V i f ™urrente™™ur—™yever—ge ` previouse™™ur—™yever—ge X W ™ o n s e ™ u t i v e h r o p s CCY GG worseIH else i f ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e b p r e v i o u s e ™ ™ u r — ™ y e v e r — g e XII ™ o n s e ™ u t i v e h r o p s a H Y GG ˜ e t t e rIP else XIQ ™ o n s e ™ u t i v e h r o p s a ™ o n s e ™ u t i v e h r o p s Y GG s—meIRIS previouse™™ur—™yever—ge a ™urrente™™ur—™yever—ge YITIU if ™ o n s e ™ u t i v e h r o p s b kCd XIV δ1 a „‚…iYIW else i f ™ o n s e ™ u t i v e h r o p s b k XPH ω1 a „‚…iYPI GG −− end o f f i r s t h e u r i s t i ™ −− GGPPPQ h i s t o r y F —dd @ ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e A GG remove o l d e s t i f h i s t o r y F s i z e nPR i f h i s t o r y F s i z e aa n XPS GG −− ˜ e g i n s e ™ o n d h e u r i s t i ™ −− GGPT d i f f e r e n ™ e a h i s t o r y F m—x @ A − ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e YPU if differen™e b vXPV δ2 a „‚…iYPW else i f d i f f e r e n ™ e b u XQH ω2 a „‚…iYQI GG −− end s e ™ o n d h e u r i s t i ™ −− GGQPQQ if or δ2 X δ1QR return h‚sp„ YQS else i f ω1 or ω2 XQT return ‡e‚xsxqYQU else XQV return xy‚wevY el igu—l que en los métodos —nterioresD los v—lores de n, kD d, u y v h—y que (j—rlos — prioriF QQ
  34. 34. 7. MOA (Massive Online Analysis)€—r— ev—lu—r nuestr—s propuest—s y re—liz—r un— ™omp—r—tiv— ™on —lgunos de losmétodos des™ritos —nteriormente se h— utiliz—do el entorno de des—rrollo wye@w—ssive ynline en—lysisA ‘fuHW˜D fru€IH“F wye es un softw—re des—rroll—Edo en l— …niversid—d de ‡—ik—to @xuev— el—nd—A p—r— re—liz—r experimentosde ™l—si(™—™ión y ™lustering ™on se™uen™i—s de d—tosF istá rel—™ion—do ™on elproye™to ˜ien ™ono™ido ‡iue ‘fpr+ IH“ @de minerí— de d—tos tr—di™ion—lAF„—m˜ién está implement—do en t—v— y tiene li™en™i— q€vF intre otr—s utiliEd—desD propor™ion— muestr—s y se™uen™i—s de d—tos y— que ™ontiene un— ˜uen—™ole™™ión de gener—dores de se™uen™i—s de d—tosF edemásD in™luye —lgoritmos de™l—si(™—™ión y —grup—miento @™lusteringAD —sí ™omo v—rios métodos de ev—lu—E™iónF in este —p—rt—do ex™lusiv—mente v—mos — det—ll—r l— p—rte de ™l—si(™—™ióny de gener—doresD que son l—s que hemos us—do en l— se™™ión experiment—l deltr—˜—joF7.1. El entornov— form— de utiliz—r wye es medi—nte l— eje™u™ión de t—re—s @tasks AF ist—s t—Ere—s se pueden l—nz—r t—nto — tr—vés de un— interf—z grá(™—D ™omo por líne— de™om—ndos y mu™h—s de ell—s se pueden en™—den—r @ver pigur— IQAF v—s t—re—sprin™ip—les son de —prendiz—je y ev—lu—™iónD —unque h—y otr—s útiles ™omo geEner—r un— se™uen™i— de d—tos que —demás se puede gu—rd—r en e‚pp @form—toutiliz—do por ‡iue muy ™omún en minerí— de d—tosAF pigur— IQX plujo de tr—˜—jo en wyev— interf—z grá(™— de wye permite utiliz—r los métodos de minerí— de d—tostr—di™ion—l @en modo ˜—t™hA de ‡iueF isto result— espe™i—lmente útil p—r—™omp—r—r el —prendiz—je online ™on un —prendiz—je ˜—t™h ™omo referen™i—F edeEmásD nos permite l—nz—r v—ri—s t—re—s de form— simultáne— y ver l— evolu™iónde ™—d— un—D pudiendo detener ™u—lquier— de ell—s en ™u—lquier momentoF inl— pigur— IR podemos ver un ejemplo de l— vent—n— prin™ip—l de l— —pli™—™ióndur—nte l— eje™u™ión de un— t—re— de ™l—si(™—™iónF QR
  35. 35. pigur— IRX †ent—n— prin™ip—l de wyeF ije™u™ión de un— t—re— de ev—lu—™ión@€requenti—lA de un método de ™l—si(™—™ión @roeding„reeA ™on dete™™ión de™—m˜io @ihhwA so˜re un— se™uen™i— de d—tos gener—d— por ƒieqener—torF inl— p—rte superior se puede ver l— t—re— eje™ut—d— y en l— p—rte inferior l— s—lid—de l— mism— — interv—los de IHHH inst—n™i—s @de(nido previ—menteAF7.2. Generación de secuencias de datosgomo y— indi™—mosD un— ™—r—™terísti™— muy útil de wye es l— posi˜ilid—d degener—r se™uen™i—s de d—tos — p—rtir de diversos gener—dores que in™orpor— pordefe™to y que list—mos — ™ontinu—™iónF STAGGER Concepts GeneratorX vos ™on™eptos de ƒ„eqqi‚ ‘ƒqVT“ ™onform—n un estánd—r en l— ev—lu—™ión de ™l—si(™—dores en entornos ™on se™uen™i—s de d—tos ™on ™—m˜ios de ™on™eptoF il pl—nte—miento origin—l present— un— serie de ejemplos ™on tres —tri˜utosX ˆ color ∈ {green, blue, red} ˆ shape ∈ {triangle, circle, rectangle} ˆ size ∈ {small, medium, large} v— se™uen™i— de d—tos se divide en tres ™on™eptosX en los primeros RH ejemplosD el ™on™epto es color = red ∧ size = smallY en los siguientes RH QS
  36. 36. ejemplosD el ™on™epto es color = green shape = circleY por últimoD losRH ejemplos (n—les se ™onstruyen ™on el ™on™epto size = medium size =largeF istos ™on™eptos se pueden o˜serv—r de form— visu—l en l— pigur—ISF ƒe h— us—do en ‘†xII“‘‡uWT“‘fr€+ HW“‘qwg‚HR“‘uwHU“F pigur— ISX †isu—liz—™ión de los ™on™eptos ƒ„eqqi‚ ‘uwHU“SEA Concepts GeneratorX iste ™onjunto de d—tos —rti(™i—l present—Edo en ‘xuHI“ está ™ompuesto por ™u—tro ˜loques de d—tos ™on diferentes™on™eptosF vos d—tos ™onst—n de tres —tri˜utos y un— ™l—se ˜in—ri—F v—™l—si(™—™ión se re—liz— solo ™on dos —tri˜utosD mientr—s que el ter™ero esirrelev—nteD siguiendo est— fun™iónX f1 + f2 ≤ θD donde f1 y f2 son losdos primeros —tri˜utos y θ es un um˜r—l que se —just— p—r— ™—d— unode los ˜loques de d—tos siguiendo este orden {9, 8, 7, 9,5}F he est— forEm—D l— se™uen™i— de d—tos se de(ne ™omo l— unión ™onse™utiv— de SEA9 DSEA8 D SEA7 y SEA9,5 D donde ™—d— ™onjunto ™onst— de IPSHH inst—n™i—sDpresent—ndo un ™—m˜io ˜rus™o entre ™—d— ™on™eptoF is posi˜le —demás inE™orpor—r un por™ent—je de ruido por medio del p—rámetro nF ƒe h— us—doen ‘fr€+ HW“‘uwHU“‘qƒ—‚HW“FRandom RBF GeneratorX in est— se™uen™i—D se gener— un número (jode ™entroides @™l—sesA de form— —le—tori— y — ™ontinu—™ión se ™re—n nuevosejemplos eligiendo ™u—lquier— de estos ™entroides de m—ner— que ™—ig—n™er™— de los mismosF v— dist—n™i— —l ™entroide se o˜tiene de form— —le—tori—de un— distri˜u™ión q—usi—n— ™uy— desvi—™ión típi™— viene determin—d—por el ™entroideF ƒolo se utiliz—n —tri˜utos numéri™osF €—r—r introdu™ir un™—m˜io de ™on™epto se despl—z—n los ™entroides en el esp—™io indi™—ndo elnúmero k de ™entroides — despl—z—r y l— velo™id—d s ™on l— que lo v—n —h—™erF ƒe h— us—do en ‘fr€+ HW“FLED GeneratorX ist— se™uen™i— de d—tos ‘fpyƒVR“ ™onst— de PR —triE˜utos ˜in—riosD IU de los ™u—les son irrelev—ntesF il o˜jetivo es prede™ir eldígito mostr—do en un displ—y vih de U segmentos en el que ™—d— —tri˜uEto tiene un IH 7 de posi˜ilid—des de est—r invertidoF ƒe puede in™luir un QT
  37. 37. ™—m˜io de ™on™epto indi™—ndo el número d de —tri˜utos ™on ™—m˜iosF ƒe h— us—do en ‘†xII“‘fr€+ HW“F Waveform GeneratorX ist— se™uen™i— de d—tos —p—re™ió t—m˜ién en ‘fpyƒVR“F il o˜jetivo es diferen™i—r entre Q ™l—ses diferentes de ond—sD donde ™—d— un— de l—s ™u—les se h— gener—do por un— ™om˜in—™ión de P o Q ond—s ˜—sesF ixisten dos versiones de este pro˜lem—X w—vePI ™on PI —tri˜utos numéri™os ™on ruido y w—veRH ™on IW —tri˜utos extr— irreE lev—ntesF ixiste l— posi˜ilid—d de introdu™ir ™—m˜ios en un determin—do número d de —tri˜utos p—r— forz—r un ™—m˜io de ™on™eptoF ƒe h— us—do en ‘†xII“‘fr€+ HW“‘qƒ—‚HW“F Function Generator (Agrawal)X iste ™onjunto de fun™iones se presentó en ‘esƒWQ“ y h— sido us—do p—r— ™ompro˜—r l— es™—l—˜ilid—d en —lgoritmos de —prendiz—je ™on ár˜oles de de™isiónF v— se™uen™i— de d—tos se puede gener—r en ˜—se — IH fun™iones diferentes ™on W —tri˜utos des™ritos en el gu—dro T @T numéri™os y Q ™—tegóri™osA y un— ™l—se ˜in—ri—D de m—ner— que simul— un— hipotéti™— —pli™—™ión de ™on™esión de prést—mos ˜—n™—E riosF eunque es un— ˜uen— form— de gener—r se™uen™i—s ™on ™—m˜ios de ™on™eptos de˜ido — l— v—ried—d de sus fun™ionesD en l— ˜i˜liogr—fí— de deE te™™ión de drifts solo hemos en™ontr—do que se h— us—do en ‘fr€+ HW“FAtributo Descripción Valores salary Sueldo Entre 20000 y 150000commision Comisión Si salary ≥ 75000 ⇒ comission = 0, en otro caso, entre 10000 y 75000 age Edad Entre 20 y 80 elevel Nivel educativo Entre 0 y 4 (categórico) car Marca del coche Entre 1 y 20 (categórico) zipcode Código postal Entre 1 y 9 (categórico) hvalue Valor de la vivienda Entre 0.5k100000 y 1.5k100000 donde k depende de zipcode hyears Edad de la vivienda Entre 1 y 30 loan Valor del préstamo Entre 0 y 500000 gu—dro TX hes™rip™ión de los —tri˜utos de egr—w—l Rotating HyperplaneX v—s se™uen™i—s de d—tos gener—d—s por medio de un hiperpl—no rot—torio se us—ron ini™i—lmente en ‘rƒhHI“F …n hiperpl—no en un esp—™io dEdimension—l es el ™onjunto de puntos en x que s—tisf—™e d d i=1 wi xi = w0 = i=1 wi donde xi es l— iEésim— ™oorden—d— de xF vos ejemplos m—yores o igu—les que w0 son etiquet—dos ™omo positivosD y el resto ™omo neg—tivosF €—r— introdu™ir un ™—m˜ioD ˜—st—rá ™on ™—m˜i—r el peso de un —tri˜uto wi = wi + dσ D donde d es el ™—m˜io que se —pli™— y σ l— pro˜—˜ilid—d de que se produz™— di™ho ™—m˜ioF vos hiperpl—nos son útiles p—r— simul—r ™—m˜ios de ™on™eptosD porque permiten modi(™—r l— orient—™ión y l— posi™ión del hiperpl—no de un— m—ner— su—ve —just—ndo el peso de ™—d— —tri˜utoF ƒe h— us—do en ‘†xII“‘fr€+ HW“‘fqHU“F in l— pigur— IT se puede o˜serv—r l— interf—z de wye p—r— gener—r se™uen™i—s de d—tos y —lm—™en—rl—s en (™heros e‚ppF QU
  38. 38. pigur— ITX snterf—z p—r— gener—r un— se™uen™i— de IHHH d—tos us—ndo el gener—dorƒ„eqqi‚Fƒi nuestro propósito es disponer de se™uen™i—s ™on ™—m˜io de ™on™eptoD un —sEpe™to interes—nte es l— posi˜ilid—d de in™orpor—r ™—m˜ios ™ontrol—dos1 F €—r— ellose pueden utiliz—r los gener—dores ™oment—dos —nteriormente y ™om˜in—rlos meEdi—nte un— fun™ión sigmoide @ver pigur— IUA que determin— el ™—m˜io de unorigen de d—tos — otroF gomo p—rámetros de l— fun™ión podemos de(nir el moEmento t0 en el que su™ede el ™—m˜ioD —sí ™omo —just—r l— ˜rusqued—d ™on l— quese produ™e por medio de αD o ˜ienD l— longitud del mismo us—ndo W F hur—nteeste interv—lo se v—n — mez™l—r en l— se™uen™i— de d—tos inst—n™i—s de —m˜os™on™eptosF ytr— posi˜ilid—d es gener—r v—ri—s se™uen™i—s de d—tos de form— inEdependiente y luego junt—rl—s de form— ™onse™utiv— en un— sol— se™uen™i—F 1 De cara a la experimentación es fundamental saber cuántos cambios, en qué momento yel tiempo de cambio producido en la secuencia de datos, para luego llevar a cabo evaluacionesy comparaciones entre métodos. QV
  39. 39. pigur— IUX pun™ión sigmoide f (t) = 1/(1 + e−s(t−t0 ) ) F gu—nto m—yor se— αDmenor será W y el ™—m˜io será más ˜rus™oF‘fuHW—“7.3. Métodos de clasicaciónvos prin™ip—les métodos de ™l—si(™—™ión online que se en™uentr—n y— impleEment—dos en wye sonX x—ive f—yesD x—ive f—yes wultinomi—l ‘wxWV“D heE™ision ƒtumpD roeding „ree ‘rƒhHI“D roeding yption „ree ‘€ruHU“D f—gEging ‘yz—HS“D foosting ‘yz—HS“D f—gging using eh‡sx ‘fqHU“D f—gging usinged—ptiveEƒize roeding „rees ‘fr€+ HW“D €er™eptronD ƒqhX ƒto™h—sti™ qr—dienthes™entD €eg—sos ‘ƒƒƒƒgHU“D €er™eptron ƒt—™king of ‚estri™ted roeding „rees‘fpr€IH“ y vever—ging f—gging ‘fr€IH“F edemás de estosD t—m˜ién nos perEmite in™orpor—r los —lgoritmos desde ‡iue —sí ™omo ™om˜in—r ™u—lquier— deellos ™on un método de dete™™ión de ™—m˜ioF7.4. Métodos de evaluación7.4.1. Holdoutin el —prendiz—je en ˜—t™hD lo h—˜itu—l es utiliz—r v—lid—™ión ™ruz—d—D pero ™omoy— se h— indi™—do en l— ƒe™™ión QFR es invi—˜le us—r este método p—r— el —prendiEz—je por se™uen™i—s de d—tos y— que se vuelve muy ™ostosoF €or elloD en ‘fuHW—“propusieron us—r el método holdout que us— un ™onjunto de entren—miento yotro de testFin wye podemos de(nir ™—d— ™uánto se ev—lú— el modelo entren—doF €—r—se™uen™i—s de d—tos sin ™—m˜io de ™on™eptoD podemos us—r siempre el mismo™onjunto de testD pero en ™—so de que se— un— se™uen™i— ™on drift es ne™es—rioque el ™onjunto de test se —™tu—li™e ™on el tiempo y— que si no podrí—mos est—rev—lu—ndo ™on inst—n™i—s que pertene™en — un— distri˜u™ión de d—tos distint— —l— entren—d—F v— implement—™ión de wye solo ™ontempl— —™tu—lmente el usode ™onjuntos de test estáti™osD por lo que no es indi™—do p—r— ev—lu—r se™uen™i—s™on ™—m˜iosF QW
  40. 40. 7.4.2. Interleaved Test-Then-Train (o Prequential)ytro método diferente ™onsiste en ev—lu—r el modelo ™on ™—d— nuev— inst—n™i—y luego us—rlo p—r— el entren—mientoF ist— té™ni™— se puede us—r t—nto p—r—se™uen™i—s de d—tos ™on ™—m˜ios y sin ™—m˜ios de ™on™eptoF il in™onveniente deeste método es que —l ™omienzo de l— ev—lu—™ión es pro˜—˜le que o˜teng—mospeores result—dos de˜ido — que el modelo no está tod—ví— ˜ien entren—doF in l—pigur— IV podemos ver un ejemplo de un— vent—n— de ™on(gur—™ión de wyep—r— est—˜le™er l— ev—lu—™iónFƒegún el estudio re—liz—do por q—m— et —lF ‘qƒ—‚HW“ este método es más indi™—dop—r— se™uen™i—s de d—tosFpigur— IVX †ent—n— de ™on(gur—™ión p—r— un— t—re— de ev—lu—™iónF il método de—prendiz—je es roeding„ree ™on dete™™ión de ™—m˜io ihhwF v— se™uen™i— ded—tos de IHHFHHH inst—n™i—s se gener— medi—nte ƒie qener—torF v— ev—lu—™iónse re—liz— en un entorno prequenti—l y se v—n — mostr—r l—s t—s—s de éxito —™uEmul—d—s ™—d— IFHHH inst—n™i—s pro™es—d—sF …n ejemplo de l— s—lid— por p—nt—ll—de l— eje™u™ión puede verse en l— pigur— IRF RH
  41. 41. 8. Experimentación€—r— ™ompro˜—r l— e(™—™i— de los métodos propuestosD hemos re—liz—do un— expeEriment—™ión so˜re diferentes se™uen™i—s de d—tosF gomo el propósito es ev—lu—rlos diferentes métodos de dete™™ión de ™—m˜iosD se h—n prep—r—do se™uen™i—st—nto ™on ™—m˜ios ˜rus™os ™omo ™on ™—m˜ios gr—du—lesD —demás de v—ri—s seE™uen™i—s ™on d—tos re—les disponi˜les en httpXGGmo—F™sFw—ik—toF—™FnzGd—t—setsGy que se h—n utiliz—do en l— liter—tur—Fv— ev—lu—™ión se h— re—liz—do medi—nte l— estr—tegi— prequenti—lD en l— que se™l—si(™—n y luego se entren—n ™—d— un— de l—s inst—n™i—s de l— se™uen™i— ™onformese v—n re™i˜iendoF €—r— poder h—™er un— ™omp—r—tiv— entre los distintos métoEdosD se h— (j—do ™omo —lgoritmo de ™l—si(™—™ión el x—ivef—yes y se h— ™—l™ul—doel e…gD áre— ˜—jo l— ™urv— de t—s—s de éxito —™umul—d—s desde el prin™ipio del— eje™u™iónF ytros d—tos ™—l™ul—dos h—n sido el número de ™—m˜ios dete™t—dos™orre™t—mente e in™orre™t—mente @f—lsos positivos y f—lsos neg—tivosAD —sí ™omol— dist—n™i— medid— en número de inst—n™i—s desde que s—˜emos que se produ™eel ™—m˜io de ™on™epto h—st— que (n—lmente se dete™t—F in el ™—so de l—s se™uenE™i—s de d—tos re—lesD no podemos ™—l™ul—r est— dist—n™i—D y— que des™ono™emos™uántos ™—m˜ios present—n y ™uándo se produ™enF8.1. Conjuntos de datos realesElectricity Market (ELEC)iste es uno de los ™onjuntos de d—tos re—les más utiliz—dos en dete™™ión dedriftsF ƒe tr—t— de un— se™uen™i— de d—tos (nit— ™ompuest— por RSFQIP inst—n™i—sDdonde ™—d— muestr— represent— un periodo de QH minutos ™on v—lores de l—ofert— y dem—nd— de l— energí— elé™tri™— de un— ™iud—d eustr—li—n—D donde lospre™ios v—rí—n según l— dem—nd—F il v—lor de l— ™l—se se re(ere — l— v—ri—™ióndel pre™io ™on respe™to — l— medi— de l—s últim—s PR hor—sF ƒe h— us—do en‘fr€+ HW“‘qwg‚HR“‘fqHU“‘fqdgep+ HT“‘uwHU“FForest Covertype (Forest)iste ™onjunto de d—tos ™ontiene v—lores so˜re el tipo de suelo forest—l en regionesde ist—dos …nidosF istá ™ompuesto por SVIFHIP inst—n™i—s ™on SR —tri˜utos y U™l—sesF ƒe h— us—do en ‘†xII“‘fr€+ HW“FPoker-Hand (Poker)iste ™onjunto está ™ompuesto por IFHPSFHIH inst—n™i—sD donde ™—d— muestr—represent— un— m—no de S ™—rt—s es™ogid—s de un— ˜—r—j— ™on SP ™—rt—sF g—d—™—rt— se des™ri˜e ™on dos —tri˜utos @p—lo y v—lorAD por lo que en tot—l h—˜rá IH—tri˜utosF v— ™l—se des™ri€°t0

×