• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Minería de secuencias de datos
 

Minería de secuencias de datos

on

  • 352 views

Documentación de mi proyecto fin de máster.

Documentación de mi proyecto fin de máster.

Statistics

Views

Total Views
352
Views on SlideShare
352
Embed Views
0

Actions

Likes
0
Downloads
3
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

CC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Minería de secuencias de datos Minería de secuencias de datos Document Transcript

    • Minería de secuencias de datos Autor: Manuel Martín Salvador 9 de diciembre de 2011 „utoresX vuis wF de g—mpos y ƒilvi— e™id I
    • P
    • Índice1. Introducción 52. Los datos 5 PFIF ƒe™uen™i—s de d—tos F F F F F F F F F F F F F F F F F F F F F F F F F F S PFPF g—m˜ios de ™on™epto F F F F F F F F F F F F F F F F F F F F F F F F F T3. Algoritmos de clasicación de secuencias de datos 8 QFIF eprendiz—je online F F F F F F F F F F F F F F F F F F F F F F F F F F V QFPF we™—nismos de olvido F F F F F F F F F F F F F F F F F F F F F F F F W QFQF „—xonomí— de métodos de —prendiz—je F F F F F F F F F F F F F F F IH QFRF iv—lu—™ión del pro™eso de —prendiz—je F F F F F F F F F F F F F F F II4. Aplicaciones 145. Revisión de métodos de aprendizaje con disparadores 15 SFIF elgoritmos ™on dete™™ión de ™—m˜io F F F F F F F F F F F F F F F F IS SFIFIF hhw @hrift hete™tion wethodA F F F F F F F F F F F F F F F IS SFIFPF ihhw @i—rly hrift hete™tion wethodA F F F F F F F F F F IV SFIFQF wétodo de uifer F F F F F F F F F F F F F F F F F F F F F F F IV SFIFRF eh‡sx @ed—ptive ‡indowingA F F F F F F F F F F F F F F F IW SFPF elgoritmos ™on vent—n— de entren—miento F F F F F F F F F F F F F PP SFPFIF wétodo de ulinken˜erg F F F F F F F F F F F F F F F F F F F PQ SFPFPF psƒr @unipied snst—n™e ƒele™tion —lgoritrmA F F F F F F F PR6. Aportaciones 26 TFIF woreirrorswoving F F F F F F F F F F F F F F F F F F F F F F F F F F PT TFPF w—xwoving F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PV TFQF wovingever—ge F F F F F F F F F F F F F F F F F F F F F F F F F F F F PW7. MOA (Massive Online Analysis) 34 UFIF il entorno F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QR UFPF qener—™ión de se™uen™i—s de d—tos F F F F F F F F F F F F F F F F F QS UFQF wétodos de ™l—si(™—™ión F F F F F F F F F F F F F F F F F F F F F F F QW UFRF wétodos de ev—lu—™ión F F F F F F F F F F F F F F F F F F F F F F F F QW UFRFIF roldout F F F F F F F F F F F F F F F F F F F F F F F F F F F F QW UFRFPF snterle—ved „estE„henE„r—in @o €requenti—lA F F F F F F F F RH Q
    • 8. Experimentación 41 VFIF gonjuntos de d—tos re—les F F F F F F F F F F F F F F F F F F F F F F RI VFPF f—terí— de prue˜—s F F F F F F F F F F F F F F F F F F F F F F F F F F RP VFQF ‚esult—dos F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RQ9. Conclusión y trabajo futuro 5710.Bibliografía 59 R
    • 1. Introducciónin este tr—˜—jo v—mos — tr—t—r el pro˜lem— del —prendiz—je —utomáti™o so˜rese™uen™i—s de d—tosF in un entorno ™lási™o se dispone de un— ˜—se de d—tos™omplet— y estáti™—D y el o˜jetivo es —prender un modelo que represente lo más(elmente posi˜le di™hos d—tosF in ™—m˜ioD ™u—ndo en lug—r de disponer de todoslos d—tos —l tiempoD estos v—n lleg—ndo de t—nto en t—ntoD en un— se™uen™i— ded—tosD — priori de longitud in(nit—D tenemos que —˜ord—r el pro˜lem— del —prenEdiz—je de diferente m—ner—F il pro˜lem— diverge —ún más ™u—ndo l— distri˜u™iónde los d—tos que se v— re™i˜iendo v—rí— — lo l—rgo del tiempo y por t—nto se h—™ene™es—rio —just—r el modelo dur—nte todo el pro™esoF€or elloD en primer lug—r será ne™es—rio ™on™ret—r este ™on™epto de d—tos que™onstituye l— entr—d— — un nuevo sistem— de —prendiz—je que se des™ri˜e en l—ƒe™™ión PF e ™ontinu—™iónD se est—˜le™en los requerimientos de ™u—lquier —lgoEritmo de ™l—si(™—™ión so˜re se™uen™i—s de d—tos y l— estru™tur— gener—l de ™ómose —˜ord— este pro˜lem— en l— liter—tur— @ƒe™™ión QAF v— minerí— de se™uen™i—sde d—tos tiene un gr—n ™—mpo de —pli™—™ión ™omo se muestr— en l— ƒe™™ión RFentes de expli™—r nuestr—s propuest—s en l— ƒe™™ión TD se h—™e un— revisión delos tr—˜—jos más dest—™—dos en l— dete™™ión de ™—m˜ios de ™on™epto @ƒe™™iónSAF €—r— l— p—rte experiment—l h— sido ne™es—rio est—˜le™er un m—r™o de tr—˜—joque puede ser referen™i— p—r— futur—s experiment—™iones y se h— utiliz—do p—r—re—liz—r el estudio ™omp—r—tivo de los diferentes métodos sele™™ion—dos @ƒe™™iónVAF „odo ello h— sido des—rroll—do dentro un entorno softw—re que tr—˜—j— so˜re™l—si(™—™ión ™on se™uen™i—s de d—tosD que se expli™—rá en l— ƒe™™ión UF pin—lEmenteD de l— p—rte experiment—l se extr—en ™on™lusiones y se est—˜le™en nuevoso˜jetivos p—r— tr—˜—jos futuros en l— ƒe™™ión WF2. Los datos2.1. Secuencias de datosh—do un pro˜lem— de un dominio determin—doD un— se™uen™i— de d—tos @datastream A está ™ompuest— por un— serie de inst—n™i—s que lleg—n —l sistem— — dis™reE™iónD de un— en un— o en p—quetes de t—m—ño regul—r o v—ri—˜leF v—s inst—n™i—sque ™omponen l—s se™uen™i—s de d—tos en un pro˜lem— orient—do — l— ™l—si(™—E™iónD suelen est—r form—d—s por un ™onjunto de v—ri—˜les o˜serv—d—s x1 , ..., xn yun— ™l—se y F in prin™ipio est—s se™uen™i—s tienen un t—m—ño ilimit—do y —demáses posi˜le que el pro˜lem— presente ™—m˜ios en l— distri˜u™ión su˜y—™ente — lol—rgo del tiempo que se re)ejen en l— se™uen™i—D por lo que no se pueden us—rlos enfoques tr—di™ion—les de minerí— de d—tosF il entorno de tr—˜—jo ne™es—riop—r— oper—r ™on se™uen™i—s de d—tos de˜e ™umplir ™iert—s restri™™iones ‘frzIH“X IF xo se pueden —lm—™en—r todos los d—tos en memori—F ƒolo se permite registr—r un— pequeñ— ™—ntid—d de inst—n™i—sD mientr—s que el resto se v—n elimin—ndo un— vez pro™es—d—sF PF v— velo™id—d ™on l— que se re™i˜en los d—tos impli™— que el pro™es—miento de˜e h—™erse en tiempo re—lF S
    • QF v— distri˜u™ión de los d—tos puede v—ri—r en el tiempoD de m—ner— que los d—tos —ntiguos se vuelven irrelev—ntes p—r— l— et—p— —™tu—lFv— restri™™ión I impli™— limit—r el t—m—ño de l— memori— utiliz—d— dur—nte el—prendiz—jeD mientr—s que l— P limit— el tiempo de pro™es—miento de ™—d— muesEtr—F in —quellos entornos en los que l—s se™uen™i—s de d—tos se—n evolutiv—s@presenten ™—m˜iosAD h—y que tener en ™uent— l— restri™™ión Q en el pro™eso de—prendiz—je e in™orpor—r métodos de dete™™ión de ™—m˜ios que permit—n evoluE™ion—r el modeloF2.2. Cambios de conceptoh—do un pro˜lem— de un dominio determin—doD se denomin— ™—m˜io de ™on™epto@concept drift A — l— situ—™ión que se produ™e ™u—ndo los d—tos de un— se™uen™i—p—s—n de tener un— distri˜u™ión de pro˜—˜ilid—d S1 — otr— distri˜u™ión S2 Ddonde S1 y S2 son de orígenes diferentes @ver pigur— IAF iste tipo de se™uen™i—sde d—tos se suelen denomin—r evolutiv—s o dinámi™—sD frente — l—s estáti™—sD queno present—n ™—m˜ios de ™on™eptoFpigur— IX ‚epresent—™ión visu—l de un ™—m˜io de ™on™epto gr—du—l — lo l—rgo deltiempo ‘liIH—“v— n—tur—lez— del ™—m˜io de ™on™epto es imprede™i˜leD por lo que no se tr—t— de™—m˜ios ™on periodi™id—d ™ono™id—D si no que l— suposi™ión prin™ip—l ™u—ndo se—˜ord— este pro˜lem— es l— in™ertidum˜re so˜re el futuroF il ™—m˜io de ™on™eptose puede d—r por tres ™—us—s ‘ureWW“X IF g—m˜io en l—s pro˜—˜ilid—des — priori de l—s ™l—ses P (c1 ), . . . , P (ck ) PF g—m˜io en l—s distri˜u™iones de pro˜—˜ilid—d ™ondi™ion—d—s P (X|ci )D i = 1, . . . , k T
    • QF g—m˜io en l—s pro˜—˜ilid—des — posteriori P (ci |X)D i = 1, . . . , kgomo ejemplos de ™—m˜io de ™on™epto se pueden ™onsider—r los ™orreos ˜—sur—@spam AD que intent—n v—ri—r su ™ontenido p—r— s—lt—rse los (ltros de ™orreoD o l—evolu™ión de l— s—lud de un p—™iente —l in™luir un nuevo medi™—mentoFƒe pueden en™ontr—r en l— liter—tur— ‘frzIH“ h—st— seis tipos de ™—m˜ios so˜reun— v—ri—˜le — lo l—rgo del tiempoD t—l y ™omo se puede o˜serv—r en l— pigur— PFv— primer— grá(™— @Sudden A muestr— un ™—m˜io —˜ruptoD en el que ™—m˜i— elv—lor de l— ™l—se de form— inst—ntáne—F v—s siguientes grá(™—s muestr—n ™—m˜iosque se produ™en más lent—menteF v— diferen™i— entre in™rement—l y gr—du—l r—Edi™— en si ™—m˜i—n los v—lores de l—s v—ri—˜les o ˜ien l— distri˜u™ión de l— ™l—seD—unque h—˜itu—lmente se us—n ™omo sinónimosF in l— (l— de —˜—jo tenemos l—primer— grá(™— @Recurring A ™on un ™—m˜io tempor—l y que vuelve — su est—donorm—l tr—s un interv—lo de tiempoF v— siguiente grá(™— @Blip A represent— unevento ex™ep™ion—l y no de˜e tr—t—rse ™omo un ™—m˜io de ™on™eptoF v— últim—grá(™— @Noise A muestr— ™—m˜ios —le—toriosD — los que ll—m—remos ruido y t—mEpo™o de˜en ™onsider—rse ™omo un ™—m˜io en l— distri˜u™iónF in l— liter—tur— lomás fre™uente es en™ontr—rse ™on tr—˜—jos que ™onsider—n t—n solo los ™—m˜ios—˜ruptosD gr—du—les o in™rement—lesFF pigur— PX „ipos de ™—m˜ios U
    • 3. Algoritmos de clasicación de secuencias de datosvos ™l—si(™—dores de se™uen™i—s de d—tos de˜en ser ™—p—™es de —prender de losd—tos de form— in™rement—l en vez de por lotes @batch A y re—™™ion—r —nte los™—m˜ios de ™on™eptoF em˜os requisitos se ™onsiguen —pli™—ndo aprendizajeonline y mecanismos para olvidar los d—tos que y— no son relev—ntesF3.1. Aprendizaje onlineil —prendiz—je onlineD t—m˜ién ll—m—do —prendiz—je in™rement—lD se ™entr— en elpro™es—miento de inst—n™i—s de form— se™uen™i—l tr—t—ndo de que el ™l—si(™—dorentren—do se— t—n pre™iso ™omo si se hu˜iese entren—do ™on todo el ™onjuntode d—tos — l— vez @en batch AF …n ˜uen —lgoritmo de —prendiz—je online de˜erí—tener est—s ™u—lid—des ‘frzIH“X IF sn™rement—lX el —lgoritmo de˜e ser ™—p—z de leer y pro™es—r d—tos — lo l—rgo del tiempo sin tener que disponer de todos los d—tos desde el prin™ipioF PF „r—t—r ™—d— inst—n™i— en un— p—s—d—X el —lgoritmo solo puede re—liz—r un— le™tur— so˜re los d—tos y luego li˜er—r el esp—™ioF QF vimit—™ión de tiempo y memori—X ™—d— vez que se pro™ese un ejemplo de˜e h—™erse en el menor tiempo posi˜le y l— ™—ntid—d de memori— ne™es—ri— p—r— el pro™es—miento de˜e ser ™onst—nteF RF il —lgoritmo de˜e propor™ion—r un modelo ™ompleto en ™u—lquier inst—nte de tiempoF in un ™—so ide—lD el ™l—si(™—dor entren—do in™rement—lmente h—st— un inst—nte t de˜e ser equiv—lente —l mismo entren—do de form— tr—di™ion—l ™on tod—s l—s inst—n™i—s disponi˜les h—st— el inst—nte tF€—r— s—tisf—™er est—s restri™™iones de po™os d—tos — l— vez y disponi˜ilid—d delmodelo en ™u—lquier inst—nteD se suelen —pli™—r té™ni™—s de resumen — los d—Etos t—les ™omo sliding windows @vent—n—s desliz—ntesAD sampling @muestreoA osketching @es˜ozoAD —lgun—s de l—s ™u—les se ™onsider—rán en este tr—˜—joFv—s prin™ip—les diferen™i—s entre el pro™eso de ™l—si(™—™ión ™on todos los d—tosen un modo tr—di™ion—l y un pro™eso de ™l—si(™—™ión p—r— se™uen™i—s de d—tosse pueden ver — modo de resumen en el gu—dro IF Tradicional Secuencial xúmero de p—s—d—s wúltiple …n— „iempo de pro™es—miento slimit—do ‚estringido …so de memori— slimit—do ‚estringido „ipo de result—do €re™iso eproxim—do gon™epto istáti™o ivolutivogu—dro IX gomp—r—tiv— de minerí— de d—tos tr—di™ion—l frente — l— minerí— dese™uen™i—s de d—tos ‘qqHU“ V
    • in gener—lD el pro™eso de —prendiz—je puede verse ™omo en l— pigur— QF pigur— QX €ro™eso de —prendiz—je in™rement—l en el inst—nte t ‘liIH˜“F3.2. Mecanismos de olvidosn™orpor—r me™—nismos de olvido es un —spe™to que tiene espe™i—l interés ense™uen™i—s evolutiv—sD y— que existe un modelo —ntes y otro distinto después dedete™t—rse el ™—m˜ioF €or t—ntoD un ™l—si(™—dor de˜e ser ™—p—z de re—™™ion—r—nte un ™—m˜io de ™on™epto y olvid—r —quello que y— no se— relev—nteD ™omolos d—tos que son de ™on™eptos —ntiguosF il prin™ip—l pro˜lem— es ™ómo s—˜erqué de˜e olvid—rF v— solu™ión más sen™ill— es ir olvid—ndo p—ul—tin—mente losd—tos —ntiguos y us—r un— ventana ™on los ejemplos más re™ientes p—r— entren—rel ™l—si(™—dorF isto permite —demás m—ntener redu™ido el número de inst—n™i—sne™es—ri—s p—r— el entren—mientoF iste primer enfoque de vent—n—s de t—m—ño™onst—nte en los d—tos más re™ientesD present— un ™ompromiso entre est—˜ilid—dy )exi˜ilid—dD y— que si l— vent—n— es dem—si—do pequeñ— re—™™ion—rá rápido —los ™—m˜iosD pero — l— vez ˜—j—rá l— pre™isión porque está entren—ndo ™on po™osd—tosF in ™—m˜ioD si l— vent—n— es muy gr—ndeD el ™l—si(™—dor será más est—˜lepero t—rd—rá más en dete™t—r los ™—m˜ios ‘uunHV“Fytro enfoque ™onsiste en —just—r el t—m—ño de l— vent—n— de —prendiz—je ™u—ndose dete™te un ™—m˜io de ™on™epto p—r— tr—t—r de en™ontr—r un equili˜rio entrepre™isión y )exi˜ilid—dF istos métodos fun™ion—n mejor ™u—ndo h—y ™—m˜ios˜rus™osF…n enfoque —ltern—tivo ™onsiste en ponder—r l—s muestr—s ™on un peso que irádisminuyendo — lo l—rgo del tiempo p—r— v—ri—r l— in)uen™i— de l—s mism—sdur—nte el pro™esoF iste enfoque se denomin— fading factor @f—™tor de olvidoAF W
    • €—r— nuestros métodos v—mos — us—r vent—n—s de t—m—ño (jo y— que nos f—™ilit—nl— interpret—˜ilid—d de los result—dosF3.3. Taxonomía de métodos de aprendizajee ™ontinu—™ión present—mos un— posi˜le ™l—si(™—™ión de métodos de —prendiz—jede se™uen™i—s de d—tos evolutiv—sD propuest— en ‘liIH˜“F IF Algoritmos de aprendizaje con disparadores (Learner with triggers)X dependen de un— señ—l que indi™— que es ne™es—rio —™tu—liz—r el modeloF a A Detección de cambio (Change detectors) X son los más fre™uentes en l— ˜i˜liogr—fí—F istos métodos fun™ion—n mejor en entornos ™on ™—mE ˜ios ˜rus™os en los que se suele re™onstruir el modelo por ™ompleto en vez de —™tu—liz—rloF vo más ™omún es monitoriz—r los d—tosD los p—rámetros del ™l—si(™—dor o l— s—lid— del —lgoritmo de —prendiz—jeF ‘ƒƒHVD qwg‚HRD fqdgep+ HT“ in el supuesto de que l—s se™uen™i—s de d—tos se—n estáti™—s @sin ™—m˜iosAD l—s té™ni™—s de dete™™ión de ™—m˜ios t—m˜ién pueden ser utiliz—d—s p—r— dete™t—r diferen™i—s signi(™—tiv—s respe™to —l modelo que se está entren—ndo y se tr—t—rí— de ™omplet—r el —nterior p—r— lleg—r — un modelo mejor —just—doF b A Ventana de entrenamiento (Training windows) X estos métodos se ˜—s—n en heurísti™—s p—r— —just—r el t—m—ño de l— vent—n— de entreE n—mientoF ‘‡uWTD rƒhHID fwHV“ c A Muestreo adaptativo (Adaptive sampling) X ˜—sándose en l— rel—E ™ión entre l— inst—n™i— de prue˜— y unos prototipos prede(nidos o ˜ien el históri™o de inst—n™i—s entren—d—sD se sele™™ion— un ™onjunto de entren—miento —de™u—doF ‘‰‡HVD €ruHV“ PF Algoritmos de aprendizaje evolutivos (Evolving learners)X estos méE todos —™tu—liz—n el modelo de form— gr—du—l y no requieren de un dete™tor de ™—m˜ios de ™on™eptoF a A Conjuntos adaptativos (Adaptive ensembles) X son los más popul—E resD y ˜ási™—mente ™om˜in—n l— s—lid— de distintos ™l—si(™—dores del ™onjunto p—r— d—r un— de™isión (n—lF ‘uwHUD ƒt—HQD xuHI“ b A Ponderación de instancias (Instance weighting) X estos —lgoritmos no ™om˜in—n regl—s de de™isiónD sino que l— —d—pt—˜ilid—d se ™onsigue modi(™—ndo el ™onjunto de entren—mientoF …tiliz— ide—s de boostingD d—ndo más import—n™i— — —quell—s inst—n™i—s m—l ™l—si(™—d—sF ‘uoyHHD ƒHVD gHR“ c A Espacio de características (Feature space) X estos métodosD próE ximos — l— sele™™ión de ™—r—™terísti™—sD ™onsiguen l— —d—pt—˜ilid—d sele™™ion—ndo de form— dinámi™— l—s ™—r—™terísti™—s emple—d—s p—r— l— ™l—si(™—™iónF ‘porHTD ‡qgHTD eerHV“ d A Dependientes del modelo (Base model specic) X estos métodos se —d—pt—n modi(™—ndo los p—rámetros del modelo que estén us—ndoF ‘xnpwHUD ureWWD ƒvƒWW“ IH
    • 3.4. Evaluación del proceso de aprendizajeƒegún v—rios —utores ‘qƒ—‚HW“D h—y tres —spe™tos import—ntes — tener en ™uent—— l— hor— de ev—lu—r —lgoritmos de —prendiz—je de se™uen™i—s de d—tosX Espacio o™up—do en memori— — lo l—rgo del pro™eso de —prendiz—jeF Tiempo de pro™es—miento de un— muestr— @esto puede limit—r l— fre™uenE ™i— de re™ep™ión de los d—tosAF €oder de generalizaciónX efe™tivid—d del modelo —l represent—r el ™onE ™epto su˜y—™ente de los d—tosFxosotros nos v—mos — o™up—r úni™—mente de ev—lu—r y ™omp—r—r —lgoritmospor el último ™riterioD según su efe™tivid—d dur—nte l— ™l—si(™—™iónF ƒin em˜—rgo—unque no tr—t—mos de minimiz—r ™onsumo de memori—D ni tiempo de pro™eEs—mientoD sí se respet—n los requerimientos de —prendiz—je onlineD de un— sol—p—s—d— so˜re los d—tos y que l—s muestr—s no se —™umul—n tod—s en memori—Fxuestro propósito por t—nto esD ev—lu—r —lgoritmos propios y —jenos por l— efe™Etivid—d del modelo —prendidoD p—r— poder est—˜le™er ™omp—r—™iones y r—nkingsde los mismos y extr—er ™on™lusiones so˜re los modelos —prendidosFvos métodos de ev—lu—™ión de —lgoritmos de —prendiz—je en ˜—t™hD —prendenso˜re un ™onjunto de entren—miento @training A y utiliz—˜—n un ™onjunto de testindependiente so˜re los que estim—r l— pro˜—˜ilid—d de error holdoutF in el ™—sode no disponerse de —m˜osD se estim— l— pro˜—˜ilid—d de error del modelo o˜teEnido — p—rtir del ™onjunto de tr—ining medi—nte té™ni™—s de v—lid—™ión ™ruz—d—y sus v—ri—ntes @leaving-one-out A o bootstrapF ƒin em˜—rgoD en el ™ontexto de seE™uen™i—s donde los d—tos son poten™i—lmente in(nitosD l— v—lid—™ión ™ruz—d— y l—sestr—tegi—s de muestreo no son —pli™—˜lesF edemásD el he™ho de que los ™on™eptosde l—s se™uen™i—s de d—tos pued—n ™—m˜i—r en el tiempo tiene impli™—™iones enl—s té™ni™—s de ev—lu—™iónFƒe ne™esit—n por t—nto nuev—s estr—tegi—s de ev—lu—™iónF il prin™ip—l pro˜lem—™onsiste en monitoriz—r l— evolu™ión del pro™eso de —prendiz—jeF xos en™ontr—mos™on dos —ltern—tiv—sX IF HoldoutX ™omo en su homólogo en ˜—t™hD se tr—t— de un ™onjunto de test que se —pli™— —l modeloD pero en este ™—so extr—ído — interv—los regul—resD p—r— estim—r l—s t—s—s de errorD lo que es —de™u—do p—r— se™uen™i—s dináE mi™—sF r—y que (j—r fre™uen™i— y —n™hur— del ™onjunto de test so˜re l— se™uen™i—F ƒe tr—t— de un estim—dor no sesg—doD pues —l moverse — lo l—rgo de l— se™uen™i— no d— lug—r — so˜re—justeF PF PrequentialX t—m˜ién ™ono™ido ™omo test-then-train ‘fuHW—“F il término prequenti—l proviene de €redi™tive ƒequenti—l ‘h—wVR“F il error del modelo n se estim— so˜re l— se™uen™i— de d—tosX S = i=1 L(yi , yi ) donde L es ˆ l— fun™ión de pérdid— tr—s h—˜er predi™ho l— ™l—se de form— ™orre™t— o in™orre™t—F ƒe ™ono™e que este estim—dor es pesimist—D es de™irD en l—s mism—s ™ondi™ionesD l— estr—tegi— holdout v— — d—r mejores v—loresF il error estim—do ™on prequenti—l v— — est—r in)uen™i—do por los errores que se h—y—n podido ™ometer —l prin™ipio de l— se™uen™i— de d—tosF €or elloD se h—n us—do me™—nismos de olvido t—les ™omoX II
    • a A Ventanas temporales (time window): en lug—r de m—ntener un ™ál™ulo de l—s t—s—s de éxito —™umul—do desde el ini™io de l— se™uen™i—D se re—liz— est— estim—™ión p—r™i—l so˜re un— vent—n— de t—m—ño k D (jo @— (j—r — prioriAD que se v— despl—z—ndoF iste me™—nismo ™onverge más rápid—mente —l método holdoutF b A Factores de olvido (fading factor): se introdu™e un f—™tor de olvido α p—r— que l— in)uen™i— de ™—d— error en l— estim—™ión v—y— de™—yendo ™onforme —ument— l— dist—n™i—F he est— m—ner—D podemos ™—l™ul—r el L +α·S error prequenti—l ™omo Ei = Bi = nii+α·Bi−1 donde S1 = L1 y ni S i i−1 es el número de ejemplos us—dos p—r— ™—l™ul—r Li F in el ™—so de que α = 1 impli™— que no h—y olvidoF iste me™—nismo tiene l— vent—j— de que requiere po™— memori—D y— que solo requiere —lm—™en—r el v—lor —nterior y el —™tu—lD frente —l uso de vent—n—s donde se tienen que —lm—™en—r k v—lores de pérdid—F em˜os me™—nismos están muy rel—™ion—dosD y por ende sus p—rámetrosF esíD p—r— v—lores ˜—jos de k y de αD l—s estim—™iones he™h—s son más — ™orto pl—zo y ™omo ™onse™uen™i— l—s os™il—™iones de l—s estim—™iones son m—yoresF €or otro l—doD p—r— v—lores —ltos de k @m—yor vent—n—A y de α @™er™—nos — IAD v—n — intervenir más d—tos en l—s estim—™iones de los erroresFin nuestr— experiment—™ión hemos us—do l— estim—™ión prequenti—l y— que es l—más extendid—D de˜ido — que no se ex™luye ningún d—to en el entren—mientoD yse ev—lú— puntu—lmente ™on ™—d— muestr— de l— se™uen™i—D por lo que se o˜tienede un estim—dor no sesg—doFe l— hor— de ™omp—r—r el rendimiento que present—n dos —lgoritmos @e y fAfrente — l— mism— se™uen™i— de d—tos podemos us—r el est—dísti™o Qi (A, B) = 1−S Alog 1−Si D donde Si y Si son los v—lores de l— fun™ión de pérdid— —™umuE B A B il—dos de ™—d— —lgoritmoF il v—lor de Qi es útil p—r— ™ompro˜—r l—s diferen™i—sentre —m˜os —lgoritmosD de m—ner— que si el —lgoritmo e present— un mejor™omport—miento que el fD v—mos — o˜tener v—lores positivosD mientr—s que en™—so ™ontr—rio o˜tendremos v—lores neg—tivosD y si son igu—les será ™eroFil pro˜lem— de est—s medid—s es que evolu™ion—n — lo l—rgo del tiempo y esposi˜le que visu—lmente no pod—mos re™ono™er qué método es mejor que otroy— que uno se puede ™omport—r mejor en un— p—rte de l— se™uen™i—D mientr—sque otro lo h—g— en otr— o™—siónF €or elloD p—r— d—r un v—lor (n—l en nuestr—experiment—™ión hemos us—do ™omo medid— el áre— ˜—jo l— ™urv— @e…gA delos v—lores o˜tenidos ™on l— estr—tegi— prequenti—l desde el ini™io de l— se™uen™i—h—st— que (n—liz—F he est— m—ner—D si tenemos dos —lgoritmos @e y fAD de(nimos NAU CA = i=0 ni · (1 − Ei ) donde ni es el número de ejemplos us—dos p—r— A™—l™ul—r Ei y N el número de v—lores de Ei disponi˜les @ídem p—r— fAF hiremos A Aque e es mejor que f si AU CA > AU CB Fytro —spe™to interes—nte — ev—lu—r en el ™—so de que tr—˜—jemos ™on se™uen™i—ssintéti™—s ™on ™—m˜ios de ™on™eptos ™ono™idos es el número de drifts ™orre™t—Emente dete™t—dosD los f—lsos positivosD los f—lsos neg—tivosD —sí ™omo l— dist—n™i—tr—ns™urrid— desde que se produ™e un ™—m˜io h—st— que se dete™t—F il ™ál™ulo deest— dist—n™i— v— — ser diferente dependiendo del tipo de ™—m˜io que presente l— IP
    • se™uen™i—D y— que h—y que tener en ™uent— que los ™—m˜ios gr—du—les se produ™en— lo l—rgo de un— vent—n— donde se entremez™l—n muestr—s de —m˜os ™on™eptosFv— dist—n™i— se ™—l™ul— entre el punto de drift re—l y el drift dete™t—do más™er™—no — élF in ™—so de h—˜er más de un drift dete™t—doD se ™—l™ul— l— dist—n™i—del primero y el resto se ™onsider—n f—lsos positivosF ƒi el ™—m˜io es gr—du—lDel punto de ™—m˜io re—l ™onsider—mos que ™orresponde ™on l— ™ot— inferior delinterv—lo de ™—m˜ioF ƒe puede ver un ejemplo en l— pigur— RF Cambios Abruptos Cambios Graduales0 10 20 30 40 50 0 10 20 30 40 50 Instancias Instanciaspigur— RX in l— grá(™— de l— izquierd— s—˜emos que h—y P ™—m˜ios —˜ruptos enPH y RH @líne—s roj—s ™ontínu—sAF il método —pli™—do h— dete™t—do Q drifts enPSD QH y RP @líne—s —zules dis™ontínu—sAF hiremos que h— dete™t—do dos drifts™orre™t—mente @en los puntos PS y RPA y un f—lso positivo @QHAF v— dist—n™i— —lprimer drift será de 25 − 20 = 5 y —l segundo de 42 − 40 = 2F €or otro l—doD enl— grá(™— de l— dere™h— h—y P ™—m˜ios gr—du—les que tienen lug—r en ‘ISD PS“ y‘QSD RS“F in este ™—so diremos que h— dete™t—do dos drifts ™orre™t—mente @IS yRPA y dos f—lsos positivos @PI y QHAF v— dist—n™i— —l primer drift será 15 − 15 = 0y —l segundo 42 − 35 = 7F IQ
    • 4. Aplicacionese ™ontinu—™ión present—mos distint—s áre—s de —pli™—™ión p—r— el —prendiz—jeo l— ™l—si(™—™ión de se™uen™i—s de d—tos ™on ™—m˜ios de ™on™eptoF „odos ellostienen en ™omún l— —)uen™i— ™onst—nte de nuevos d—tos y un— posi˜le evolu™iónde los ™on™eptos en el tiempoF Monitorización y controlX en l—s —pli™—™iones de monitoriz—™ión y ™onE trol se tr—˜—j—n ™on ™—ntid—des de d—tos muy gr—ndes que ne™esit—n pro™eE s—rse en tiempo re—lF ƒe pueden diferen™i—r dos tipos de t—re—sX preven™ión y prote™™ión frente — —t—quesD o monitoriz—™ión ™on propósitos de gestiónF ˆ ƒegurid—d informáti™—X dete™™ión de intrusosF ‘vfWW“ ˆ ƒe™tor (n—n™ieroX preven™ión de fr—udesF ‘honHR“ ˆ „r—nsporteX gestión del trá(™oF ‘wƒthHW“ ˆ €osi™ion—mientoX r—streo inter—™tivoF ‘v€puHU“ ˆ sndustri—X monitoriz—™ión de pro™esos de produ™™iónF ‘†yq+ HV“ Información y asistencia personalizadaX est—s —pli™—™iones org—niz—n o person—liz—n un )ujo de inform—™iónF ˆ esisten™i— person—lX (ltr—do de inform—™iónF ‘qƒgwHU“ ˆ €er(les de ™lientesX segment—™ión de ™lientesF ‘vrgHV“ ˆ snform—™iónX org—niz—™ión de do™umentosF ‘fvHT“ Toma de decisionesX est—s —pli™—™iones no ne™esit—n que l—s de™isiones se—n en tiempo re—lD pero sí que su respuest— se— pre™is— y— que los ™ostes de ™ometer un error pueden ser muy —ltosF ˆ ƒe™tor (n—n™ieroX predi™™ión de morosid—dF ‘‚‚HU“ ˆ fiomedi™in—X efe™tos de medi™—mentos en p—™ientesF ‘„€g€HV“ Inteligencia articial y robóticaX el ™—m˜io de ™on™epto en est—s —pliE ™—™iones se suele de˜er — ™—m˜ios en el entornoF ˆ ƒistem—s móviles y ro˜óti™osX diseño de ro˜ots ™—p—™es de —d—pt—rse —l entornoF ‘€wqHW“ ˆ ƒistem—s inteligentesX solu™iones p—r— domóti™—F ‘‚gHW“ ˆ ‚e—lid—d virtu—lX diseño de videojuegos y simul—doresF ‘gww+ HS“ IR
    • 5. Revisión de métodos de aprendizaje con dis- paradores…n— vez expuesto el ™ontexto en el que se des—rroll— el tr—˜—joD v—mos — re—liz—run estudio det—ll—do so˜re el pro˜lem— ™on™reto del —prendiz—je ™on disp—r—EdoresD en espe™i—l los dos primeros —p—rt—dos que nom˜r—mos en l— t—xonomí—Xutiliz—ndo detección de cambio y ventanas de entrenamientoFƒ™hlimmer y qr—nger present—ron en IWVT el pro˜lem— del —prendiz—je in™remenEt—l so˜re d—tos ™on ruido y pu˜li™—ron el —lgoritmo ƒ„eqqi‚ ‘ƒqVT“F hesdeque introdujeron el término ™on™ept driftD h— h—˜ido tres pi™os de interés enl— investig—™iónX en IWWV ™on un— edi™ión espe™i—l de l— revist— Machine Lear-ning ‘h‡uWV“D en PHHR ™on un espe™i—l en l— revist— Intelligent Data Analysis‘ƒuHU“ y el ter™ero ™omenzó en PHHU ™omo result—do de l— ™ontinu— produ™™iónde se™uen™i—s de d—tos en l— industri— y que ™omo se h— det—ll—do —nteriormenteprosigue —ún en l— —™tu—lid—dF5.1. Algoritmos con detección de cambioin el ™—so de se™uen™i—s dinámi™—s de d—tosD el propósito de estos —lgoritmos esdete™t—r un ™—m˜io de ™on™epto en los d—tos que v—n lleg—ndo y —vis—r —l —lgoritEmo de —prendiz—je que indu™e el modelo de que de˜e —™tu—liz—r o re™onstruir sumodelo p—r— —just—rse mejor — los nuevos d—tosF €or otro l—do si se tr—˜—j—n ™onse™uen™i—s estáti™—s de d—tosD el o˜jetivo de estos —lgoritmos es —™tiv—r el pro™esode —prendiz—je p—r— —just—rse mejor —l —porte de d—tos —di™ion—lesF vo h—˜itu—les que los —lgoritmos de dete™™ión de ™—m˜ios —™túen — priori so˜re los d—tosDesto esD (ltren l— se™uen™i— de d—tos y —™tiven los pro™esos de —prendiz—je @muE™hos más pes—dos ™omput—™ion—lmenteA ™on l— lleg—d— de nuevos ™on™eptosF …n—lgoritmo de dete™™ión de ™—m˜ios puede —fe™t—r —l rendimiento del ™l—si(™—dorFv— form— de pro™eder de un dete™tor de ™—m˜ios es re—liz—r un test est—dístiE™o que ™omprue˜e si el error del ™l—si(™—dor o l— distribución de l— ™l—se sem—ntienen ™onst—ntes en el tiempoFvos primeros tests propuestos p—r— tr—t—r ™on se™uen™i—s numéri™—s fueron g…Eƒ…w @Cumulated Sum A ‘€—gSR“ y qwe @Geometric Moving Average A ‘‚o˜SW“Fil primero de ellos l—nz— un— señ—l de —l—rm— si l— medi— de los d—tos de enEtr—d— es signi(™—tiv—mente distint— de ™eroD mientr—s que qwe ™omprue˜— sil— medi— ponder—d— de los ejemplos de un— vent—n— es m—yor que un determiEn—do um˜r—lF €—r— se™uen™i—s ™on estru™tur—s más ™omplej—s se h—n propuestotests ™omo el de Kolmogorov-SmirnovF e ™ontinu—™ión veremos —lgunos de losmétodos de dete™™ión de ™—m˜io más re™ientes que pueden —pli™—rse — ™u—lquier—lgoritmo de minerí— so˜re se™uen™i—s de d—tosF5.1.1. DDM (Drift Detection Method)q—m— et —lF ‘qwg‚HR“ present—n el método de dete™™ión de ™—m˜io @hhwAque monitoriz— l— t—s— de error us—ndo un Shewhart P-ChartD un— herr—mient— IS
    • est—dísti™— de ™ontrol de ™—lid—dD ™uyos prin™ipios se ˜—s—n en l— distri˜u™ión˜inomi—lFƒe di™e que un— v—ri—˜le X sigue un— distri˜u™ión ˜inomi—l si ™umple l—s siEguientes ™ondi™ionesX IF g—d— o˜serv—™ión es l— re—liz—™ión de un— v—ri—˜le —le—tori— de fernoulli ™on dos posi˜ilid—des @éxito o f—lloA y un p—rámetro p @pro˜—˜ilid—d de f—lloAF PF v—s diferentes o˜serv—™iones son independientes entre síF QF il número de o˜serv—™iones n es (joFhe est— m—ner— podemos o˜tener l— medi— y l— desvi—™ión típi™— de l— distri˜uE p(1−p)™ión ™omo µ = p y σ = n Fƒi n ≥ 30D l— distri˜u™ión se puede —semej—r — un— xorm—l y —pli™—r los límitesde ™ontrol del €Egh—rtX CL @genter vineAX µ UWL @…pper ‡—rning vimitAX µ + α · σD ™on 0 < α < 3 UCL @…pper gontrol vimitAX µ + 3 · σ @—proxim—d—menteD el WWFU 7 de l—s o˜serv—™iones de˜erí—n est—r en este um˜r—lAistos límitesD sirven p—r— de(nir unos niveles de ™ontrolD ™omo puede o˜serv—rseen l— pigur— SF v— líne— ™entr—l gv represent— l— medi— de l— ™u—lid—d que seesté midiendoF ƒi en —lgún momento se so˜rep—s— el límite …‡v se est—˜le™e unnivel de —viso @warning AD indi™—ndo de est— m—ner— que es posi˜le que se v—y—— produ™ir un ™—m˜io de ™on™eptoF ƒi sigue l— tenden™i— y so˜rep—s— el límite…gvD se est—˜le™e el nivel de ™—m˜io de(nitivo @drift AF v—s inst—n™i—s re™i˜id—sen el interv—lo que tr—ns™urre desde que se —™tiv— el nivel de —viso y h—st— el quese —™tiv— nivel de drift se —lm—™en—n en un— memori— — ™orto pl—zoD y se us—ránp—r— re™onstruir o —™tu—liz—r el modelo ™u—ndo se— ne™es—rioF ƒi se h— disp—r—doel nivel de —viso y el v—lor ™ontrol—do vuelve — des™enderD situándose —lrededorde l— líne— ™entr—l gv @l— medi—AD se di™e que se h— produ™ido un— f—ls— —l—rm—y se reini™i— l— memori— — ™orto pl—zoF€—r— —just—r dinámi™—mente estos v—lores ™u—ndo l— medi— no es un— ™onst—nteD™omo en un entorno prequentialD se est—˜le™en pmin y smin ™omo l— medi— y desEvi—™ión típi™— menores h—st— el momentoF g—d— vez que lleg— un nuevo ejemploDse —™tu—liz—rán estos v—lores si pi + si < pmin + smin F in est— situ—™iónD el nivelde —viso @warning A se —l™—nz—rá ™u—ndo pi + si ≥ pmin + 2 · smin D mientr—s queel nivel de ™—m˜io de(nitivo @drift A se d—rá en pi + si ≥ pmin + 3 · smin F in l—pigur— T podemos ver un ejemplo grá(™o del —juste de estos límitesF IT
    • 11.0 UCL UWL Quality characteristic 10.0 CL LWL LCL 9.0 3 6 9 12 15 Samplepigur— SX vímites de ™ontrol de Shewhart P-ChartF vos puntos de l— grá(™— estántodos en los límites de lo esper—doD s—lvo el punto II que super— el límite …‡vde —visoD pero se tr—t— de un— f—ls— —l—rm—Fpigur— TX €Egh—rt ™on —juste dinámi™oF v— ™u—lid—d que se mide —quí es l— t—s—de errorD por lo que niveles por de˜—jo de l— medi— signi(™— que el ™l—si(™—dores ™orre™to @no h—y ™—m˜ios de ™on™eptoAD de m—ner— que no es ne™es—rio tenerlímites de ™ontrol inferiores ™omo hemos visto —nteriormente en l— pigur— SF‘g—sHV“iste método se puede us—r ™on ™u—lquier ™l—si(™—dorD y los mismos —utores loin™orpor—ron —l AdPreqFr4SL @—d—pt—™ión dinámi™— de k-Dependence BayesianClassiers A ‘gqHT“F vos niveles de ™—m˜io d—n lug—r — distintos gr—dos de —jusEte del modeloX un —viso impli™— l— —™tu—liz—™ión p—r—métri™— o de estru™tur—D IU
    • mientr—s que un drift supone un ™—m˜io en el modelo ™on un —umento en l—™omplejid—d del modeloF5.1.2. EDDM (Early Drift Detection Method)v— propuest— de f—en—Eq—r™í— et —lF ‘fqdgep+ HT“ es simil—r —l método hhwDpero en vez de ™ontrol—r l— t—s— de errorD monitoriz— l— distancia entre erroresde clasicación @número de inst—n™i—s ™orre™t—mente ™l—si(™—d—s de form—™onse™utiv—AFƒe denot— pi adist—n™i— medi— entre dos errores y si adesvi—™ión típi™—Fƒe de(nen pmax y smax ™omo v—lores máximos y se —™tu—liz—n ™u—ndo pi +2·si >pmax + 2 · smax ™—d— vez que lleg—n nuevos d—tosFil método ™omienz— — fun™ion—r después de que se h—y—n produ™ido QH erroresde ™l—si(™—™iónF iste es el mínimo número de v—lores ne™es—rios p—r— estim—rl— distri˜u™ión de l—s dist—n™i—s entre errores y poder h—™er ™omp—r—™ionesF heest— form— pmax + 2 · smax represent— el WS 7 de l— distri˜u™iónF…s—ndo estos v—loresD se —just—n dos um˜r—les de ™ontrolX Aviso @warning AX (pi + 2 · si )/(pmax + 2 · smax ) < α donde α = 0,95F v—s inst—n™i—s se v—n —lm—™en—ndo p—r— ser ™onsider—d—s por el —lgoritmo de —prendiz—je en el ™—so de d—rse por de(nitivo el ™—m˜io de ™on™eptoF Cambio denitivo @drift AX (pi + 2 · si )/(pmax + 2 · smax ) < β donde β = 0,90F ƒe re—prende un nuevo modelo us—ndo l—s inst—n™i—s que se h—n ido —lm—™en—ndo dur—nte el nivel de —viso previoF „—m˜ién se reini™i—n los v—lores de pmax y smax Fƒi p—s—do el nivel de —viso se vuelve — l— norm—lid—d @esto esD l— fun™ión so˜rel— dist—n™i— entre errores regres— — niveles inferiores —l límite de —visoAD se eliEmin—n l— se™uen™i— de inst—n™i—s —lm—™en—d— h—st— el momento y se ™ontinú—eje™ut—ndo el métodoFvos v—lores de α y β se (j—n —d ho™ tr—s re—liz—r diferentes experimentosF5.1.3. Método de Kiferil método de uifer et —lF ‘ufdqHR“ no solo tr—t— de dete™t—r el ™—m˜io de™on™eptoD si no t—m˜ién de ™u—nti(™—rloD de m—ner— que se pued— des™ri˜ir l—n—tur—lez— del mismoF €—r— elloD utiliz—n un— medid— de dist—n™i— entre dosdistri˜u™iones de d—tos P1 y P2 D de l—s que —l menos se dispondrá de n puntosde ™—d— un— p—r— poder re—liz—r un— dete™™ión de ™—m˜ioFƒe present— un nuevo método @ver elgoritmo IAD que estim— l— distri˜u™ión depro˜—˜ilid—d de dos vent—n—s W1 e W2 so˜re l— se™uen™i— de d—tosD donde W1es un— vent—n— de t—m—ño m1 ≥ n (j—d— en el inst—nte c0 D mientr—s que W2 esun— vent—n— de t—m—ño m2 ≥ n que se despl—z—rá — lo l—rgo de l— se™uen™i—D™omenz—ndo en c0 + m1 D de m—ner— que no se sol—pen l—s muestr—s entre —m˜—svent—n—sF gu—ndo l— dist—n™i— entre l— distri˜u™ión de d—tos de W1 y l— de W2 IV
    • es m—yor que un ™ierto um˜r—l αD se est—˜le c0 —l inst—nte —™tu—lD se reini™i—liz—n l—s vent—n—s y se noti(™— que se h— produ™ido un ™—m˜io de ™on™epto en el inst—nte c0 F v— ele™™ión del p—rámetro α de(nirá el equili˜rio entre sensi˜ilid—d y ro˜ustez de l— dete™™iónD por lo que v—lores pequeños serán ™—p—™es de dete™t—r ™—m˜ios —˜ruptosD pero se tendrá más riesgo de dete™t—r f—lsos ™—m˜iosF v— fun™ión de dist—n™i— de˜e ser —de™u—d— p—r— ™u—nti(™—r el gr—do de ™—m˜io y de un— form— intuitiv—F in el —rtí™ulo ‘ufdqHR“ se pueden ™onsult—r l—s nuev—s propuest—s de medid—s de dist—n™i— entre dos distri˜u™iones de d—tosF Algorithm 1 wet—E—lgortimo de uifer p—r— dete™t—r ™—m˜ios de ™on™eptoF il uso de l— v—ri—˜le i permite eje™ut—r h—st— k —lgoritmos ™on diferentes p—rámeE tros de form— p—r—lel—F I f o r i = 1...k do P c0 ← 0 Q W indow1,i ← f i r s t m1,i p o i n t s from time c0 R W indow2,i ← next m2,i p o i n t s i n stre—m S end f o r T w h i l e not — t end o f stre—m do U f o r i = 1...k do V ƒ l i d e W indow2,i ˜y I p o i n t W i f distance(W indow1,i , W indow2,i ) > αi thenIH c0 ← ™ u r r e n t timeII ‚eport ™h—nge — t time c0IP g l e — r — l l windows —nd qy„y s t e p IIQ end i fIR end f o rIS end w h i l e 5.1.4. ADWIN (Adaptive Windowing) eF fifet y ‚F q—v—ldà ‘fqHU“D que t—m˜ién h—˜í—n p—rti™ip—do en el des—rrollo de ihhwD present—n el método eh‡sxD que us— un— vent—n— desliz—nte W p—r— monitoriz—r l— t—s— de error del modelo y poder dete™t—r ™—m˜iosF e diferen™i— del método de uiferD expli™—do —nteriormenteD est— vent—n— solo ™ontiene v—lores ˜in—rios @—™ierto o f—llo en l— predi™™ión de ™—d— inst—n™i—A y —demás se modi(™— su t—m—ño de form— dinámi™—F wientr—s no h—y— ningún ™—m˜io de ™on™epto en l— distri˜u™ión de los d—tosD l— vent—n— ™re™e h—st— el momento en que se dete™te un ™—m˜ioD que disminuyeF v— ide— de l— dete™™ión ™onsiste enX ™u—ndo dos su˜vent—n—s su(™ientemente gr—ndes de W tienen medi—s su(™ientemente distint—sD se puede ™on™luir que los v—lores esper—dos de ™—d— su˜vent—n— se—n diferentesF vos v—lores su(™ienE temente se pre™is—rán ™u—ndo se es™oj— el test est—dísti™o y dependerá del nivel de ™on(—nz— δ ∈ (0, 1)F il test est—dísti™o utiliz—do p—r— ™omp—r—r l—s distri˜u™iones de l—s su˜vent—n—s W0 y W1 D ™omprue˜— si l— diferen™i— de l—s medi—s de —m˜—s su˜vent—n—s es m—yor — un determin—do um˜r—l cut @ver elgoritmo PAF IW
    • Algorithm 2 elgoritmo eh‡sxI s n i t i — l i z e ‡indow WP f o r e—™h t > 0Q do W ← W ∪ xt @ i F e F D —dd xt t o t h e he—d o f ‡AR r e p e — t hrop e l e m e n t s from t h e t — i l o f WS u n t i l |ˆW0 − µW1 | < cut h o l d s µ ˆT f o r e v e r y s p l i t o f W i n t o W = W0 · W 1U output µW ˆ il v—lor de cut p—r— un— p—rti™ión W0 · W1 de W se ™—l™ul— de l— siguiente form—X ƒe—n n0 y n1 l—s longitudes de W0 y W1 respe™tiv—menteF v— longitud de W es n = n0 + n1 F ƒe—n µW0 y µW1 l—s medi—s de los v—lores en W0 y W1 respe™tiv—menteF ‰ ˆ ˆ µW0 y µW1 sus v—lores esper—dosF €—r— g—r—ntiz—r el rendimiento del método de(nimosX ˆ m= 1 1/n0 +1/n1 @medi— —rmóni™— de n0 y n1 A ˆ δ = δ n @p—r— evit—r pro˜lem—s ™on múltiples hipótesisA il um˜r—l se ™—l™urá ™omo cut = 1 2m · ln δ F 4 ƒe puede ver un ejemplo del fun™ion—miento de este método en el gu—dro PF ƒi µt se m—ntiene ™onst—nte en W D l— pro˜—˜ilid—d de que se reduz™— l— vent—n— en el inst—nte t es ™omo mu™ho de δ D ™on lo que se limitan los falsos positivosF ƒuponiendo que p—r— —lgun— p—rti™ión de W en W0 y W1 D tenemos que |µW0 − µW1 | > 2 · cut F inton™esD l— vent—n— W se redu™irá —l t—m—ño de W1 D o menorD ™on pro˜—˜ilid—d 1 − δ D por lo que se limitan así los falsos negativosF PH
    • W0 W1 µW0 ˆ µW1 ˆ |ˆW0 − µW1 | µ ˆ m cut |ˆW0 − µW1 | ≥ µ ˆ cut [1] [01010110111111] 1/1 10/14 0.2857 0.9333 0.8617 No [10] [1010110111111] 1/2 10/13 0.2692 1.7333 0.6323 No [101] [010110111111] 2/3 9/12 0.0833 2.4 0.5374 No [1010] [10110111111] 2/4 9/11 0.3181 2.9333 0.4861 No [10101] [0110111111] 3/5 8/10 0.2 3.3333 0.4560 No [101010] [110111111] 3/6 8/9 0.3888 3.6 0.4387 No [1010101] [10111111] 4/7 7/8 0.3035 3.7333 0.4308 No [10101011] [0111111] 5/8 6/7 0.2321 3.7333 0.4308 No [101010110] [111111] 5/9 6/6 0.4444 3.6 0.4387 Sí [1010101101] [11111] 6/10 5/5 0.4 3.3333 0.4560 No [10101011011] [1111] 7/11 4/4 0.3636 2.9333 0.4861 No [101010110111] [111] 8/12 3/3 0.3333 2.4 0.5374 No [1010101101111] [11] 9/13 2/2 0.3076 1.7333 0.6323 No[10101011011111] [1] 10/14 1/1 0.2857 0.9333 0.8617 No gu—dro PX ijemplo del fun™ion—miento de eh‡sxF †ent—n— —™tu—lX W = [101010110111111]F δ = 1F el h—˜erse dete™t—do un ™—m˜ioD l— vent—n— disE minuirá su t—m—ño p—r— el próximo inst—nte de tiempoF il pro˜lem— de este método es que es ™omput—™ion—lmente ™ostoso porque tiene que ™ompro˜—r tod—s los posi˜les p—res de su˜vent—n—s de W F €—r— mejor—rloD los —utores present—ron un— nuev— versión ll—m—d— eh‡sxP más e(™iente en tiempo y memori—F ADWIN2 (Adaptive Windowing 2) €—r— redu™ir el ™oste ™omput—™ion—l de eh‡sxD en vez de m—ntener un— vent—n— W en memori—D tiene un— estru™tur— de d—tos ™ompuest— por ™u˜os @buckets A que —lm—™en—n v—lores ˜in—riosF g—d— ™u˜o de˜e ™ontener un— poten™i— de P de I9sF ƒe (j— un p—rámetro M ™omo el máximo número de ™u˜os ™on el mismo t—m—ñoD p—r— ™ontrol—r —sí l— ™—ntid—d de memori—F ƒe puede ver un ejemplo en el gu—dro QF PI
    • ƒuponemos un— vent—n— de t—m—ño W = 14 ™on v—lores ˜in—rios @—™ierto y f—llode ™l—si(™—™iónA y est— serí— su estru™tur— en form— de ™u˜osX gu˜osX IHIHIHI IHI II I I gontenidoX R P P I I g—p—™id—dX U Q P I Ivleg— un nuevo elementoX gu˜osX IHIHIHI IHI II I I I gontenidoX R P P I I I g—p—™id—dX U Q P I I I„eniendo en ™uent— que M = 2D es ne™es—rio ™omprimir dos de los tres últimos™u˜osD y— que tienen el mismo ™ontenidoF gu˜osX IHIHIHI IHI II II I gontenidoX R P P P I g—p—™id—dX U Q P P Ihespués de ™omprimir dos ™u˜osD nos en™ontr—mos de nuevo ™on que tenemostres ™u˜os ™on el mismo ™ontenidoD por lo que volvemos — ™omprimirF he est—form— se est—rí—n form—ndo l—s su˜vent—n—sF gu˜osX IHIHIHI IHIII II I gontenidoX R R P I g—p—™id—dX U S P Iƒi se dete™t— un ™—m˜ioD se elimin— el ™u˜o más —ntiguoX gu˜osX IHIII II I gontenidoX R P I g—p—™id—dX S P I gu—dro QX ijemplo de fun™ion—miento de eh‡sxPv— e(™ien™i— —hor— es de O(M · log(W/M )) p—l—˜r—s de memori—D y el tiempo depro™es—miento por ™—d— ejemplo es O(log W ) en el peor ™—so y O(1) en el mejorFy˜tiene l— ™—ntid—d de I9s de tod—s los ™u˜os en O(1)F gon ello el número desu˜vent—n—s — ev—lu—r disminuye y se —pli™—n los tests más rápid—mente — l—sse™uen™i—s en los ™u˜osF5.2. Algoritmos con ventana de entrenamientoil uso de vent—n—s permite limit—r el número de inst—n™i—s que se —prendensimultáne—menteD —demásD sirven p—r— elimin—r —quellos d—tos que son de ™onE™eptos —ntiguosF il pro™edimiento ˜ási™o de vent—n— desliz—nte que se us— enminerí— de se™uen™i—s de d—tos se puede ver en el elgoritmo QF g—d— nuev—inst—n™i— se —ñ—de — l— vent—n—D y ™u—ndo el ™l—si(™—dor se —™tu—liz— utiliz—l—s inst—n™i—s de di™h— vent—n— p—r— el —prendiz—jeF il —spe™to ™l—ve de estos—lgoritmos reside en ™ómo se de(ne este tipo de vent—n—sFil enfoque más simple es us—r un— vent—n— de t—m—ño (jo e in™luir solo losejemplos más re™ientes de l— se™uen™i— de d—tos y dese™h—r por l— p—rte más—ntigu—F ehor— ˜ienD se present— un ™ompromiso — l— hor— de es™oger el t—m—ñode l— mism—F ƒi l— vent—n— es de pequeño t—m—ñoD el ™l—si(™—dor será ™—p—zde —just—rse rápid—mente — los ™—m˜iosD pero perderá pre™isión en periodos deest—˜ilid—dF il pro™eso de —prendiz—je se ˜—s— en po™os d—tos y por t—ntoD est—rá PP
    • sujeto — más os™il—™ionesF in ™—m˜ioD si se es™oge un t—m—ño gr—nde o™urrirá lo ™ontr—rioD el pro™eso de —prendiz—je es más inmune — ™—m˜ios menores o ruidoD pero por el ™ontr—rio tiene más iner™i—D por t—nto será más lento — l— hor— de —d—pt—rse — los ™—m˜iosF €or est— r—zónD se propusieron distintos métodos de —juste dinámi™o de l— —n™hur— de l— vent—n—F Algorithm 3 elgoritmo ˜ási™o ™on vent—n—I intr—d— X S X s e ™ u e n ™ i — de d — t o sP W X vent—n— de e j e m p l o sQ ƒ — l i d — X C X ™ l — s i f i ™ — d o r ™ o n s t r u i d o ™on l o s d — t o s de WRS i n i ™ i — l i z — r vent—n— W YT p—r— t o d o s l o s e j e m p l o s xi en S XU W ← W ∪ xi YV e l i m i n — r e j e m p l o s — n t i g u o s de W s i e s n e ™ e s — r i o YW r e ™ o n s t r u i r o — ™ t u — l i z — r C us—ndo W Y 5.2.1. Método de Klinkenberg il método de ulinken˜erg et —lF ‘u‚WV“ está orient—do — l— ™l—si(™—™ión de do™uE mentos por lotes @batch A en entornos ™—m˜i—ntes @™onsider— ™—m˜ios gr—du—les y —˜ruptosAD y fue uno de los primeros en monitoriz—r diversos indi™—doresD ™on™reE t—mente l— pre™isión @accuracy AD l— espe™i(™id—d @precision A y l— exh—ustivid—d @recall AF €—r— —just—r l— vent—n— de entren—miento en primer lug—r se ™—l™ul— l— medi— y l— desvi—™ión típi™— p—r— ™—d— uno de los indi™—dores @e™™ a e™™ur—™yD ‚e™ a ‚e™—ll y €re™ a €re™isionA en ˜—se — los M últimos lotesD y — ™ontinu—™ión se utiliz— l— siguiente heurísti™—X ƒi —lguno de los indi™—dores ex™ede de su medi— α ve™es su desvi—™ión típi™—D se di™e que se h— s—lido de su interv—lo de ™on(—nz— y h— o™urrido un ™—m˜ioF €—r— ™ono™er l— n—tur—lez— del ™—m˜io @˜rus™o o gr—du—lAD se ™omprue˜— si el indi™—dor en el inst—nte t h— experiment—do un— ™—íd— β del v—lor del mismo en el inst—nte t − 1 ˆ ƒi el ™—m˜io es ˜rus™oD se redu™e l— vent—n— de entren—miento —l mínimo @B a I ˜—t™hAF ˆ ƒi el ™—m˜io es gr—du—lD se redu™e l— vent—n— en ˜—se — un p—rámetro γ de(nido — prioriF in el elgoritmo R se det—ll— en pseudo™ódigo l— heurísti™— emple—d—F ƒi h— o™urrido un ™—m˜io ˜rus™oD es de™irD se veri(™— l— primer— ™ondi™ión @líne—s P — RA y se redu™e l— vent—n— —l mínimo @I ˜—t™hAF in otro ™—soD si el ™—m˜io dete™t—do es gr—du—l @se ™umple l— segund— ™ondi™iónD que —˜—r™— l—s líne—s T — PQ
    • VA l— vent—n— se redu™e —l t—m—ño γ · 100 %F he no dete™t—rse ningún ™—m˜ioD el t—m—ño de l— vent—n— ™re™e un lote másF Algorithm 4 reurísti™— de ulinken˜erg p—r— —just—r el t—m—ño de l— vent—n— de entren—mientoF I €ro ™edure heterminexew‡indowƒize @ |Wt | D M D α D β D γ A P i f ((Acct < AvgM (Acc) − α · StdErrM (Acc)) and (Acct < β · Acct−1 )) or Q ((Rect < AvgM (Rec) − α · StdErrM (Rec)) and (Rect < β · Rect−1 )) or R ((P rect < AvgM (P rec) − α · StdErrM (P rec)) and (P rect < β · P rect−1 )) S then |Wt+1 | := |B| Y T else i f (Acct < AvgM (Acc) − α · StdErrM (Acc) or U (Rect < AvgM (Rec) − α · StdErrM (Rec) or V (P rect < AvgM (P rec) − α · StdErrM (P rec) W then |Wt+1 | := max(|B|, |Wt | − γ · |Wt |) YIH else |Wt+1 | := |Wt | + |B| YII return |Wt+1 | Y 5.2.2. FISH (uniFied Instance Selection algoritHm) ¢ sF lio˜—ité propuso un— nuev— f—mili— de —lgoritmos ll—m—d— psƒr ‘liIH—“D que us— simil—rid—des de tiempo y esp—™io entre inst—n™i—s p—r— —just—r dinámi™—E mente l— vent—n— de entren—mientoF €—r— expli™—rlo podemos ˜—s—rnos en el siguiente ejemplo ilustr—tivo de l— pigur— UF ƒe tr—t— de un pro˜lem— de ™l—siE (™—™ión ˜in—ri— @puntos ˜l—n™os y negrosA en el que l—s fuentes de gener—™ión de d—tos v—rí—n — lo l—rgo del tiempo de form— gr—du—l ™on l— rot—™ión de un hiperpl—noF €—r— un ™ierto áre— @™ir™unferen™i— roj—AD vemos que l— ™l—se ™orre™E t— en ™—d— inst—nte es diferenteF iste ejemplo muestr— que l— simil—rid—d en un dominio del pro˜lem— dinámi™o depende del tiempo y del esp—™ioF pigur— UX ijemplo de rot—™ión de hiperpl—noF szquierd—X fuente ini™i—l ƒIF gentroX fuente ƒP tr—s rot—r RSºF here™h—X fuente ƒQ tr—s rot—r WHºF v— —utor— propuso sele™™ion—r los ejemplos de l— vent—n— de entren—miento ˜—E sándose en un— medid— de dist—n™i— Dij que se de(ne de est— form—X PR
    • (s) (t) Dij = a1 dij + a2 dijdonde d(s) es l— dist—n™i— en el esp—™ioD d(t) l— dist—n™i— en el tiempo y a1 , a2son los ™oe(™ientes de ponder—™iónF €—r— dos ejemplos xi , xj D l— —utor— proponel— dist—n™i— eu™líde— ™omo dist—n™i— en el esp—™io y el número de ejemplos quelos sep—r—n ™omo dist—n™i— en el tiempoF were™e l— pen— dest—™—r que si a2 = 0Dl— medid— se ™onvierte en un— sele™™ión de inst—n™i—sD mientr—s que si a1 =0D tenemos un— vent—n— ™uyos pesos disminuyen ™on el tiempoF ƒe es™ogerán—quell—s inst—n™i—s ™on m—yor v—lor de dist—n™i— p—r— ™omponer l— vent—n— deentr—mientoFv— f—mili— de —lgoritmos está ™ompuest— porX psƒrIX el t—m—ño de l— vent—n— de entren—miento se (j— — prioriF psƒrPX el t—m—ño de l— vent—n— de entren—miento se —just— de form— dinámi™—D pero los pesos a1 , a2 se (j—n — prioriF psƒrQX idénti™o — psƒrPD s—lvo que los p—rámetros a1 , a2 se re™—l™ul—n dinámi™—mente — lo l—rgo del tiempoF PS
    • 6. Aportacionesin primer lug—r v—mos — de(nir el m—r™o de nuestro tr—˜—joF gomo hemos™oment—do —nteriormenteD est—mos en un entorno in™rement—l @ver pigur— VAF in™—d— inst—nte t tenemos un— se™uen™i— de d—tos etiquet—dos X H = (X1 , ..., Xt )D™on l— que se ™onstruye un ™l—si(™—dor Lt F gu—ndo lleg— un— nuev— inst—n™i—Xt+1 h—y que prede™ir su ™l—se yt+1 F†—mos — tr—˜—j—r ™on se™uen™i—s de d—tos que in™luyen ™—m˜ios de ™on™eptoFg—d— inst—n™i— Xt es gener—d— por un origen St F wientr—s este origen se m—ntenEg— ™onst—nte diremos que el ™on™epto no h— ™—m˜i—doD pero ™u—ndo St = St+1 Dnuestro propósito es dete™t—r di™ho ™—m˜io en el inst—nte más próximo —l puntoen que se produjo en l— se™uen™i—F pigur— VX v—s inst—n™i—s de d—tos se pro™es—n de form— in™rement—l ‘liIH˜“F€—r— nuestr—s diferentes propuest—sD nos hemos ˜—s—do en l— heurísti™— del métoEdo hhw de q—m— en el que se utiliz— l— herr—mient— Shewhart P-Chart —pli™—d—so˜re distint—s ™u—lid—desF in primer lug—r se est—˜le™e un nivel de —viso @war-ning A que ™u—ndo se —™tive v— — empez—r — —lm—™en—r inst—n™i—s en un— memori—— ™orto pl—zoD —sí ™omo un nivel de ™—m˜io @drift AD que forz—rá — que se re—prend—el ™l—si(™—dor ™on los ejemplos —lm—™en—dos en di™h— memori—F he est— m—ner—se ™onsigue que —nte un ™—m˜io de ™on™eptoD el ™l—si(™—dor olvide inform—™ión—nti™u—d— y —prend— ™on inst—n™i—s que pertene™en —l nuevo ™on™eptoFe ™ontinu—™ión v—mos — present—r diferentes —ltern—tiv—s que hemos pl—nte—dosiguiendo estos supuestos de tr—˜—jo y de l—s que se llev—ron — ™—˜o su impleEment—™ión y experiment—™iónF6.1. MoreErrorsMoving€—r— nuestr— primer— propuest—D que hemos denomin—do woreirrorswovingDse tr—t— de monitoriz—r los errores de ™l—si(™—™iónF €—r— ello ™ont—mos ™on unhistóri™o Hi = {ei−n , . . . , ei } ™on los n últimos result—dos de ™l—si(™—™ión en elinst—nte ti @ei = 0 en ™—so de —™iertoD ei = 1 en ™—so de f—lloAF †—mos — est—˜le™erel siguiente supuestoX si se produ™e un ™—m˜io de ™on™eptoD el ™l—si(™—dor v— —ver deterior—do su rendimiento y— que no será ™—p—z de ™l—si(™—r ™orre™t—mentelos nuevos d—tosF v— t—re— de dete™™ión que proponemos es ™ontrol—r el número PT
    • de errores de ™l—si(™—™ión que se v—n produ™iendo — lo l—rgo del tiempoD h—™iendouso del históri™o Hi F n ejƒe— ci = j=0 |ej ∈ Hi l— t—s— de error del históri™o en el inst—nte de tiempo nti F in ™—d— inst—nte de tiempoD se ™omprue˜— si ci−1 < ci @se h— in™rement—doel número de errores en el históri™oA y en este ™—so se di™e que h— o™urridoun empeor—miento e in™rement—mos el ™ont—dor de empeor—mientosF in ™—so™ontr—rioD si ci−1 > ci D quiere de™ir que se h— redu™ido el número de errores en elhistóri™oD por lo que se ™onsider—rá un— mejor— y se reini™i—liz— — H el ™ont—dorde empeor—mientos ™onse™utivosF in el ™—so de que se m—nteng— el v—lor de cDes de™irD si ci−1 = ci D el ™ont—dor de empeor—mientos se m—ntiene ™on el v—lor—nterior que tuvieseF €odemos ver un— represent—™ión grá(™— de los v—lores quetom— ci — lo l—rgo del tiempo en l— pigur— WF pigur— WX ‚epresent—™ión de l— t—s— de error del históri™o @naWAFe™tu—mos según l— siguiente heurísti™—X ƒi se produ™en k empeor—mientos ™onse™utivosD —™tiv—remos el nivel de —viE so @warning A y ™omenz—remos — —lm—™en—r l—s inst—n™i—s en un— memori— — ™orto pl—zoF @U W L = k A ƒi se produ™en k + d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de ™—m˜io @drift AF e ™ontinu—™iónD se reini™i—liz— el históri™o y los diferentes ™ont—dores @de erroresD inst—n™i—s y empeor—mientosAD —sí ™omo l— memori— — ™orto pl—zoF @U CL = k + dA in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE m—lid—dF ƒe reini™i—liz— el ™ont—dor de empeor—mientos y l— memori— — ™orto pl—zoF @CL = 0A…n ejemplo ilustr—tivo se puede ver en l— pigur— IH donde k = 2 y d = 2F PU
    • 10 memoria a drift corto plazo detectado warning activadoEmpeoramientos UCL=k+d 5 UWL=k 0 CL=0 10 20 30 40 50 Instancias pigur— IHX €Egh—rt p—r— woreirrorswovingF in l— inst—n™i— QVD se h— dete™t—do un ™—m˜io de ™on™epto porque se h— super—do el um˜r—l …gvF in l—s inst—nE ™i—s PH y SHD —l produ™irse un— mejor— del rendimiento se vuelve —l nivel de norm—lid—d y se reini™i—liz— el ™ont—dor de empeor—mientosF €—r— l— eje™u™ión de este método h—y que de(nir los v—lores de los p—rámetros nD k y d — prioriF 6.2. MaxMoving …n— nuev— propuest—D denomin—d— w—xwovingD tr—t— de monitoriz—r l—s t—s—s de éxito del ™l—si(™—dorF istá ˜—s—d— en l— siguiente suposi™iónX mientr—s el origen del ™on™epto se m—nteng— ™onst—nteD el ™l—si(™—dor v— — mejor—r su pre™isión — lo l—rgo del tiempo @mientr—s sig— re™i˜iendo inst—n™i—sAD pero en el momento en que se produz™— un ™—m˜io @drift AD l—s t—s—s de éxito empez—rán — empeor—r y— que el modelo —™tu—l no prede™irá ™orre™t—mente l— ™l—se de l—s nuev—s inst—n™i—sF f—sándonos en estoD m—ntenemos un históri™o Hi = {ai−n , . . . , ai } ™on l—s n últim—s t—s—s de éxito —™umul—d—s desde el último ™—m˜ioF ƒe— ai = 1 − Nii l—e t—s— de éxito —™umul—d— h—st— el inst—nte ti D donde ei y Ni son el número de errores de ™l—si(™—™ión y el número de inst—n™i—s pro™es—d—s h—st— el inst—nte ti D respe™tiv—menteF ƒe— mi = m´x{aj |aj ∈ Hi } l— mejor t—s— de éxito del históE a ri™o en el inst—nte ti F wientr—s se estén ™l—si(™—ndo inst—n™i—sD ™ompro˜—mos si mi−1 < mi D y si es —síD ™onsider—mos que se está mejor—ndo l— t—s— de éxito —™uE mul—d—F in ™—so ™ontr—rioD en el que el nuevo máximo es menor que el —nteriorD diremos que h— empeor—do e in™rement—mos un ™ont—dor de empeor—mientosF ƒi mi−1 = mi D es de™irD el máximo en el históri™o —nterior y el —™tu—l no h— ™—m˜ioD m—ntenemos el v—lor que y— tuviese el ™ont—dor de empeor—mientosF il uso del máximo so˜re el históri™o Hi de t—m—ño nD nos permite —mortigu—r l—s pequeñ—s os™il—™iones del tipo ai−1 > ai < ai+1 D ™—so en el que l— t—s— de éxito ™omienz— — des™enderD pero luego remont— rápid—menteF ƒe puede ver un— represent—™ión grá(™— de los distintos v—lores que tom— mi — lo l—rgo del tiempo en l— pigur— IIF PV
    • Máximo del histórico de tasas de éxito 1.0 0.8 0.6 Max. Accuracy 0.4 0.2 0.0 0 10000 20000 30000 40000 50000 Instancespigur— IIX ‚epresent—™ión de l—s mejores t—s—s de éxito —™umul—d—s en el hisEtóri™o — lo l—rgo del tiempoF v—s ™—íd—s del rendimiento se de˜en — ™—m˜ios de™on™eptoFv— ™u—lid—d que v—mos — ™ontrol—r en el €Egh—rt es el número de empeor—mienEtosD de m—ner— que pod—mos dete™t—r ™uándo el modelo y— no es —de™u—ndop—r— los d—tos que se están re™i˜iendo y es ne™es—rio re—prenderF gonsider—mosl— siguiente heurísti™—X ƒi se produ™en k empeor—mientos ™onse™utivosD —™tiv—remos el nivel de —viE so @warning A y ™omenz—remos — —lm—™en—r l—s inst—n™i—s en un— memori— — ™orto pl—zoF @U W L = k A ƒi se produ™en k + d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de ™—m˜io @drift AF e ™ontinu—™iónD se reini™i—liz— el históri™o y los diferentes ™ont—dores @de erroresD inst—n™i—s y empeor—mientosAD —sí ™omo l— memori— — ™orto pl—zoF @U CL = k + dA in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE m—lid—dF ƒe reini™i—liz— el ™ont—dor de empeor—mientos y l— memori— — ™orto pl—zoF @CL = 0A€—r— l— eje™u™ión del dete™tor w—xwoving es ne™es—rio est—˜le™er — priori losv—lores de los p—rámetros n, k y dF6.3. MovingAverage„r—s re—liz—r diversos experimentos ™on los dos métodos —nterioresD nos dimos™uent— de que se produ™í—n mu™hos f—lsos positivosD es de™irD se dete™t—˜—n ™—mE˜ios inexistentes en l— se™uen™i— de d—tosF isto se de˜í— — que l—s dos fun™ionesmonitoriz—d—s present—˜—n mu™h—s os™il—™iones @grá(™—s en dientes de sierr—A PW
    • que en o™—siones er—n tom—d—s erróne—mente ™omo ™—m˜iosF €—r— intent—r p—Eli—r este defe™toD —pli™—mos el método est—dísti™o de l—s medi—s móviles @movingaverage A que ™onsiste en ™re—r series de promedios d—do un ™onjunto de puntosFin nuestro ™—soD queremos promedi—r l—s t—s—s de éxito us—ndo un— vent—n— desu—viz—do de t—m—ño m p—r— que l— grá(™— presente un ™omport—miento ™onmenos os™il—™iones @ver ejemplo de l— pigur— IPAF Original Moving Average (100) 100 100 80 80 60 60 Accuracy Accuracy 40 40 20 20 0 0 0 5000 10000 15000 20000 0 5000 10000 15000 20000 Instances Instances Moving Average (500) Moving Average (1000) 100 100 80 80 60 60 Accuracy Accuracy 40 40 20 20 0 0 0 5000 10000 15000 20000 0 5000 10000 15000 20000 Instances Instancespigur— IPX v— primer— grá(™— @—rri˜— izquierd—A es l— origin—lD mientr—s que enel resto se represent— en rojo l— medi— móvil simpleD ƒweD ™on su—viz—do demaIHHD SHH y IHHHD respe™tiv—mente —pli™—do so˜re los v—lores de l— líne— gris@origin—lAFfási™—mente h—y dos tipos de medi—s móvilesX IF Media móvil simple (SMA)X que se ™—l™ul— ™omo l— medi— —ritméti™— de l—s últim—s m o˜serv—™ionesF st = m 1 m−1 xt +xt−1 +xt−2 +···+xt−(m−1) n=0 xt−n = m = xt −xt−m st−1 + m PF Media móvil ponderada (WMA)X se ™—l™ul— utiliz—ndo un ™onjunto de m pesos @que en tot—l sum—n IA que se —pli™—n — ™—d— o˜serv—™iónF m−1 st = n=0 wn xt−n = w0 xt + w1 xt−1 + · · · + wm−1 xt−(m−1)in nuestro método solo hemos us—do el primer tipo @ƒweAD —unque p—r— untr—˜—jo futuro serí— interes—nte pro˜—r el segundo @‡weAD de m—ner— que se—justen los pesos p—r— d—rle más import—n™i— — los o˜serv—™iones más re™ientesF QH
    • v—s o˜serv—™iones — promedi—r en nuestro método wovingever—ge v—n — ser l—s t—s—s de —™ierto —™umul—d—s de l—s m últim—s muestr—sF e l— hor— de dete™t—r ™—m˜ios hemos pl—nte—do dos heurísti™—s diferentes que tr—t—n de ™—r—™teriz—r dos tipos de ™—m˜ios en los d—tosX gr—du—les y —˜ruptosF v— primera heurística es —de™u—d— p—r— ™—m˜ios gr—du—lesD que ™onsider— que se h— produ™ido un empeor—miento si st < st−1 y fun™ion— de l— siguiente m—ner— @ver ejemplo en gu—dro RAX ƒi dur—nte k ve™es ™onse™utiv—s h— empeor—do l— t—s— promedi—d—D —™tiv—E mos el nivel de —viso @warning A y ™omenz—mos — —lm—™en—r l—s inst—n™i—s re™i˜id—s en un— memori— — ™orto pl—zoF ƒi se produ™en k+d empeor—mientos ™onse™utivosD —™tiv—remos el nivel de ™—m˜io @drift AF in el momento en el que o™urr— un— mejor—D se est—˜le™e el nivel de norE m—lid—d y se elimin—n l—s inst—n™i—s de l— memori— — ™orto pl—zoF Instancias →Predicción 0 1 0 0 1 1 1 0 0 0 0 0 0 1 1Tasa de acierto 0/1 1/2 1/3 1/4 2/5 3/6 4/7 4/8 4/9 4/10 4/11 4/12 0/1 1/2 2/3Media móvil - - 0.27 0.36 0.32 0.38 0.49 0.52 0.50 0.44 0.40 0.36 - - 0.38Empeoramientos 0 0 0 0 1 0 0 0 1 2 3 4 0 0 0Nivel N N N N N N N N N W W D N N N gu—dro RX ijemplo de fun™ion—miento de l— primer— heurísti™— del método woE vingever—geF v— (l— de predi™™ión ™ontiene I si se h— —™ert—do o H si h— f—ll—doF v— t—s— de —™ierto es l— —™umul—d— desde el prin™ipio @o desde el último drift dete™t—doAF v— medi— móvil se re—liz— ™on m = 3 últim—s t—s—s de —™iertoF il nivel de w—rning @‡A se —™tiv— ™u—ndo h—y k = 2 empeor—mientos ™onse™utivos y el de drift @hA ™u—ndo h—y R @d = 2AD en otro ™—so se en™uentr— en norm—lid—d @xAF in ™—so de tr—t—rse de ™—m˜ios ˜rus™os entre ™on™eptos muy distintosD l— t—s— de —™ierto no de™—e progresiv—menteD si no de form— drásti™—D por lo que ™on l— heurísti™— —nterior o˜tendrí—mos f—lsos neg—tivos —l no dete™t—rse medi—nte empeor—mientos su™esivosF €or elloD implement—mos un— segunda heurística ˜—s—d— en el s—lto o diferen™i— en los v—lores de l—s t—s—s de éxito p—r— poder dete™t—r est— ™—íd— de rendimiento @ver ejemplo en gu—dro SAF sgu—l que —ntesD se monitoriz— l— t—s— de —™ierto —™umul—d— promedi—d— de l—s m últim—s muestr—sD pero —demás m—ntenemos un históri™o de t—m—ño n ™on estos v—lores promediosF ehor—D p—r— ™—d— inst—nte de tiempo t: ƒe o˜tiene smax ™omo el mejor v—lor del históri™oD —sí ™omo l— t—s— de —™ierto promedi—d— —™tu—l st F ƒi l— diferen™i— entre st y smax super— un ™ierto um˜r—l uD —™tiv—remos el nivel de —viso @warning AF wientr—s que si super— un um˜r—l v D —™tiv—remos el nivel de ™—m˜io @drift AF ƒe de˜e ™umplir que u < v F istos v—lores reE present—n el por™ent—je de ™—íd— de rendimiento frente — smax y tom—rán v—lores entre H y IF QI
    • ƒi no se d— ninguno de estos dos ™—sosD se est—˜le™e el nivel de norm—lid—dF Instancias →Predicción 0 1 0 0 1 1 1 0 0 0 0 0 1 1Tasa de acierto 0/1 1/2 1/3 1/4 2/5 3/6 4/7 4/8 4/9 4/10 4/11 0/1 1/2 2/3Media móvil - - 0.27 0.36 0.32 0.38 0.49 0.52 0.50 0.44 0.40 - - 0.38Máx. media móvil - - - - 0.36 0.38 0.49 0.52 0.52 0.52 0.50 - - -Diferencia - - - - 0.04 0 0 0 0.02 0.08 0.10 - - -Nivel N N N N N N N N N W D N N N gu—dro SX ijemplo de fun™ion—miento de l— segund— heurísti™— del método woE vingever—geF v— (l— de predi™™ión ™ontiene I si se h— —™ert—do o H si h— f—ll—doF v— t—s— de —™ierto es l— —™umul—d— desde el prin™ipio @o desde el último drift dete™t—doAF v— medi— móvil se re—liz— ™on m = 3 últim—s t—s—s de —™iertoF il históri™o ne™es—rio p—r— ™—l™ul—r el máximo está ™ompuesto por n = 3 últim—s medi—s móvilesF il nivel de w—rning @‡A se —™tiv— ™u—ndo l— diferen™i— es m—yor o igu—l que u = 5 % y el de drift @hA ™u—ndo es m—yor o igu—l que v = 10 %D en otro ™—so se en™uentr— en norm—lid—d @xAF pin—lmente ™om˜in—mos —m˜—s heurísti™—s en el método wovingever—ge p—r— poder dete™t—r ™u—lquier— de los dos ™—m˜ios men™ion—dosF €—r— ello se de˜e tener en ™uent— el sol—p—miento de los niveles de —viso y de ™—m˜io de ™—d— un— de l—s heurísti™—sF ƒe—n ω1 y ω2 los niveles de —visoD δ1 y δ2 los niveles de drift y η1 y η2 los niveles de norm—lid—d de l—s heurísti™—s I y P respe™tiv—menteF he(nimos pues los niveles de nuestr— heurística híbrida ™omoX IF xivel de norm—lid—dX ηH = η1 ∧ η2 ⇒!ω1 ∧!ω2 ∧!δ1 ∧!δ2 F PF xivel de —viso @warning AX ωH = ω1 ∨ ω2 F QF xivel de ™—m˜io @drift AX δH = δ1 ∨ δ2 F in el elgoritmo S se puede ver el pseudo™ódigo de este métodoF QP
    • Algorithm 5 elgoritmo woving ever—ge rí˜rido I δ1 a δ2 a ω1 a ω2 a pevƒi Y P — ™ ™ u r — ™ y a I − e r r o r s G numsnst—n™es Y Q window F —dd @ — ™ ™ u r — ™ y A Y GG remove o l d e s t i f window F s i z e >m R i f window F s i z e aa mX S ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e a window F — v e r — g e @ A T U GG −− ˜ e g i n f i r s t h e u r i s t i ™ −− GG V i f ™urrente™™ur—™yever—ge ` previouse™™ur—™yever—ge X W ™ o n s e ™ u t i v e h r o p s CCY GG worseIH else i f ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e b p r e v i o u s e ™ ™ u r — ™ y e v e r — g e XII ™ o n s e ™ u t i v e h r o p s a H Y GG ˜ e t t e rIP else XIQ ™ o n s e ™ u t i v e h r o p s a ™ o n s e ™ u t i v e h r o p s Y GG s—meIRIS previouse™™ur—™yever—ge a ™urrente™™ur—™yever—ge YITIU if ™ o n s e ™ u t i v e h r o p s b kCd XIV δ1 a „‚…iYIW else i f ™ o n s e ™ u t i v e h r o p s b k XPH ω1 a „‚…iYPI GG −− end o f f i r s t h e u r i s t i ™ −− GGPPPQ h i s t o r y F —dd @ ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e A GG remove o l d e s t i f h i s t o r y F s i z e >nPR i f h i s t o r y F s i z e aa n XPS GG −− ˜ e g i n s e ™ o n d h e u r i s t i ™ −− GGPT d i f f e r e n ™ e a h i s t o r y F m—x @ A − ™ u r r e n t e ™ ™ u r — ™ y e v e r — g e YPU if differen™e b vXPV δ2 a „‚…iYPW else i f d i f f e r e n ™ e b u XQH ω2 a „‚…iYQI GG −− end s e ™ o n d h e u r i s t i ™ −− GGQPQQ if or δ2 X δ1QR return h‚sp„ YQS else i f ω1 or ω2 XQT return ‡e‚xsxqYQU else XQV return xy‚wevY el igu—l que en los métodos —nterioresD los v—lores de n, kD d, u y v h—y que (j—rlos — prioriF QQ
    • 7. MOA (Massive Online Analysis)€—r— ev—lu—r nuestr—s propuest—s y re—liz—r un— ™omp—r—tiv— ™on —lgunos de losmétodos des™ritos —nteriormente se h— utiliz—do el entorno de des—rrollo wye@w—ssive ynline en—lysisA ‘fuHW˜D fru€IH“F wye es un softw—re des—rroll—Edo en l— …niversid—d de ‡—ik—to @xuev— el—nd—A p—r— re—liz—r experimentosde ™l—si(™—™ión y ™lustering ™on se™uen™i—s de d—tosF istá rel—™ion—do ™on elproye™to ˜ien ™ono™ido ‡iue ‘fpr+ IH“ @de minerí— de d—tos tr—di™ion—lAF„—m˜ién está implement—do en t—v— y tiene li™en™i— q€vF intre otr—s utiliEd—desD propor™ion— muestr—s y se™uen™i—s de d—tos y— que ™ontiene un— ˜uen—™ole™™ión de gener—dores de se™uen™i—s de d—tosF edemásD in™luye —lgoritmos de™l—si(™—™ión y —grup—miento @™lusteringAD —sí ™omo v—rios métodos de ev—lu—E™iónF in este —p—rt—do ex™lusiv—mente v—mos — det—ll—r l— p—rte de ™l—si(™—™ióny de gener—doresD que son l—s que hemos us—do en l— se™™ión experiment—l deltr—˜—joF7.1. El entornov— form— de utiliz—r wye es medi—nte l— eje™u™ión de t—re—s @tasks AF ist—s t—Ere—s se pueden l—nz—r t—nto — tr—vés de un— interf—z grá(™—D ™omo por líne— de™om—ndos y mu™h—s de ell—s se pueden en™—den—r @ver pigur— IQAF v—s t—re—sprin™ip—les son de —prendiz—je y ev—lu—™iónD —unque h—y otr—s útiles ™omo geEner—r un— se™uen™i— de d—tos que —demás se puede gu—rd—r en e‚pp @form—toutiliz—do por ‡iue muy ™omún en minerí— de d—tosAF pigur— IQX plujo de tr—˜—jo en wyev— interf—z grá(™— de wye permite utiliz—r los métodos de minerí— de d—tostr—di™ion—l @en modo ˜—t™hA de ‡iueF isto result— espe™i—lmente útil p—r—™omp—r—r el —prendiz—je online ™on un —prendiz—je ˜—t™h ™omo referen™i—F edeEmásD nos permite l—nz—r v—ri—s t—re—s de form— simultáne— y ver l— evolu™iónde ™—d— un—D pudiendo detener ™u—lquier— de ell—s en ™u—lquier momentoF inl— pigur— IR podemos ver un ejemplo de l— vent—n— prin™ip—l de l— —pli™—™ióndur—nte l— eje™u™ión de un— t—re— de ™l—si(™—™iónF QR
    • pigur— IRX †ent—n— prin™ip—l de wyeF ije™u™ión de un— t—re— de ev—lu—™ión@€requenti—lA de un método de ™l—si(™—™ión @roeding„reeA ™on dete™™ión de™—m˜io @ihhwA so˜re un— se™uen™i— de d—tos gener—d— por ƒieqener—torF inl— p—rte superior se puede ver l— t—re— eje™ut—d— y en l— p—rte inferior l— s—lid—de l— mism— — interv—los de IHHH inst—n™i—s @de(nido previ—menteAF7.2. Generación de secuencias de datosgomo y— indi™—mosD un— ™—r—™terísti™— muy útil de wye es l— posi˜ilid—d degener—r se™uen™i—s de d—tos — p—rtir de diversos gener—dores que in™orpor— pordefe™to y que list—mos — ™ontinu—™iónF STAGGER Concepts GeneratorX vos ™on™eptos de ƒ„eqqi‚ ‘ƒqVT“ ™onform—n un estánd—r en l— ev—lu—™ión de ™l—si(™—dores en entornos ™on se™uen™i—s de d—tos ™on ™—m˜ios de ™on™eptoF il pl—nte—miento origin—l present— un— serie de ejemplos ™on tres —tri˜utosX ˆ color ∈ {green, blue, red} ˆ shape ∈ {triangle, circle, rectangle} ˆ size ∈ {small, medium, large} v— se™uen™i— de d—tos se divide en tres ™on™eptosX en los primeros RH ejemplosD el ™on™epto es color = red ∧ size = smallY en los siguientes RH QS
    • ejemplosD el ™on™epto es color = green shape = circleY por últimoD losRH ejemplos (n—les se ™onstruyen ™on el ™on™epto size = medium size =largeF istos ™on™eptos se pueden o˜serv—r de form— visu—l en l— pigur—ISF ƒe h— us—do en ‘†xII“‘‡uWT“‘fr€+ HW“‘qwg‚HR“‘uwHU“F pigur— ISX †isu—liz—™ión de los ™on™eptos ƒ„eqqi‚ ‘uwHU“SEA Concepts GeneratorX iste ™onjunto de d—tos —rti(™i—l present—Edo en ‘xuHI“ está ™ompuesto por ™u—tro ˜loques de d—tos ™on diferentes™on™eptosF vos d—tos ™onst—n de tres —tri˜utos y un— ™l—se ˜in—ri—F v—™l—si(™—™ión se re—liz— solo ™on dos —tri˜utosD mientr—s que el ter™ero esirrelev—nteD siguiendo est— fun™iónX f1 + f2 ≤ θD donde f1 y f2 son losdos primeros —tri˜utos y θ es un um˜r—l que se —just— p—r— ™—d— unode los ˜loques de d—tos siguiendo este orden {9, 8, 7, 9,5}F he est— forEm—D l— se™uen™i— de d—tos se de(ne ™omo l— unión ™onse™utiv— de SEA9 DSEA8 D SEA7 y SEA9,5 D donde ™—d— ™onjunto ™onst— de IPSHH inst—n™i—sDpresent—ndo un ™—m˜io ˜rus™o entre ™—d— ™on™eptoF is posi˜le —demás inE™orpor—r un por™ent—je de ruido por medio del p—rámetro nF ƒe h— us—doen ‘fr€+ HW“‘uwHU“‘qƒ—‚HW“FRandom RBF GeneratorX in est— se™uen™i—D se gener— un número (jode ™entroides @™l—sesA de form— —le—tori— y — ™ontinu—™ión se ™re—n nuevosejemplos eligiendo ™u—lquier— de estos ™entroides de m—ner— que ™—ig—n™er™— de los mismosF v— dist—n™i— —l ™entroide se o˜tiene de form— —le—tori—de un— distri˜u™ión q—usi—n— ™uy— desvi—™ión típi™— viene determin—d—por el ™entroideF ƒolo se utiliz—n —tri˜utos numéri™osF €—r—r introdu™ir un™—m˜io de ™on™epto se despl—z—n los ™entroides en el esp—™io indi™—ndo elnúmero k de ™entroides — despl—z—r y l— velo™id—d s ™on l— que lo v—n —h—™erF ƒe h— us—do en ‘fr€+ HW“FLED GeneratorX ist— se™uen™i— de d—tos ‘fpyƒVR“ ™onst— de PR —triE˜utos ˜in—riosD IU de los ™u—les son irrelev—ntesF il o˜jetivo es prede™ir eldígito mostr—do en un displ—y vih de U segmentos en el que ™—d— —tri˜uEto tiene un IH 7 de posi˜ilid—des de est—r invertidoF ƒe puede in™luir un QT
    • ™—m˜io de ™on™epto indi™—ndo el número d de —tri˜utos ™on ™—m˜iosF ƒe h— us—do en ‘†xII“‘fr€+ HW“F Waveform GeneratorX ist— se™uen™i— de d—tos —p—re™ió t—m˜ién en ‘fpyƒVR“F il o˜jetivo es diferen™i—r entre Q ™l—ses diferentes de ond—sD donde ™—d— un— de l—s ™u—les se h— gener—do por un— ™om˜in—™ión de P o Q ond—s ˜—sesF ixisten dos versiones de este pro˜lem—X w—vePI ™on PI —tri˜utos numéri™os ™on ruido y w—veRH ™on IW —tri˜utos extr— irreE lev—ntesF ixiste l— posi˜ilid—d de introdu™ir ™—m˜ios en un determin—do número d de —tri˜utos p—r— forz—r un ™—m˜io de ™on™eptoF ƒe h— us—do en ‘†xII“‘fr€+ HW“‘qƒ—‚HW“F Function Generator (Agrawal)X iste ™onjunto de fun™iones se presentó en ‘esƒWQ“ y h— sido us—do p—r— ™ompro˜—r l— es™—l—˜ilid—d en —lgoritmos de —prendiz—je ™on ár˜oles de de™isiónF v— se™uen™i— de d—tos se puede gener—r en ˜—se — IH fun™iones diferentes ™on W —tri˜utos des™ritos en el gu—dro T @T numéri™os y Q ™—tegóri™osA y un— ™l—se ˜in—ri—D de m—ner— que simul— un— hipotéti™— —pli™—™ión de ™on™esión de prést—mos ˜—n™—E riosF eunque es un— ˜uen— form— de gener—r se™uen™i—s ™on ™—m˜ios de ™on™eptos de˜ido — l— v—ried—d de sus fun™ionesD en l— ˜i˜liogr—fí— de deE te™™ión de drifts solo hemos en™ontr—do que se h— us—do en ‘fr€+ HW“FAtributo Descripción Valores salary Sueldo Entre 20000 y 150000commision Comisión Si salary ≥ 75000 ⇒ comission = 0, en otro caso, entre 10000 y 75000 age Edad Entre 20 y 80 elevel Nivel educativo Entre 0 y 4 (categórico) car Marca del coche Entre 1 y 20 (categórico) zipcode Código postal Entre 1 y 9 (categórico) hvalue Valor de la vivienda Entre 0.5k100000 y 1.5k100000 donde k depende de zipcode hyears Edad de la vivienda Entre 1 y 30 loan Valor del préstamo Entre 0 y 500000 gu—dro TX hes™rip™ión de los —tri˜utos de egr—w—l Rotating HyperplaneX v—s se™uen™i—s de d—tos gener—d—s por medio de un hiperpl—no rot—torio se us—ron ini™i—lmente en ‘rƒhHI“F …n hiperpl—no en un esp—™io dEdimension—l es el ™onjunto de puntos en x que s—tisf—™e d d i=1 wi xi = w0 = i=1 wi donde xi es l— iEésim— ™oorden—d— de xF vos ejemplos m—yores o igu—les que w0 son etiquet—dos ™omo positivosD y el resto ™omo neg—tivosF €—r— introdu™ir un ™—m˜ioD ˜—st—rá ™on ™—m˜i—r el peso de un —tri˜uto wi = wi + dσ D donde d es el ™—m˜io que se —pli™— y σ l— pro˜—˜ilid—d de que se produz™— di™ho ™—m˜ioF vos hiperpl—nos son útiles p—r— simul—r ™—m˜ios de ™on™eptosD porque permiten modi(™—r l— orient—™ión y l— posi™ión del hiperpl—no de un— m—ner— su—ve —just—ndo el peso de ™—d— —tri˜utoF ƒe h— us—do en ‘†xII“‘fr€+ HW“‘fqHU“F in l— pigur— IT se puede o˜serv—r l— interf—z de wye p—r— gener—r se™uen™i—s de d—tos y —lm—™en—rl—s en (™heros e‚ppF QU
    • pigur— ITX snterf—z p—r— gener—r un— se™uen™i— de IHHH d—tos us—ndo el gener—dorƒ„eqqi‚Fƒi nuestro propósito es disponer de se™uen™i—s ™on ™—m˜io de ™on™eptoD un —sEpe™to interes—nte es l— posi˜ilid—d de in™orpor—r ™—m˜ios ™ontrol—dos1 F €—r— ellose pueden utiliz—r los gener—dores ™oment—dos —nteriormente y ™om˜in—rlos meEdi—nte un— fun™ión sigmoide @ver pigur— IUA que determin— el ™—m˜io de unorigen de d—tos — otroF gomo p—rámetros de l— fun™ión podemos de(nir el moEmento t0 en el que su™ede el ™—m˜ioD —sí ™omo —just—r l— ˜rusqued—d ™on l— quese produ™e por medio de αD o ˜ienD l— longitud del mismo us—ndo W F hur—nteeste interv—lo se v—n — mez™l—r en l— se™uen™i— de d—tos inst—n™i—s de —m˜os™on™eptosF ytr— posi˜ilid—d es gener—r v—ri—s se™uen™i—s de d—tos de form— inEdependiente y luego junt—rl—s de form— ™onse™utiv— en un— sol— se™uen™i—F 1 De cara a la experimentación es fundamental saber cuántos cambios, en qué momento yel tiempo de cambio producido en la secuencia de datos, para luego llevar a cabo evaluacionesy comparaciones entre métodos. QV
    • pigur— IUX pun™ión sigmoide f (t) = 1/(1 + e−s(t−t0 ) ) F gu—nto m—yor se— αDmenor será W y el ™—m˜io será más ˜rus™oF‘fuHW—“7.3. Métodos de clasicaciónvos prin™ip—les métodos de ™l—si(™—™ión online que se en™uentr—n y— impleEment—dos en wye sonX x—ive f—yesD x—ive f—yes wultinomi—l ‘wxWV“D heE™ision ƒtumpD roeding „ree ‘rƒhHI“D roeding yption „ree ‘€ruHU“D f—gEging ‘yz—HS“D foosting ‘yz—HS“D f—gging using eh‡sx ‘fqHU“D f—gging usinged—ptiveEƒize roeding „rees ‘fr€+ HW“D €er™eptronD ƒqhX ƒto™h—sti™ qr—dienthes™entD €eg—sos ‘ƒƒƒƒgHU“D €er™eptron ƒt—™king of ‚estri™ted roeding „rees‘fpr€IH“ y vever—ging f—gging ‘fr€IH“F edemás de estosD t—m˜ién nos perEmite in™orpor—r los —lgoritmos desde ‡iue —sí ™omo ™om˜in—r ™u—lquier— deellos ™on un método de dete™™ión de ™—m˜ioF7.4. Métodos de evaluación7.4.1. Holdoutin el —prendiz—je en ˜—t™hD lo h—˜itu—l es utiliz—r v—lid—™ión ™ruz—d—D pero ™omoy— se h— indi™—do en l— ƒe™™ión QFR es invi—˜le us—r este método p—r— el —prendiEz—je por se™uen™i—s de d—tos y— que se vuelve muy ™ostosoF €or elloD en ‘fuHW—“propusieron us—r el método holdout que us— un ™onjunto de entren—miento yotro de testFin wye podemos de(nir ™—d— ™uánto se ev—lú— el modelo entren—doF €—r—se™uen™i—s de d—tos sin ™—m˜io de ™on™eptoD podemos us—r siempre el mismo™onjunto de testD pero en ™—so de que se— un— se™uen™i— ™on drift es ne™es—rioque el ™onjunto de test se —™tu—li™e ™on el tiempo y— que si no podrí—mos est—rev—lu—ndo ™on inst—n™i—s que pertene™en — un— distri˜u™ión de d—tos distint— —l— entren—d—F v— implement—™ión de wye solo ™ontempl— —™tu—lmente el usode ™onjuntos de test estáti™osD por lo que no es indi™—do p—r— ev—lu—r se™uen™i—s™on ™—m˜iosF QW
    • 7.4.2. Interleaved Test-Then-Train (o Prequential)ytro método diferente ™onsiste en ev—lu—r el modelo ™on ™—d— nuev— inst—n™i—y luego us—rlo p—r— el entren—mientoF ist— té™ni™— se puede us—r t—nto p—r—se™uen™i—s de d—tos ™on ™—m˜ios y sin ™—m˜ios de ™on™eptoF il in™onveniente deeste método es que —l ™omienzo de l— ev—lu—™ión es pro˜—˜le que o˜teng—mospeores result—dos de˜ido — que el modelo no está tod—ví— ˜ien entren—doF in l—pigur— IV podemos ver un ejemplo de un— vent—n— de ™on(gur—™ión de wyep—r— est—˜le™er l— ev—lu—™iónFƒegún el estudio re—liz—do por q—m— et —lF ‘qƒ—‚HW“ este método es más indi™—dop—r— se™uen™i—s de d—tosFpigur— IVX †ent—n— de ™on(gur—™ión p—r— un— t—re— de ev—lu—™iónF il método de—prendiz—je es roeding„ree ™on dete™™ión de ™—m˜io ihhwF v— se™uen™i— ded—tos de IHHFHHH inst—n™i—s se gener— medi—nte ƒie qener—torF v— ev—lu—™iónse re—liz— en un entorno prequenti—l y se v—n — mostr—r l—s t—s—s de éxito —™uEmul—d—s ™—d— IFHHH inst—n™i—s pro™es—d—sF …n ejemplo de l— s—lid— por p—nt—ll—de l— eje™u™ión puede verse en l— pigur— IRF RH
    • 8. Experimentación€—r— ™ompro˜—r l— e(™—™i— de los métodos propuestosD hemos re—liz—do un— expeEriment—™ión so˜re diferentes se™uen™i—s de d—tosF gomo el propósito es ev—lu—rlos diferentes métodos de dete™™ión de ™—m˜iosD se h—n prep—r—do se™uen™i—st—nto ™on ™—m˜ios ˜rus™os ™omo ™on ™—m˜ios gr—du—lesD —demás de v—ri—s seE™uen™i—s ™on d—tos re—les disponi˜les en httpXGGmo—F™sFw—ik—toF—™FnzGd—t—setsGy que se h—n utiliz—do en l— liter—tur—Fv— ev—lu—™ión se h— re—liz—do medi—nte l— estr—tegi— prequenti—lD en l— que se™l—si(™—n y luego se entren—n ™—d— un— de l—s inst—n™i—s de l— se™uen™i— ™onformese v—n re™i˜iendoF €—r— poder h—™er un— ™omp—r—tiv— entre los distintos métoEdosD se h— (j—do ™omo —lgoritmo de ™l—si(™—™ión el x—ivef—yes y se h— ™—l™ul—doel e…gD áre— ˜—jo l— ™urv— de t—s—s de éxito —™umul—d—s desde el prin™ipio del— eje™u™iónF ytros d—tos ™—l™ul—dos h—n sido el número de ™—m˜ios dete™t—dos™orre™t—mente e in™orre™t—mente @f—lsos positivos y f—lsos neg—tivosAD —sí ™omol— dist—n™i— medid— en número de inst—n™i—s desde que s—˜emos que se produ™eel ™—m˜io de ™on™epto h—st— que (n—lmente se dete™t—F in el ™—so de l—s se™uenE™i—s de d—tos re—lesD no podemos ™—l™ul—r est— dist—n™i—D y— que des™ono™emos™uántos ™—m˜ios present—n y ™uándo se produ™enF8.1. Conjuntos de datos realesElectricity Market (ELEC)iste es uno de los ™onjuntos de d—tos re—les más utiliz—dos en dete™™ión dedriftsF ƒe tr—t— de un— se™uen™i— de d—tos (nit— ™ompuest— por RSFQIP inst—n™i—sDdonde ™—d— muestr— represent— un periodo de QH minutos ™on v—lores de l—ofert— y dem—nd— de l— energí— elé™tri™— de un— ™iud—d eustr—li—n—D donde lospre™ios v—rí—n según l— dem—nd—F il v—lor de l— ™l—se se re(ere — l— v—ri—™ióndel pre™io ™on respe™to — l— medi— de l—s últim—s PR hor—sF ƒe h— us—do en‘fr€+ HW“‘qwg‚HR“‘fqHU“‘fqdgep+ HT“‘uwHU“FForest Covertype (Forest)iste ™onjunto de d—tos ™ontiene v—lores so˜re el tipo de suelo forest—l en regionesde ist—dos …nidosF istá ™ompuesto por SVIFHIP inst—n™i—s ™on SR —tri˜utos y U™l—sesF ƒe h— us—do en ‘†xII“‘fr€+ HW“FPoker-Hand (Poker)iste ™onjunto está ™ompuesto por IFHPSFHIH inst—n™i—sD donde ™—d— muestr—represent— un— m—no de S ™—rt—s es™ogid—s de un— ˜—r—j— ™on SP ™—rt—sF g—d—™—rt— se des™ri˜e ™on dos —tri˜utos @p—lo y v—lorAD por lo que en tot—l h—˜rá IH—tri˜utosF v— ™l—se des™ri˜e l— m—no de póker y ™onst— de IH posi˜les v—loresFr—y que tener en ™uent— que el orden de l—s ™—rt—s es import—nteF ƒe h— us—doen ‘fqHU“ ‘fr€+ HW“F €—r— nuestr— experiment—™ión hemos utiliz—do l— versiónnorm—liz—d— disponi˜le en l— we˜ de wyeD de m—ner— que no import— el orden RI
    • de l—s ™—rt—s — l— hor— de form—r un— m—no y —demás se h—n elimin—do v—lores repetidosD por lo que en tot—l ™onst— de VPWFPHI inst—n™i—sF 8.2. Batería de pruebas v—s se™uen™i—s de d—tos sintéti™—s que se h—n gener—do medi—nte el softw—re wyeD —sí ™omo l—s se™uen™i—s re—les des™rit—s en el —p—rt—do —nteriorD se preE sent—n en el gu—dro UF Nombre Instancias Atributos Clases Drifts Tipo drift STAGGER 120 3 2 2 Abrupto SEA 50.000 3 2 3 AbruptoSEA Noise (20% ruido) 50.000 3 2 3 Abrupto LED 5.000 24 10 1 Abrupto LED Gradual 5.000 24 10 1 Gradual (w = 500, atributos=7) Waveform 10.000 21 3 1 Abrupto Waveform Gradual 10.000 21 3 1 Gradual (w = 500, atributos=10) Agrawal 30.000 9 2 9 Abrupto Elec 45.312 8 2 Desconocido Desconocido Forest 581.012 54 7 Desconocido Desconocido Poker 829.201 10 10 Desconocido Desconocido gu—dro UX gonjuntos de d—tos utiliz—dos en l— experiment—™ión …no de los hándi™—ps de nuestros métodos es l— ne™esid—d de est—˜le™er unos p—rámetros de entr—d— que v—n — in)uir en el result—do de l— dete™™ión de los ™—m˜ios de ™on™eptoF €—r— poder re—liz—r un— ™omp—r—tiv— en igu—ld—d de ™ondiE ™iones entre los distintos métodosD en primer lug—r hemos eje™ut—do un— ˜—terí— de prue˜—s ™on diferentes p—rámetros @ver gu—dro VA so˜re —lgun—s de l—s seE ™uen™i—s de d—tos sintéti™—s present—d—s en el gu—dro U p—r— intent—r lo™—liz—r —quellos ™onjuntos de p—rámetros que mejor se ™omport—n en tod—s l—s situ—™ioE nesF Método Drift Warning Ventana Histórico Total MoreErrorsMoving {2, 4, 8, 16} drift/2 {4,8,16,32} - 16 MaxMoving {2, 4, 8, 16} drift/2 {4,8,16,32} - 16 MovingAverage1 {2, 4, 8, 16} drift/2 {4,8,16,32} - 16 MovingAverage2 {0.04, 0.08, 0.16} drift/2 {4,8,16,32} {4,8,16,32} 48 MovingAverageH H1={2, 4, 8, 16} drift/2 {4,8,16,32} {4,8,16,32} 192 H2={0.04, 0.08, 0.16} gu—dro VX f—terí— de prue˜—s p—r— el —juste de p—rámetros pin—lmente hemos dete™t—do que h—y ™iertos p—rámetros que son los que mejor fun™ion—n en gener—l p—r— ™—d— métodoF ƒin em˜—rgoD en el ™—so del —lgoritmo wovingever—ge hí˜ridoD no hemos podido de™—nt—rnos por un sólo ™onjunto de RP
    • p—rámetros y— que l—s diferen™i—s tr—s —pli™—r uno u otro en l—s se™uen™i—s ded—tos de l— experiment—™ión er—n ˜—st—ntes signi(™—tiv—sD por lo que de™idimosqued—rnos ™on los dos ™onjuntos de p—rámetros que mejor se ™omport—˜—n y—pli™—rlos —l resto de se™uen™i—s @en l—s t—˜l—s de result—dos se muestr— solo elque mejor se ™omport—˜— en ™—d— ™—soAFin el gu—dro W se present—n los p—rámetros ™on los que se h—n re—liz—do los exEperimentosF edemás de nuestros métodosD t—m˜ién hemos in™orpor—do el hhwy ihhw que y— est—˜—n implement—dos en wyeD —sí ™omo un— eje™u™ión sinutiliz—r método de dete™™ión de ™—m˜ios p—r— poder —pre™i—r l— mejor— de renEdimientoF Método Drift Warning Ventana Histórico NoDetection - - - - MoreErrorsMoving 4 2 8 - MaxMoving 8 4 4 - MovingAverage1 4 2 32 - MovingAverage2 0.04 0.02 4 32 MovingAverageH 2 y 0.04 1 y 0.02 32 4 16 y 0.16 8 y 0.08 4 16 DDM 3·σ 2·σ - - EDDM 0.90 0.95 - - gu—dro WX f—terí— de prue˜—s p—r— l— experiment—™ión8.3. Resultadose ™ontinu—™ión se present—n los result—dos de l— eje™u™ión de los métodos so˜rel—s distint—s se™uen™i—s de d—tos present—d—s —nteriormenteF g—d— un— de l—st—˜l—s ™ontiene por (l—sX AUCX el áre— ˜—jo l— ™urv— de t—s—s de éxito —™umul—d—s norm—liz—d— entre el número de inst—n™i—sD de m—ner— que el interv—lo de l— medid— ™omprende v—lores entre H y IHHF Drifts (c/f)X el número de ™—m˜ios de ™on™epto ™orre™t—mente dete™t—dos frente — los f—lsos positivosF Distancia a DriftX el número de inst—n™i—s desde que se produjo el ™—m˜io de ™on™epto h—st— que se h— dete™t—do re—lmenteF ƒi ™ontiene el v—lor xyD se tr—t— de un f—lso neg—tivoF in el ™—so de l— se™uen™i— egr—w—l se h— ™—l™ul—do l— medi— de l— dist—n™i— — los ™—m˜ios p—r— evit—r in™luir W (l—s y f—™ilit—r l— le™tur—F‰ por ™olumn—sX NDX sin dete™™ión de ™—m˜io MA1X wovingever—ge @heurísti™— IA MEX woreirrorswoving MA2X wovingever—ge @heurísti™— PA MAXX w—xwoving MAHX wovingever—ge @heurísti™— hí˜rid—A DDMX método de tF q—m— et —lF EDDMX método de q—r™í—Ef—en— et —lF RQ
    • STAGGER Métodos ND ME MAX MA1 MA2 MAH DDM EDDM AUC 72,382 80,812 77,212 80,129 81,007 80,673 81,787 73,830 Drifts (c/f ) - 2/0 2/0 2/0 2/0 2/0 2/0 1/0 Distancia a Drift 1 - 6 16 9 4 3 6 NO Distancia a Drift 2 - 8 18 11 7 17 8 6gu—dro IHX ‚esult—dos de l— ev—lu—™ión de los distintos métodos so˜re l— seE™uen™i— ƒ„eqqi‚pigur— IWX „—s—s de —™ierto —™umul—d—s en prequenti—l p—r— l— se™uen™i— ƒ„eqEqi‚ RR
    • LED Métodos ND ME MAX MA1 MA2 MAH DDM EDDM AUC 83,505 94,933 94,839 94,878 93,937 94,988 94,839 94,825 Drifts (c/f ) - 1/0 1/0 1/0 1/0 1/0 1/0 1/0 Distancia a Drift 1 - 5 13 9 115 14 14 12gu—dro IIX ‚esult—dos de l— ev—lu—™ión de los distintos métodos so˜re l— seE™uen™i— vihpigur— PHX „—s—s de —™ierto —™umul—d—s en prequenti—l p—r— l— se™uen™i— vih RS
    • LED Gradual Métodos ND ME MAX MA1 MA2 MAH DDM EDDM AUC 83,283 91,331 92,004 90,301 92,422 92,337 92,483 91,525 Drifts (c/f ) - 1/2 1/3 1/4 1/1 1/0 1/1 1/1 Distancia a Drift 1 - 447 192 7 315 194 50 91gu—dro IPX ‚esult—dos de l— ev—lu—™ión de los distintos métodos so˜re l— seE™uen™i— vih qr—du—lpigur— PIX „—s—s de —™ierto —™umul—d—s en prequenti—l p—r— l— se™uen™i— vihqr—du—l RT
    • SEA Métodos ND ME MAX MA1 MA2 MAH DDM EDDM AUC 92,201 93,069 92,212 90,607 92,117 93,723 94,238 93,969 Drifts (c/f ) - 2/0 1/0 3/334 0/2 2/1 3/6 3/7 Distancia a Drift 1 - 7.232 NO 21 NO 1.575 698 944 Distancia a Drift 2 - NO NO 89 NO NO 627 1.352 Distancia a Drift 3 - 61 10.032 18 NO 246 181 415gu—dro IQX ‚esult—dos de l— ev—lu—™ión de los distintos métodos so˜re l— seE™uen™i— ƒiepigur— PPX „—s—s de —™ierto —™umul—d—s en prequenti—l p—r— l— se™uen™i— ƒie RU
    • SEA Noise Métodos ND ME MAX MA1 MA2 MAH DDM EDDM AUC 77,256 74,382 76,124 70,238 76,252 75,558 78,129 76,920 Drifts (c/f ) - 3/128 3/62 3/460 0/19 3/94 3/0 2/10 Distancia a Drift 1 - 268 701 89 NO 1.966 2.493 NO Distancia a Drift 2 - 861 1.348 146 NO 1.969 1.482 6.473 Distancia a Drift 3 - 58 2.158 19 NO 14 3.863 1.570gu—dro IRX ‚esult—dos de l— ev—lu—™ión de los distintos métodos so˜re l— seE™uen™i— ƒie xoisepigur— PQX „—s—s de —™ierto —™umul—d—s en prequenti—l p—r— l— se™uen™i— ƒiexoise RV
    • Agrawal Métodos ND ME MAX MA1 MA2 MAH DDM EDDM AUC 63,369 72,072 72,814 69,608 71,499 72,863 69,590 71,268 Drifts (c/f ) - 9/79 8/35 9/285 8/51 9/30 6/3 8/33 Distancia media - 25,33 231,38 58,67 372,13 144 348,17 374,75 a drifts (1 NO) (1 NO) (3 NO) (1 NO)gu—dro ISX ‚esult—dos de l— ev—lu—™ión de los distintos métodos so˜re l— seE™uen™i— egr—w—lpigur— PRX „—s—s de —™ierto —™umul—d—s en prequenti—l p—r— l— se™uen™i— egr—w—l RW
    • Waveform Métodos ND ME MAX MA1 MA2 MAH DDM EDDM AUC 77,541 79,244 79,792 76,798 79,078 78,462 79,912 78,938 Drifts (c/f ) - 1/23 1/8 1/58 1/1 1/24 1/0 1/4 Distancia a Drift 1 - 181 1.841 204 372 1.050 121 350gu—dro ITX ‚esult—dos de l— ev—lu—™ión de los distintos métodos so˜re l— seE™uen™i— ‡—veformpigur— PSX „—s—s de —™ierto —™umul—d—s en prequenti—l p—r— l— se™uen™i— ‡—veEform SH
    • WaveformGradual Métodos ND ME MAX MA1 MA2 MAH DDM EDDM AUC 77,528 79,029 79,611 79,532 79,031 78,302 79,671 79,981 Drifts (c/f ) - 1/24 1/10 1/57 1/1 1/24 1/1 1/6 Distancia a Drift 1 - 150 156 3 637 156 332 551gu—dro IUX ‚esult—dos de l— ev—lu—™ión de los distintos métodos so˜re l— seE™uen™i— ‡—veform qr—du—lpigur— PTX „—s—s de —™ierto —™umul—d—s en prequenti—l p—r— l— se™uen™i— ‡—veEform qr—du—l SI
    • Elec Métodos ND ME MAX MA1 MA2 MAH DDM EDDM AUC 76,195 87,087 84,908 86,776 85,890 86,688 82,583 85,740 Drifts - 349 165 635 579 832 143 203gu—dro IVX ‚esult—dos de l— ev—lu—™ión de los distintos métodos so˜re l— seE™uen™i— ile™pigur— PUX „—s—s de —™ierto —™umul—d—s en prequenti—l p—r— l— se™uen™i— ile™ SP
    • Forest Métodos ND ME MAX MA1 MA2 MAH DDM EDDM AUC 67,006 87,828 85,589 88,474 87,898 88,421 86,606 85,012 Drifts - 4.905 2.615 7.939 7.819 9.505 4.634 2.416gu—dro IWX ‚esult—dos de l— ev—lu—™ión de los distintos métodos so˜re l— seE™uen™i— porestpigur— PVX „—s—s de —™ierto —™umul—d—s en prequenti—l p—r— l— se™uen™i— porest SQ
    • Poker Métodos ND ME MAX MA1 MA2 MAH DDM EDDM AUC 59,103 79,826 78,041 79,877 80,421 80,779 65,846 78,120 Drifts - 7.179 3.759 12.474 14.457 16.558 433 4.863gu—dro PHX ‚esult—dos de l— ev—lu—™ión de los distintos métodos so˜re l— seE™uen™i— €okerpigur— PWX „—s—s de —™ierto —™umul—d—s en prequenti—l p—r— l— se™uen™i— €oker SR
    • Resumen de resultados€—r— poder s—™—r ™on™lusiones so˜re los result—dosD hemos tom—do ™omo refeEren™i— l— medid— de e…g o˜tenid— tr—s —pli™—r ™—d— método — l—s diferentesse™uen™i—sF esimismo hemos —grup—do los result—dos según el tipo de se™uen™i—y o˜tenido l— medi— de l—s posi™iones de ™—d— método orden—d—s de m—yor —menor v—lor de e…gF Secuencias con cambios abruptosX en el gu—dro PI se puede —pre™i—r que si ˜ien los que más vi™tori—s o˜tienen son hhw y werD el mejor v—lor medio lo o˜tiene el método woreirrorswovingF en—liz—ndo más en det—lle l—s t—˜l—s de result—dos —nterioresD podemos ver que woreirrorswoving es un método muy re—™tivo ™—p—z de dete™t—r los ™—m˜ios de ™on™epto rápid—mente — l— luz de l—s dist—n™i—s ™ort—s —l drift @ver gu—dros IQ y ISAD esto permite —vis—r pronto —l modelo su˜y—™ente que es ne™es—rio re—prender ™on los d—tos del nuevo ™on™eptoF Secuencia ND ME MAX MA1 MA2 MAH DDM EDDM STAGGER 8 2 6 4 5 3 1 7 SEA 6 4 5 8 7 3 1 2 LED 8 2 4 3 7 1 5 6 Waveform 8 3 2 6 4 7 1 5 Agrawal 8 3 2 6 4 1 7 5 Media 7,6 2,8 3,8 5,4 5,4 3 3 5gu—dro PIX €osi™ión de ™—d— método según el e…g p—r— ™—d— se™uen™i— de d—tos™on ™—m˜ios —˜ruptos Secuencias con cambios gradualesX en este ™—so podemos ver en el gu—dro PP que los métodos hhw y ihhw son los que mejor se ™omport—n en est—s situ—™ionesF uizás l— ™—us— de que nuestr—s propuest—s no se—n mejores puede de˜erse — que en el —juste de p—rámetros que se re—lizó ini™i—lmente solo se tuvieron en ™uent— se™uen™i—s ™on ™—m˜ios —˜ruptos y en estos ™—sos l— ™on(gur—™ión — —pli™—r pudier— ser diferenteD y— que si —n—liz—mos l—s t—˜l—s de result—dos de est—s se™uen™i—s nos d—mos ™uent— de que sí dete™t—n los ™—m˜ios ™orre™t—mente pero el prin™ip—l pro˜lem— es que se d—n más f—lsos positivos que en sus ™ompetidoresF Secuencia ND ME MAX MA1 MA2 MAH DDM EDDM LED Gradual 8 6 4 7 2 3 1 5 Waveform Gradual 8 6 3 4 5 7 2 1 Media 8 6 3,5 5,5 3,5 5 1,5 3gu—dro PPX €osi™ión de ™—d— método según el e…g p—r— ™—d— se™uen™i— de d—tos™on ™—m˜ios gr—du—les Secuencias con ruidoX solo hemos tenido l— oportunid—d de experimenE t—r ™on un— se™uen™i— de d—tos ™on ruidoD por lo que quizás no se— dem—E si—do signi(™—tiv—D pero querí—mos dest—™—r que s—lvo en hhwD el resto SS
    • de métodos o˜tienen un peor result—do que sin utiliz—r un —lgoritmo de dete™™ión de ™—m˜iosF en—liz—ndo el gu—dro IR podemos ver que el ex™eso de f—lsos positivos de˜ido — sensi˜ilid—d —l ruido son los que merm—n los result—dosF uizás ™on un —juste de p—rámetros más —de—™u—do —l ruido se podrí—n o˜tener mejores result—dosF Secuencia ND ME MAX MA1 MA2 MAH DDM EDDM SEA Noise 2 7 5 8 4 6 1 3gu—dro PQX €osi™ión de ™—d— método según el e…g p—r— ™—d— se™uen™i— de d—tos™on ruido Secuencias con datos realesX en el gu—dro PR se dest—™— que el método wovingever—ge ™on l— primer— heurísti™— y l— hi˜rid—™ión es el que mejor se ™omport—F il des™ono™imiento del número de ™—m˜iosD —sí ™omo su posi™iónD nos impide —n—liz—r más det—ll—d—mente los result—dosF Secuencia ND ME MAX MA1 MA2 MAH DDM EDDM Elec 8 1 6 2 4 3 7 5 Forest 8 4 6 1 3 2 5 7 Poker 8 4 6 3 2 1 7 5 Media 8 3 6 2 3 2 6,3 5,7gu—dro PRX €osi™ión de ™—d— método según el e…g p—r— ™—d— se™uen™i— de d—tosre—les ST
    • 9. Conclusión y trabajo futuroe lo l—rgo de este tr—˜—jo hemos present—do l— minerí— de se™uen™i—s de d—tos ysus diferen™i—s frente — l— minerí— de d—tos tr—di™ion—lD —sí ™omo los ™—mpos de l—industri— en los que es ne™es—rio —pli™—r este tipo de —lgoritmosF …no de los retos— los que se enfrent—D es l— ™l—si(™—™ión de se™uen™i—s de d—tos donde se puedenprodu™ir ™—m˜ios de ™on™eptoD por lo que hemos present—do un— t—xonomí— delos métodos existentes y hemos —˜ord—do —lgunos de ellos más en det—lleF€—rtiendo de l—s propuest—s más re™ientes en l— liter—tur— de métodos de deEte™™ión de ™—m˜ios en —prendiz—je ™on disp—r—doresD hemos he™ho v—ri—s —porEt—™iones ˜—s—d—s un—s en monitoriz—r l—s t—s—s de éxito de ™l—si(™—™ión y otroen t—s—s de erroresF €—r— (n—liz—rD hemos re—liz—do un estudio experiment—l p—Er— ™ompro˜—r l— e(™—™i— de nuestros métodos ™on respe™to — los dos métodosde referen™i— —jenos implement—dos en el softw—re wyeD que t—m˜ién hemospresent—do en el tr—˜—joFhe ™—r— — re—liz—r l— experiment—™iónD uno de los pro˜lem—s que nos en™ontr—mos— l— hor— de h—™er ™omp—r—™iones entre —lgoritmos de dete™™ión de drift de l—liter—tur—D —demás de l— no disponi˜ilid—d del ™ódigo fuenteD es que no se us—nl—s mism—s métri™—s o métodos de ev—lu—™ión ni tr—˜—j—n so˜re l—s mism—sse™uen™i—s de d—tosD ni los mismos ™onjuntos de testF €or elloD hemos tenidoque estudi—r l—s diferentes té™ni™—s de ev—lu—™ión y sent—r l—s ˜—ses p—r— l—experiment—™iónFil —nálisis de los result—dos glo˜—les de rendimiento de nuestr—s propuest—s h—puesto de m—ni(esto que —unque nuestros métodos son ™ompetitivos respe™to —los métodos de referen™i—D son sensi˜les — los v—lores de los p—rámetros est—˜leE™idos — prioriF €or ello se h—™e ne™es—rio estudi—r un— form— de estim—r — priorilos p—rámetros de eje™u™ión —sí ™omo permitir que se —d—pten dinámi™—mentedur—nte el pro™es—miento de l—s se™uen™i—sFTrabajos futurosgomo primer o˜jetivoD y— men™ion—do es — p—rtir de l—s se™uen™i—s de erroresy —™iertos ini™i—les d—d—s por un ™l—si(™—dor el—˜or—r —lgún me™—nismo de estiEm—™ión los p—rámetros — priori de nuestros métodosF isto esD estim—r v—lores de—n™hur— de vent—n—D nivel de w—rning y driftD respe™tiv—mente los p—rámetros nDk y d y —di™ion—lmente gr—do de su—viz—do mD y por™ent—je de ™—íd— u y v p—r—el método hí˜ridoFytro o˜jetivo es el de des—rroll—r un —lgoritmo de —prendiz—je in™rement—lD ˜—Es—do en redes ˜—yesi—n—s sen™ill—s por r—zones de e(™ien™i—D que permit— ™—m˜iosp—r™i—les del modeloF ‰— que en l—s se™uen™i—s re—les los ™—m˜ios no son siempre˜rus™osD y en ™—so de serloD no suponen un ™—m˜io r—di™—l del modeloD sino quese m—ntiene p—rte del modelo —nterior ™on —lgun—s —lter—™ionesF vos métodos—™tu—les de ™l—si(™—™ión so˜re se™uen™i—s ™on dete™tores de drifts dese™h—n elmodelo —nterior y —prenden uno nuevo desde ™ero ™on inst—n™i—s provenientesdel nuevo ™on™eptoF€or últimoD tr—t—r de ™—r—™teriz—r l— es™—l— del ™—m˜io de ™on™epto p—r— in™orEpor—rlo en nuestro método de dete™™ión de driftF isto esD no sólo inform—r del SU
    • ™—m˜io en un punto determin—doD sino de qué tipo de ™—m˜io se tr—t— y ™onqué gr—do se produ™eF isto serí— útil en primer lug—rD p—r— —pli™—r distintos meE™—nismos de olvido independientemente del —lgoritmo de —prendiz—jeF in ™—sode tr—t—rse de un ™—m˜io ˜rus™oD se olvid— el modelo —nterior y se —prende ™onl— por™ión de se™uen™i— —lm—™en—d— desde que se —™tivó del nivel de —visoF ƒinem˜—rgo si el ™—m˜io es gr—du—lD h—˜rí— que dese™h—r de l— por™ión de se™uenE™i— —lm—™en—d— @donde se entremez™l—n muestr—s del —ntiguo y nuevo ™on™eptoA—quell—s muestr—s que pertene™en —l —ntiguo ™on™eptoD p—r— —ument—r el éxito enel —prendiz—je del nuevo modeloD útil so˜re todo si el ™—m˜io se dete™t— prontoFin segundo lug—rD t—m˜ién podrí— ser útil ™omo me™—nismo de dete™™ión implíE™ito — nuestro —lgoritmo de ™l—si(™—™ión so˜re redes ˜—yesi—n—sD de form— que el—lgoritmo dete™t—r— l— por™ión del modelo que se vier— —fe™t—d—F SV
    • 10. BibliografíaReferencias‘eerHV“ g en—gnostopoulosD x w ed—msD —nd h t r—ndF he™iding wh—t to o˜serve nextX —d—ptive v—ri—˜le sele™tion for regression in multiv—ri—te d—t— stre—msF sn WeatherD volume PD p—ges WTI! WTSF egwD PHHVF‘esƒWQ“ ‚F egr—w—lD „F smielinskiD —nd —F ƒw—miF h—t—˜—se miningX — perform—n™e perspe™tiveF IEEE Transactions on Knowledge and Data EngineeringD S@TAXWIR!WPSD IWWQF‘fpr+ IH“ ‚em™o ‚ fou™k—ertD ii˜e pr—nkD w—rk e r—llD qeorey rolE mesD fernh—rd €f—hringerD €eter ‚eutem—nnD —nd s—n r ‡ittenF ‡iueX ixperien™es with — t—v— ypenEƒour™e €roje™tF Journal of Machine Learning ResearchD IIXPSQQ!PSRID PHIHF‘fpr€IH“ el˜ert fifetD ii˜e pr—nkD qeo rolmesD —nd ferh—rd €f—hrinE gerF e™™ur—te ensem˜les for d—t— stre—msX gom˜ining restri™ted roeding trees using st—™kingF sn 2nd Asian Conference on Machine Learning (ACML2010)D p—ges I!ITD PHIHF‘fpyƒVR“ v freim—nD t r priedm—nD ‚ e ylshenD —nd g t ƒtoneF Classi- cation and Regression TreesD volume IW of Statistics/Probability SeriesF ‡—dsworthD IWVRF‘fqHU“ el˜ert fifet —nd ‚F q—v—ld—F ve—rning from timeE™h—nging d—t— with —d—ptive windowingF sn In SIAM International Conference on Data MiningD PHHUF‘fqdgep+ HT“ wF f—en—Eq—r™í—D tF del g—mpoEÁvil—D ‚F pid—lgoD el˜ert fifetD ‚F q—v—ld—D —nd ‚F wor—lesEfuenoF i—rly drift dete™tion metE hodF sn Fourth International Workshop on Knowledge Discovery from Data StreamsD p—ges UU!VTF giteseerD PHHTF‘fru€IH“ el˜ert fifetD qeo rolmesD ‚i™h—rd uirk˜yD —nd fernh—rd €f—hE ringerF wye X w—ssive ynline en—lysisF Journal of Machine Learning ResearchD IIXITHI!ITHRD PHIHF‘fr€+ HW“ el˜ert fifetD qeo rolmesD fernh—rd €f—hringerD ‚i™h—rd uirk˜yD —nd ‚i™—rd q—v—ldàF xew ensem˜le methods for evolE ving d—t— stre—msF sn Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mi- ning - KDD 09D p—ges IQW!IRVD xew ‰orkD xew ‰orkD …ƒeD PHHWF egw €ressF‘fr€IH“ el˜ert fifetD qeo rolmesD —nd fernh—rd €f—hringerF vever—E ging f—gging for ivolving h—t— ƒtre—msF Machine Learning and Knowledge Discovery in DatabasesD @IAXIQS!ISHD PHIHF‘fuHW—“ el˜ert fifet —nd ‚i™h—rd uirk˜yF h—t— stre—m miningF „e™hni™—l ‚eport eugustD …niversity of ‡—ik—toD PHHWF SW
    • ‘fuHW˜“ el˜ert fifet —nd ‚i™h—rd uirk˜yF w—ssive ynline en—lysisF „eE ™hni™—l ‚eport eugustD …niversity of ‡—ik—toD PHHWF‘fvHT“ h—vid w flei —nd tohn h v—ertyF hyn—mi™ topi™ modelsF sn Proceedings of the 23rd international conference on Machine learning ICML 06D num˜er ID p—ges IIQ!IPHF egw €ressD PHHTF‘fwHV“ ƒ r f—™h —nd w—r™us e w—loofF €—ired ve—rners for gon™ept hriftF sn Proceedings of the 2008 Eighth IEEE International Conference on Data MiningD p—ges PQ!QPF hep—rtment of gomE puter ƒ™ien™eD qeorgetown …niversityD siii gomputer ƒo™iety ‡—shingtonD hgD …ƒeD PHHVF‘frzIH“ h—riusz frzezinskiF Mining data streams with concept driftF €hh thesisD €ozn—n …niversity of „e™hnologyD PHIHF‘g—sHV“ qF g—stilloF ed—ptive le—rning —lgorithms for f—yesi—n network ™l—ssi(ersF AI Commun.D p—ges VU!VVD PHHVF‘gqHT“ ql—dys g—stillo —nd toão q—m—F en ed—ptive €requenti—l ve—rE ning pr—mework for f—yesi—n xetwork gl—ssi(ersF Knowledge Discovery in Databases PKDD 2006D RPIQXTU!UVD PHHTF‘gww+ HS“ h—rryl gh—rlesD w w™xeillD w w™elisterD w fl—™kD e wooE reD u ƒtringerD t uü™kli™hD —nd e uerrF €l—yerEgentred q—me hesignX €l—yer wodelling —nd ed—ptive higit—l q—mesF sn Pro- ceedings of DiGRA 2005 Conference Changing Views-Worlds in PlayD volume PVSD p—ges PVS!PWVF giteseerD giteseerD PHHSF‘gHR“ p—ng ghu —nd g—rlo —nioloF p—st —nd vight foosting for ed—pE tive wining of h—t— ƒtre—msF sn In PAKDDD volume QHSTD p—ges PVP!PWPF ƒpringer †erl—gD PHHRF‘h—wVR“ e € h—widF ƒt—tisti™—l „heoryX „he €requenti—l eppro—™hF Journal of the Royal Statistical Society AD IRU@PAXPUV!PWPD IWVRF‘honHR“ ƒteve honohoF i—rly dete™tion of insider tr—ding in option m—rE ketsF sn Proceedings of the 2004 ACM SIGKDD international conference on Knowledge discovery and data mining KDD 04D p—ge RPHF egw €ressD PHHRF‘h‡uWV“ „hom—s qF hietteri™hD qerh—rd ‡idmerD —nd wirosl—v uu˜—tF ƒpe™i—l issue on ™ontext sensitivity —nd ™on™ept driftF Machine LearningD QP@PAD eugust IWWVF‘porHT“ qeorge porm—nF „—™kling ™on™ept drift ˜y tempor—l indu™tive tr—nsferF sn Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrievalD p—ges PSP!PSWF egw €ressD PHHTF‘qqHU“ w q—˜er —nd toão q—m—F ƒt—teEofEtheE—rt in d—t— stre—m miE ningF sn ECMLD PHHUF TH
    • ‘qwg‚HR“ toão q—m—D €edro wed—sD ql—dys g—stilloD —nd €edro ‚odriE guesF ve—rning with hrift hete™tionF Machine LearningD p—ges PVT!PWSD PHHRF‘qƒ—‚HW“ toão q—m—D ‚—quel ƒe˜—stiãoD —nd €edro €ereir— ‚odriguesF ssE sues in ev—lu—tion of stre—m le—rning —lgorithmsF sn Proceedings of the 15th ACM SIGKDD international conference on Know- ledge discovery and data mining - KDD 09D p—ge QPWD xew ‰orkD xew ‰orkD …ƒeD PHHWF egw €ressF‘qƒgwHU“ ƒus—n q—u™hD wir™o ƒperett—D er—vind gh—ndr—mouliD —nd elesE s—ndro wi™—relliF …ser €ro(les for €erson—lized snform—tion e™E ™essF Articial IntelligenceD RQPIXSR!VWD PHHUF‘rƒhHI“ qeo rultenD v—urie ƒpen™erD —nd €edro homingosF wining timeE™h—nging d—t— stre—msF sn Proceedings of the seventh ACM SIGKDD international conference on Knowledge discovery and data mining KDD 01D volume I of KDD 01D p—ges WU!IHTF egw €ressD PHHIF‘ufdqHR“ h—niel uiferD ƒh—i fenEd—vidD —nd toh—nnes qehrkeF hete™ting gh—nge in h—t— ƒtre—msF sn Proceedings of the Thirtieth in- ternational conference on Very large data basesD p—ges IVH!IWID PHHRF‘ureWW“ wFqF uellyD hFtF r—ndD —nd xFwF ed—msF „he imp—™t of ™h—nE ging popul—tions on ™l—ssi(er perform—n™eF sn Proceedings of the fth ACM SIGKDD international conference on Knowledge discovery and data miningD volume QPD p—ges QTU!QUIF egwD IWWWF‘uwHU“ t i™o uolter —nd w—r™us e w—loofF hyn—mi™ ‡eighted w—joE rity X en insem˜le wethod for hrifting gon™eptsF Journal of Machine Learning ResearchD VXPUSS!PUWHD PHHUF‘uoyHH“ s uoy™hevF qr—du—l porgetting for ed—pt—tion to gon™ept hriftF sn Proceedings of ECAI 2000 Workshop Current Issues in Spa- tioTemporal ReasoningD p—ges IHI!IHTF giteseerD giteseerD PHHHF‘u‚WV“ ‚—lf ulinken˜erg —nd sngrid ‚enzF ed—ptive snform—tion pilteE ringX ve—rning hrifting gon™eptsF Articial IntelligenceD IWWVF‘uunHV“ vudmil— s uun™hev—F gl—ssi(er insem˜les for hete™ting gonE ™ept gh—nge in ƒtre—ming h—t—X yverview —nd €erspe™tivesF sn In 2nd Workshop SUEMA 2008 (ECAI 2008)D num˜er tulyD p—E ges S!WD PHHVF‘vfWW“ „err—n v—ne —nd g—rl— i frodleyF „empor—l sequen™e le—rning —nd d—t— redu™tion for —nom—ly dete™tionF ACM Transactions on Information and System SecurityD P@QAXPWS!QQID IWWWF‘vrgHV“ xe—l v—thi—D ƒtephen r—ilesD —nd vi™i— g—pr—F kxx gpX — temE por—l so™i—l networkF sn €e—rl €uD herek q fridgeD f—msh—d wo˜—sherD —nd pr—n™es™o ‚i™™iD editorsD Information Systems JournalD p—ges PPU!PQRF egwD PHHVF TI
    • ‘v€puHU“ v vi—oD h €—ttersonD h poxD —nd r u—utzF ve—rning —nd inE ferring tr—nsport—tion routinesF Articial IntelligenceD IUI@SE TAXQII!QQID PHHUF‘wxWV“ endrew w™™—llum —nd u—m—l xig—mF e gomp—rison of ivent wodels for x—ive f—yes „ext gl—ssi(™—tionF Dimension Con- temporary German Arts And LettersD USPXRI!RVD IWWVF‘wƒthHW“ to—o wendes woreir—D g—rlos ƒo—resD elipio w torgeD —nd torge preire he heF „he ie™t of †—rying €—r—meters —nd po™using on fus „r—vel „ime €redi™tionF sn „h—n—ruk „heer—munkongD foonserm uijsirikulD xi™k ger™oneD —nd „u f—o roD editorsD Advances in Knowledge Discovery and Data Mining Proceedings of the 13th PacicAsia Conference on Knowledge Discovery and Data Mining PAKDD 2009D volume SRUT of Lecture Notes in Articial IntelligenceD p—ges TVW!TWTF ƒpringerD PHHWF‘xuHI“ ‡F xi™k ƒtreet —nd ‰ongƒeog uimF e ƒtre—ming insem˜le elE gorithm @ƒieA for v—rgeEƒ™—le ™l—ssi(™—tionF sn Proceedings of the seventh ACM SIGKDD international conference on Know- ledge discovery and data miningD p—ges QUU!QVPF egw €ressD PHHIF‘xnpwHU“ w xúñezD ‚ pid—lgoD —nd ‚ wor—lesF ve—rning in invironments with …nknown hyn—mi™sX „ow—rds more ‚o˜ust gon™ept ve—rE nersF Journal of Machine Learning ResearchD VXPSWS!PTPVD PHHUF‘yz—HS“ x g yz—F ynline f—gging —nd foostingF sn 2005 IEEE Interna- tional Conference on Systems Man and CyberneticsD volume QD p—ges PQRH!PQRSF giteseerD seeeD PHHSF‘€—gSR“ i ƒ €—geF gontinuous snspe™tion ƒ™hemesF BiometrikaD RI@IGPAXIHH!IISD IWSRF‘€ruHU“ fernh—rd €f—hringerD qeorey rolmesD —nd ‚i™h—rd uirk˜yF xew options for hoeding treesF sn AI 2007: Advances in Arti- cial IntelligenceD volume RVQHD p—ges WH!WWF ƒpringer ferlin G reidel˜ergD PHHUF‘€ruHV“ w—jid €ourk—sh—niD ƒ—tt—r r—shemiD —nd woh—mm—drez— u—nE g—v—riF …sing gellul—r eutom—t— to smprove h—t— ƒtre—m gl—sE si(™—tionF sn AICCSA08 Databases and Data Mining TrackD PHHVF‘€wqHW“ wi™h—el t €ro™opioD t—ne wullig—nD —nd qreg qrudi™F ve—rning terr—in segment—tion with ™l—ssi(er ensem˜les for —utonomous ro˜ot n—vig—tion in unstru™tured environmentsF Journal of Field RoboticsD PT@PAXIRS!IUSD PHHWF‘‚gHW“ €—ris— ‚—shidi —nd hi—ne t gookF ueeping the ‚esident in the voopX ed—pting the ƒm—rt rome to the …serF IEEE Tran- sactions on Systems Man and Cybernetics Part A Systems and HumansD QW@SAXWRW!WSWD PHHWF TP
    • ‘‚o˜SW“ ƒ ‡ ‚o˜ertsF gontrol ™h—rt tests ˜—sed on geometri™ moving —ver—gesF TechnometricsD RP@IAXPQW!PSHD IWSWF‘‚‚HU“ € ‚—vikum—r —nd † ‚—viF f—nkrupt™y predi™tion in ˜—nks —nd (rms vi— st—tisti™—l —nd intelligent te™hniques E e reviewF Euro- pean Journal Of Operational ResearchD IVH@IAXI!PVD PHHUF‘ƒqVT“ terey g ƒ™hlimmer —nd ‚i™h—rd r qr—ngerF sn™rement—l le—rE ning from noisy d—t—F Machine LearningD I@QAXQIU!QSRD IWVTF‘ƒuHU“ w—rtin ƒ™holz —nd ‚—lf ulinken˜ergF foosting gl—ssi(ers for hrifting gon™eptsF Intelligent Data AnalysisD II@IAXI!RHD PHHUF‘ƒvƒWW“ x—deem ehmed ƒyedD ru—n viuD —nd u—h u—y ƒungF r—ndling ™on™ept drifts in in™rement—l le—rning with support ve™tor m—E ™hinesF sn Proceedings of the fth ACM SIGKDD international conference on Knowledge discovery and data mining KDD 99D p—ges QIU!QPIF egw €ressD IWWWF‘ƒƒHV“ f—i ƒu —nd ‰iEhong ƒhenF wodeling ™on™ept drift from the perspe™tive of ™l—ssi(ersF 2008 IEEE Conference on Cybernetics and Intelligent SystemsD p—ges IHSS!IHTHD PHHVF‘ƒƒƒƒgHU“ ƒh—i ƒh—levEƒhw—rtzD ‰or—m ƒingerD x—ti ƒre˜roD —nd endrew gotterF €eg—sosX €rim—l istim—ted su˜Eqredient ƒylver for ƒ†wF CorpusD PXVHU!VIRD PHHUF‘ƒt—HQ“ uenneth y ƒt—nleyF ve—rning gon™ept hrift with — gommittee of he™ision „reesF Computer Science Department University of TexasD @gd™AXI!IUD PHHQF‘„€g€HV“ e „sym˜—lD w €e™henizkiyD € gunningh—mD —nd ƒeppo €uuE ronenF hyn—mi™ integr—tion of ™l—ssi(ers for h—ndling ™on™ept driftF Information FusionD W@IAXST!TVD PHHVF‘†xII“ €eri—s—my †ivek—n—nd—n —nd ‚—ju xedun™hezhi—nF wining d—E t— stre—ms with ™on™ept drifts using geneti™ —lgorithmF Articial Intelligence ReviewD QT@QAXITQ!IUVD pe˜ru—ry PHIIF‘†yq+ HV“ ‚—ng— ‚—ju †—ts—v—iD ylufemi e ymit—omuD to—o q—m—D xiE tesh † gh—wl—D woh—med wedh—t q—˜erD —nd euroop ‚ q—nE gulyF unowledge dis™overy from sensor d—t— @ƒensoruhhAF ACM SIGKDD Explorations NewsletterD IH@PAXTVD PHHVF‘‡qgHT“ frent ‡enerstrom —nd ghristophe qir—udEg—rrierF „empor—l h—t— wining in hyn—mi™ pe—ture ƒp—™esF sn Sixth International Conference on Data Mining ICDM06D num˜er w—yD p—ges IIRI! IIRSF seeeD PHHTF‘‡uWT“ qerh—rd ‡idmer —nd wirosl—v uu˜—tF ve—rning in the €resenE ™e of gon™ept hrift —nd ridden gontextsF Machine LearningD HIXTW!IHID IWWTF TQ
    • ‘‰‡HV“ ‰ ‰—ngD ˆ ‡uD —nd ˆ huF gon™eptu—l equiv—len™e for ™ontr—st mining in ™l—ssi(™—tion le—rningF Data & Knowledge Enginee- ringD TU@QAXRIQ!RPWD PHHVF‘liIH—“ sndre lio˜—iteF Adaptive Training Set FormationF €hh thesisD †ilnius …niversityD PHIHF‘liIH˜“ sndre lio˜—iteF ve—rning under gon™ept hriftX —n yverviewF „e™hni™—l reportD PHIHF‘ƒHV“ €eng h—ngD ˆingqu—n huD —nd ‰ong ƒhiF g—tegorizing —nd mining ™on™ept drifting d—t— stre—msF sn Proceeding of the 14th ACM SIGKDD international conference on Knowledge disco- very and data mining KDD 08D volume HVp—gesD p—ges VIP!VPHF egw €ressD PHHVF TR