WebSite Visit Forecasting Using Data Mining TechniquesChandana Napagoda
Data mining is a technique which is used for identifying relationships between various large amounts of data in many areas including scientific research, business planning, traffic analysis, clinical trial data mining etc. This research will be researching applicability of data mining techniques in web site visit prediction domain. Here we will be concentrating on time series regression techniques which will be used to analyse and forecast time dependent data points. Then how those techniques will be applied to forecast web site visits will be explained.
2. Índex
1. Les xarxes informàtiques
2. Les xarxes d'àrea local
2.1.L'estructura duna LAN
2.2.Dispositius electrònics d'interconnexió
2.3.L'encaminador
2.4.El cablejat estructurat
2.5.La fibra òptica
2.6.Protocols de xarxa
3.Relació dels equips en una xarxa
3.1.Equips sense Micreosoft Windows
4.Anàlisi d'una xarxa existent
4.1.Intruccions de consola
5.Recursos compartits
5.1.Comptes d'usuari
3. 1.Les xarxes informàtiques
Una xarxa informàtica està constituïda per un conjunt d’ordinadors i altres
dispositius,conectats per mitjans físics o sense fil, ab l’objectiu de compartir uns recursos
determinats.Aquests poden ser de maquinari(hardware) que comprèn impresores… o
deprogramari (software) com per exemple arxius, dades…
Sgons les dimensions de les xarxes poden ser:
•Xarxes locals :que engloben àrees reduïdes,com una oficina.
•Xarxes d’àrea estesa que engloben àrees geogràfiques més grans.
Segons la relacióo que sèstableix entre els difernets ordinadors podem tenir:
•Xarxes amb servidor: els recursos compartits es troben a un sol ordinador o un nombre
reduït d’ordinadors, i gestionen l’ús de recursis i els permisos per utilitzar-los.
•Xarxes igualitàries: tots els ordinadors poden compartir i utilitzar recursos.
La connexió dels diferents dispositius es pot fer a travésde mitjans físics o sense fil.
4. 2. Les xarxes d’àrea local
Estructura d’una LAN
•Les tipologies més utilitzades actualment en l’estructura d’una LAN són les anomenades
en estrella i en arbre, on la informació surt dels diferents equips i viatja a través del
cablejat fins a arribar a un dispositiu electrònic d’interconnexió que controla el trànsit
d’informació.
•- La targeta de xarxa: és la interfície que permet connectar el nostre equip a la xarxa.
S’instal.la per a les ranures d’expansió del nostre equip a través del port USB.
•Cada targeta té un identificador hexadecimal únic de 6 bytes anomenat MAC.
Elements d’una LAN:
- Targeta de xarxa.
- Dispositius electrònics d’interconnexió.
- L’encaminador.
- El cablejat estructurat.
5. Dispositius electrònics d’interconnexió
Un dispositius que centralitzen tot el cablejat d’una xarxa en estrella o en arbre.
Ha de tenir com a mínim tants punts de connexió o ports com equips vulguem connectar a
la nostra xarxa. Tenim dos dispositius anomenats concentrador i commutador.
- Un concentrador quan rep un paquet de dades per un port, el transmet a la
resta. Això provoca que la informació no la rebi només l’equip al qual va adreçada, sinó
també a la resta.
- Un commutador emmagatzema l’adreça MAC de tots els equips que estan
connectats a cadascun dels seus ports. Quan rep un paquet per un port, mira l’adreça
MAC on va adreçat i reenvia el paquet pel port que correspon a l’adreça MAC, deixant la
resta lliure de trànsit.
L’encaminador
També anomenat router en anglès, és un dispositiu destinat a interconnectar
diferents xarxes entre si. Per exemple, una LAN amb una WAN o amb Internet.
6. El cablejat estructurat
És el suport físic o mitjà per on viatja la informació dels equips fins als concentradors o
commutadors. Aquesta informació es pot transmetre a través de senyals elèctrics, o a
través de la llum.
- El cable de parells trenat : és el cable més utilitzat actualment per a xarxes locals. Està
format per quatre parells de fils. Cada parell va trenar per evitar interferències
radioelèctriques. La quantitat de vegades que gira sobre si mateix en fer el trenat
s’anomena categoria i determina les prestacions del cable.
Els problemes que presenten aquest tipus de cables són l’atenuació, que és la pèrdua de
senyal produïda en la propagació del senyal a través del cable, i les pertorbacions
electromagnètiques produïdes per aparells elèctrics, que afecten els senyals transmesos.
Als extrems del cable és necessari posar-hi un connector, anomenat RJ-45, capaç de
connectar el cablejat amb els equips.
La fibra òptica
Està formada per filaments transparents i capaços de transportar els paquets d’informació
com a feixos de llum produïts per un làser. Es poden transmetre simultàniament fins a cent
feixos de llum, s’aconsegueix una velocitat total de 1 Tb/s.
Els connectors més utilitzats per a xarxes locals són l’SC d’inserció directa i l’ST.
7. Composició del cable de fibra òptica
Nucli: és el filament transparent per on circula la informació.
Revestiment: permet retenir la llum dins del nucli.
Coberta: protegeix el filament i dóna consistència al cable.
Protocols de xarxa
Són les regles i les especificacions tècniques que han de seguir els dispositius connectats
en xarxa per poder comunicar-se i transferir-se informació entre si.
En les xarxes, la funció de traducció la fan tant les targetes de xarxa com els
encaminadors.
El protocol més utilitzat actualment, tant per a xarxes locals com per a comunicacions a
través d’Internet, és el TCP/IP.
El protocol TCP/IP
Està format per dos protocols, el TCP i l'IP, encarregats de controlar la comunicació entre
els diferents equips conectats, independentment del sistema operatiu que utilitzin i del tipus
d'equip de què es tracti.
8. Com a complement del protocol IP, hi ha el TCP que s'encarrega de :
A l'emissor:
•Divideix la informació en paquets.
•Afegeix un codi detector d'errors.
•Passa el paquet al protocol IP perquè gestioni la tramesa.
Al receptor:
•Rebre els paquets que li passa el protocol IP.
•Ordena els paquets, comprova que hi siguin tots i que siguin correctes.
•Extreu la informació útil dels paquets.
•Si detecta que algun paquet no ha arribat o és incorrecte, genera un paquet per ser enviat
a l'emissor indicant-li que ha de tornar a enviar el paquet malmès.
L'adreça IP
Cada equip que pertany a la xarxa disposa d'un identificador únic per poder
saber a qui va adreçat cada paquet en les transmissions i qui en són els remitents, són les
adreces IP.
Amb aquesta adreça IP hem d'identificar tant la xarxa on es troba l'equip concret.
L'organització InterNIC ha definit tres tipus de carxes en funció del nombre de xarxes i
d'equips que calgui implementar.
Per cada classe hi ha una sèrie d'adreces que no estan assignades per poder
ser utilitzades en xarxes privades. Dues o més xarxes privades poden utilitzae les mateixes
adreces.
Hi ha dues adreces reservades pel mateix protocol IP, una que fa referència a
l'equip local i l'altre que serveix per enviar un paquet a totes les estacions.
9. 3. Relació dels equips d’una xarxa
La finalitat d'una xarxa informàtica és compartir recursos entre els diferents equips que hi
estan conectats.
El primer model permet que tots els equips de la xarxa puguin compratir
recursos sense qu cap d'ells no tingui el control de la xarxa ni dels recursos, i s'anomena
xarxa igualitària. El segon model consisteix en un ordinador especialitzat anomenat
servidor, que s'encarrega del control de la xarxa i dels recursos, s'anomena xarxa client-
servidor.
Xarxa igualitària: Cadascun dels ordinadors pot fer de client i de servidor
indistintament, pot compartir recursos, actuant com a servidor, i alhora utilitzar-ne d'altres
equips de la xarxa, actuant com a client. A més l'usuari que treballa amb l'equip pot
utilitzar tots els recursos propis sense restricció.
10. Avantatges:
1.Són xarxes senzilles di'nstal.lar i configurar.
2.El cost d'implementació és molt baix.
3.Si un dels equips falla, només queden afectats els seus recursos i compartits i no la
resta.
4.Sol tenir menys concentració de trànsit d'informació per la xarxa.
Inconvenients:
1.Està pensat per a un nombre reduït d'oridinadors.
2.Són molt difícils d'administrar i controlar.
3.Els permisos per accedir a cada recurs compartit s'hauran de definir a cada equip
independentment dels altres.
4.El nivell de seguretat d'una xarxa entre iguals és baixa.
Els grups de treball
Normalment no treballem mai amb tots els equips que estan connectats, sinó
amb un nombre reduït. Nosaltres només veurem els equips que formen part del nostre
grup de treball i altres grups que hi hagi a la xarxa. Quan tenim molts equips connectats
en lloc d'utilitzar la seva adreça IP, fem servir el nom d'equip.
11. Avantatges:
1.El temps de resposta d'un servidor és molr més ràpid.
2.Tant els permisos com els recursos són fàcils d'administrar.
3.Hi ha més seguretat a l'hora de accedir i de prevenir la manipulació indeguda.
Inconvenients:
1.El cost és més elevat.
2.La xarxa és molt dependent del servidor o servidors instal.lats.
3.El trànsit és molt intens cap al servidor.
Els dominis
conjunt d'equips servidor-client en una xarxa local, a cadascun d'ells
l'anomenarem domini. El cojunt d'equips que confien en un servidor determinat s'anomena
servidor-domini. L'administració dels usuaris, privliegis i recursos del ser domini és la seva
funció.
Equips sense Microsoft Windows
Els conceptes de grup de treball i domini són propis dels sistemes operatius de
Microsoft. Es va desenvolupar un programari lliure, Samba. És una implementació lliure
dels protocols de xarxa de Microsoft i funciona sota sistemes operatius basatas en UNIX,
Linux i Mac OS.
Un equip executant Samba pot actuar com a client d'una xarxa o com a servidor
de domini en xarxes-client-servidor.
12. 4.Anàlisi d’una xarxa existent
Per a portar a terme una anàlisi acurada de la xarxa utilitzarem el Tauler de
control i la línia de comandaments.
Instruccions de consola
La consola ens permet saber d'una manera ràpida la configuració del nostre
ordinador per treballar en xarxa i ens facilitarà unes quantes eines per comprovar-ne el
funcionament.
Ipconfig: ens mostra la configuració actual de la xarxa TCP/IP del nostre
equip i la configuració DHCP i DNS.
Ping: comprova l'estat de la conexió d'un equip remot a través d'una sol.licitus
d'eco o missatge de contesta. Consisteix a enviar-li un missatge demanant que
simplement ens contesti.
Tancert: indica la ruta que segueixens els paquets que surten del nostre equip
fins a arribar a l'equip de destinació.
13. 5.Recursos compartits
En una xarxa tenim la necessitat d'indentificar els usuaris que la utilitzen per
poder permetre`ls o negar-los l'accés als diferents recursos compartits.
Comptes d'usuari
És tota la informació que defineix un usuari. Inclou el nom, la contrasenya i els
permisos per accedir a recursos. No es donen permisos a un usuari de forma individual,
sinó a un grup d'usuaris. Podem definir un grup d'usuaris com el conjunt d'usuaris que
tenen els mateixos privilegis o permisos. Hi ha grups definits per defecte com el grup
d'administradorsco el grup de convidats, que pràcticament no en tenen cap de
privilegi.
Un cop hem creat els usuaris i els grups a què pertanyen, només ens cal
compartir els recursos. Tot i que no podrem compartit arxius de manera individual, sí que
podrem gestionar els permisos.