EZproxy Seminar Multidata

772 views

Published on

Published in: Technology, Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
772
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
4
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

EZproxy Seminar Multidata

  1. 1. Statistický modul EZproxy a další aktuální vývoj MULTIDATA Praha Mgr. Petr Novák Knihovna psychologie FF UK 6.října 2009
  2. 2. Pro č statistický modul? <ul><li>OCLC (výrobce EZproxy) nabízí výčet různých nástrojů, komerčních i freeware / OSS </li></ul><ul><li>Neposkytují podporu pro skupiny </li></ul><ul><li>Neposkytují podporu pro různé způsoby autentizace </li></ul><ul><li>zdlouhavá práce s logy na pracovní stanici </li></ul><ul><li>limity, nelze pracovat v dávkách </li></ul>
  3. 3. Statistický modul <ul><li>Autor RNDr. Vladimír Pávek </li></ul><ul><li>Využívá XSLT procesor Saxon </li></ul><ul><li>Vyžaduje Java Virtual Machine </li></ul><ul><li>Otestováno na Windows 2003 server a Linux </li></ul><ul><li>Testovací demo ke stažení z www.multidata.cz </li></ul><ul><li>Konfigurace = editace XML souborů </li></ul><ul><li>práce přímo na serveru EZproxy </li></ul><ul><li>Generuje výstupy v ČJ a AJ </li></ul>
  4. 4. Skupiny v EZproxy <ul><li>Jsou využívány: </li></ul><ul><ul><li>pro korektní autorizaci uživatelů dle součásti instituce (fakulty a základní součásti na VŠ, zaměstnanci x čtenáři x testeři ve všech knihovnách) </li></ul></ul><ul><ul><li>pro generování log souborů využívaných pro statistický modul </li></ul></ul><ul><li>předávány jsou různé kombinace skupin </li></ul>
  5. 5. Jak EZproxy ukládá logy <ul><li>Konfigurace v config.txt </li></ul><ul><li>Ukládání v týdenních intervalech </li></ul><ul><li>2 druhy logů: </li></ul><ul><ul><li>LogSPU - > spu %Y-%W.log </li></ul></ul><ul><ul><ul><li>= výchozí URL zdroje </li></ul></ul></ul><ul><ul><li>Hlavní log - > ezp%Y-%W.log </li></ul></ul><ul><ul><ul><li>= kompletní komunikace uživatel-zdroj bez * .jpg a * .gif </li></ul></ul></ul>
  6. 6. Jak EZproxy ukládá logy - co se loguje <ul><li>IP adresa, </li></ul><ul><li>uživatelské jméno , </li></ul><ul><li>výčet skupin uživatele oddělený „+“, </li></ul><ul><li>identifik átor session , </li></ul><ul><li>datum a čas, </li></ul><ul><li>kompletní HTTP request ( např. GET http://www. database .com HTTP/1.0) , </li></ul><ul><li>číslelný status HTTP žádosti (200 aj.), </li></ul><ul><li>přenesená data v bajtech , </li></ul><ul><li>(v případě hlavního logu ještě user-agent ) </li></ul>
  7. 7. Ukázka SPU logu <ul><li>70.108.162.87 johndoe Default+UNI+MEDICINE+Student a05db43a-6c0b-40d6-b0ff-2502eddb337d [10/Aug/2009:01:37:13 +0100] &quot;GET http://ezproxy.library.edu/login/ovid HTTP/1.1&quot; 200 0 </li></ul><ul><li>18.18.162.117 marysmith Default+UNI+LAW+Student e87bd19a-677a-41a1-bcb8-4309a4818e84 [10/Aug/2009:01:37:13 +0100] &quot;GET http://ovidsp.ovid.com/ovidweb.cgi HTTP/1.1&quot; 200 0 </li></ul><ul><li>60.133.100.17 billking Default+UNI+ARTS+THEOLOGY+Student+Staff 94b62205-6564-47a4-97e0-e6497f2b8546 [10/Aug/2009:01:58:55 +0100] &quot;GET http://ezproxy.library.edu/login/ebsco HTTP/1.1 &quot; 200 0 </li></ul><ul><li>90.177.148.39 mikelee Default+UNI+ARTS+MATH+Staff 476663da-d3ac-42c1-a07b-1131fb1c01e8 [10/Aug/2009:01:58:55 +0100] &quot;GET http://search.ebscohost.com/login.aspx?authtype=id HTTP/1.1&quot; 200 0 </li></ul><ul><li>58.128.110.30 tracylong Default+UNI+COMPSCI+Student 6ea828af-6c11-4f66-90ae-093be1d73026 [10/Aug/2009:03:35:11 +0100] &quot;GET http://www.computer.org/portal/site/usdl HTTP/1.1&quot; 200 0 </li></ul>
  8. 8. Způsoby zpřístupnění elektronických inf. zdrojů <ul><li>Autentizace na IP adresu (poskytovatel zdroje zařadí IP adresu EZproxy serveru na seznam povolených IP adres) = typ 1 </li></ul><ul><li>Autentizace jménem a heslem (poskytovatel zdroje zašle autentizační data - uživ.jméno a heslo -, ta jsou zadána do EZproxy a uživatel se jimi transparentně autentizuje vůči skrytému formuláři = typ 2 </li></ul>
  9. 9. Ukázka SPU logu <ul><li>70.108.162.87 johndoe Default+UNI+MEDICINE+Student a05db43a-6c0b-40d6-b0ff-2502eddb337d [10/Aug/2009:01:37:13 +0100] &quot;GET http://ezproxy.library.edu/login/ovid HTTP/1.1&quot; 200 0 </li></ul><ul><li>18.18.162.117 marysmith Default+UNI+LAW+Student e87bd19a-677a-41a1-bcb8-4309a4818e84 [10/Aug/2009:01:37:13 +0100] &quot;GET http://ovidsp.ovid.com/ovidweb.cgi HTTP/1.1&quot; 200 0 </li></ul><ul><li>60.133.100.17 billking Default+UNI+ARTS+THEOLOGY+Student+Staff 94b62205-6564-47a4-97e0-e6497f2b8546 [10/Aug/2009:01:58:55 +0100] &quot;GET http://ezproxy.library.edu/login/ebsco HTTP/1.1 &quot; 200 0 </li></ul><ul><li>90.177.148.39 mikelee Default+UNI+ARTS+MATH+Staff 476663da-d3ac-42c1-a07b-1131fb1c01e8 [10/Aug/2009:01:58:55 +0100] &quot;GET http://search.ebscohost.com/login.aspx?authtype=id HTTP/1.1&quot; 200 0 </li></ul><ul><li>58.128.110.30 tracylong Default+UNI+COMPSCI+Student 6ea828af-6c11-4f66-90ae-093be1d73026 [10/Aug/2009:03:35:11 +0100] &quot;GET http://www.computer.org/portal/site/usdl HTTP/1.1&quot; 200 0 </li></ul>typ 1 typ 2
  10. 10. Rozdíl v logování <ul><li>SPU log – srovnatelně zaznamená jak typ 1 (autentizace IP adresou), tak typ 2 (autentizace jménem a heslem) </li></ul><ul><li>Hlavní log - zaznamená kompletní komunikaci EZproxy se zdrojem dle typu 1, avšak pouhé otevření zdroje typu 2 </li></ul><ul><li>- > jako zdroj pro statistiky využívanosti se hodí spíše SPU log, Hlavní log má doplňkovou funkci </li></ul>
  11. 11. Workflow práce se statistickým modulem – generování HTML výstupů <ul><li>Realizováno každý týden </li></ul><ul><ul><li>Nakopírování čerstvého souboru LogSPU do /statistika (adresář se statistickým modulem) </li></ul></ul><ul><ul><li>Spuštění dávky </li></ul></ul><ul><ul><li>Nakopírování výstupních HTML souborů do požadované lokace – např. /docs/public (do této lokace lze obecně umístit jakékoli HTML a grafické soubory ke kterým není třeba ověřovat přístup) </li></ul></ul><ul><ul><li>Kontrola errorlog.html </li></ul></ul>
  12. 14. Workflow práce se statistickým modulem - tit-url.xml <ul><li>Editace souboru tit-url.xml </li></ul><ul><li>tit-url.xml obsahuje seznam zdrojů včetně URL a výčtu přiřazených skupin </li></ul><ul><li>Vždy při přidání nového zdroje </li></ul><ul><li>Konvence pojmenování zdroje </li></ul><ul><li>Pokud zdroj již není předplácen – nutno konfiguraci v tit-url ponechat </li></ul><ul><li>Ukázka záznamu </li></ul>
  13. 16. Workflow práce se statistickým modulem – analýza chybových URL <ul><li>soubor errorlog.html </li></ul><ul><li>slouží k nalezení chybných konfigurací v tit-url.xml </li></ul>
  14. 17. Statistika dle zdrojů a měsíců pro celou knihovnu
  15. 18. K čemu může sloužit <ul><li>Statistika dle zdrojů a měsíců </li></ul><ul><ul><li>pro celou knihovnu </li></ul></ul><ul><ul><li>pro jednotlivé skupiny </li></ul></ul><ul><li>Využití pro marketing: </li></ul><ul><ul><li>sledování krátkodobých přístupů (trialy) </li></ul></ul><ul><ul><li>meziměsíční změny </li></ul></ul><ul><ul><li>celkové úhrny </li></ul></ul>
  16. 19. Statistika dle skupin
  17. 20. K čemu může sloužit <ul><li>Statistika dle skupin </li></ul><ul><ul><li>pro celou knihovnu </li></ul></ul><ul><ul><li>pro jednotlivé skupiny </li></ul></ul><ul><li>Využití pro marketing: </li></ul><ul><ul><li>rozdíly mezi jednotlivými skupinami (fakultami) </li></ul></ul><ul><ul><li>zdroj pro přepočet dle počtu reálných uživatelů (studenti + akademičtí pracovníci, všichni čtenáři / aktivní uživatelé vzdáleného přístupu) </li></ul></ul>
  18. 22. K čemu může sloužit <ul><li>Statistika dle skupin a dle zdrojů </li></ul><ul><ul><li>pro jednotlivé skupiny </li></ul></ul><ul><li>Využití pro marketing: </li></ul><ul><ul><li>rozdíly mezi jednotlivými skupinami (fakultami) pro konkrétní zdroje </li></ul></ul><ul><ul><li>zdroj pro analýzu využívanosti zdrojů - > podklad pro akvizici </li></ul></ul>
  19. 23. Další práce s výstupy v Excelu <ul><li>Všechny prezentované tabulky lze z HTML přes schránku snadno metodou CTRL+C, CTRL+V zkopírovat do Excelu a dále zpracovávat </li></ul><ul><li>Výstup např. do CSV se ukázal jako zbytečný </li></ul>
  20. 24. K nabídce statistického modulu <ul><li>Dodávka zahrnuje budoucí aktualizace </li></ul><ul><li>Cena mírná  , na dotázání </li></ul><ul><li>Dotazy ke statistickému modulu? </li></ul>
  21. 25. <ul><li>Čas na švestkovou buchtu  </li></ul>
  22. 26. Autentizační modul <ul><li>možnosti autentizace a autorizace EZproxy: built-in by OCLC :-) </li></ul><ul><ul><li>textový soubor s hesly </li></ul></ul><ul><ul><li>LDAP </li></ul></ul><ul><ul><ul><li>LDAP dle RFC 2307 (např. OpenLDAP) </li></ul></ul></ul><ul><ul><ul><li>Active Directory, eDirectory </li></ul></ul></ul><ul><ul><li>Shibboleth </li></ul></ul><ul><ul><li>doména Windows </li></ul></ul><ul><ul><li>pro ČR exotické knihovní systémy – Voyager, III, … </li></ul></ul><ul><li>více viz http://www.oclc.org/us/en/support/documentation/ezproxy/usr/default.htm </li></ul>
  23. 27. ALEPH...? <ul><li>Nativní podpora autentizace a autorizace uživatelů EZproxy v systému ALEPH chybí </li></ul><ul><li>Akademické knihovny disponují LDAP adresáři pro autentizaci k různým informačním procesům v r ámci svých informačních systémů </li></ul><ul><li>Veřejné a vědecké knihovny LDAP podporu pro čtenáře nemívají </li></ul><ul><li>->>> potřeba autentizačního modulu </li></ul>
  24. 28. Autentizační modul <ul><li>Autoři </li></ul><ul><ul><li>Jiří Rataj </li></ul></ul><ul><ul><li>Lukáš Hlůže </li></ul></ul><ul><ul><li>Martin Vojnar </li></ul></ul><ul><li>testován na EZproxy serveru draco.multidata.cz </li></ul>
  25. 30. Výhoda řešení <ul><li>standardizované LDAP rozhraní podporující </li></ul><ul><ul><li>EZproxy </li></ul></ul><ul><ul><li>Shibboleth Identity Provider </li></ul></ul><ul><ul><li>libovolné další služby (tiskové fronty, autentizace pracovních stanic, …) </li></ul></ul><ul><li>aktuální data via LDAP – např. </li></ul><ul><ul><li>účet aktivní ihned po vystavení průkazky </li></ul></ul><ul><ul><li>účet odblokován okamžitě po uhrazení pokuty </li></ul></ul><ul><ul><li>lze stanovit specifickou skupinu uživatelů pro vzdálený přístup (nikoli nutně všichni registrovaní čtenáři) </li></ul></ul>
  26. 31. Podrobnosti <ul><li>možné zabezpečení komunikace </li></ul><ul><ul><li>EZproxy-LDAP: SSL (ldaps) + fixní IP adresa </li></ul></ul><ul><ul><li>LDAP-mezivrstva-ALEPH: omezení jen pro localhost komunikaci, pokud nebude LDAP a ALEPH na jednom serveru – lze implementovat https + fixní IP adresu </li></ul></ul><ul><li>propustnost v řádu desítek autentizačních dotazů za minutu </li></ul><ul><li>mezivrstva LDAP – ALEPH je napsána v perlu </li></ul><ul><li>vyžaduje ALEPH v.18 a vyšší s licencí X-services </li></ul>
  27. 32. Obsah datagramu mezivrstvy <ul><li><?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?> </li></ul><ul><li><bor-auth> </li></ul><ul><li><bor-id> carovy_kod_uzivatele </bor-id> </li></ul><ul><li><bor-uid> primarni_id_uzivatele </bor-uid> </li></ul><ul><li><bor-name> jmeno_uzivatele </bor-name> </li></ul><ul><li><bor-email> email_uzivatele </bor-email> </li></ul><ul><li><bor-lang> jazyk_komunikace_s_uzivatelem </bor-lang> </li></ul><ul><li><bor-auth-ok> vysledek_verifikace </bor-auth-ok> </li></ul><ul><li><bor-credit> stav_penezniho_uctu </bor-credit> </li></ul><ul><li><bor-status> kategorie_uzivatele </bor-status> </li></ul><ul><li><error> textova_zprava_o_vysledku_verifikace_v_pripade_chyby </error> </li></ul><ul><li></bor-auth> </li></ul>
  28. 33. Ukázka <ul><li>http://boa.ruk.cuni.cz:8991 </li></ul><ul><li>ldapsearch -x -D 'uid=333,ou=EZPROXY,dc=ruk,dc=cuni,dc=cz' -W -v -h boa.ruk.cuni.cz -b 'uid=333,ou=EZPROXY,dc=ruk,dc=cuni,dc=cz' uid=333,ou=ezproxy,dc=ruk,dc=cuni,dc=cz </li></ul><ul><li>boa.ruk.cuni.cz </li></ul><ul><li>ou=EZPROXY,dc=ruk,dc=cuni,dc=cz(objectClass=person) </li></ul><ul><li>uid </li></ul><ul><li>333 </li></ul>
  29. 34. Vaše dotazy a komentáře… … za které děkuji petr.novak @ multidata.cz

×