Successfully reported this slideshow.
Your SlideShare is downloading. ×

Tutkijan puheenvuoro, Matti Sarvimäki

Ad

Tutkijan puheenvuoro
Matti Sarvimäki
Aalto ja VATT
Tutkimusaineistojen etäkäyttö ja tietosuoja,
20.1.2015

Ad

Ehdotuksia TK:lle
• Laskentateho kuntoon!
– nykykäytännössä usein lähes mahdotonta työskennellä
– osaa menetelmistä ei kan...

Ad

Ehdotuksia tutkijoille
• Etäkäytössä on kaksi niukkaa resurssia:
– järjestelmän laskentateho / säilytyskapasiteetti
– tutk...

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Ad

Check these out next

1 of 12 Ad
1 of 12 Ad
Advertisement

More Related Content

More from Tilastokeskus (20)

Advertisement

Tutkijan puheenvuoro, Matti Sarvimäki

  1. 1. Tutkijan puheenvuoro Matti Sarvimäki Aalto ja VATT Tutkimusaineistojen etäkäyttö ja tietosuoja, 20.1.2015
  2. 2. Ehdotuksia TK:lle • Laskentateho kuntoon! – nykykäytännössä usein lähes mahdotonta työskennellä – osaa menetelmistä ei kannatta edes yrittää käyttää – laskentaintensiiviset ajot haittaavat myös muiden käyttäjien työtä • Miten? – erillinen palvelu paljon tehoa tarvitseville? – tehokkaampi käyttäjien allokointi palvelimille?
  3. 3. Ehdotuksia tutkijoille • Etäkäytössä on kaksi niukkaa resurssia: – järjestelmän laskentateho / säilytyskapasiteetti – tutkijapalveluiden työntekijöiden aika • Meillä on oikeus käyttää näitä resursseja … mutta kaikki kärsivät tehottomuudesta • Miksi vähentää resurssien hukkakäyttöä? – muiden työskentely tehostuu – sinun työskentelysi tehostuu (enemmän!) • Lukusuositus: – Gentzkow & Shapiro: Code and data for the social sciences: A practitioner's guide. [link]
  4. 4. Ehdotuksia 1. Ajattele ensin 2. Noudata tehokasta projektinhallintastrategiaa 3. Tee itsellesi harjoitteludata 4. Koodaa tehokkaasti 5. Seuraa resurssien käyttöä(si) 6. Tee suuret ajot viikonloppuna / yöllä 7. Anna palautetta 8. Pyydä vain tarpeelliset tulokset ulos
  5. 5. Ehdotus 1. Ajattele ensin • Tee näin: – määrittele täsmällinen tutkimuskysymys – mieti millainen analyysi siihen vastaa – tee analyysi (ja tarpeelliset robustness checkit) • Miksi? – hyvä empiirinen työ perustuu ennalta mietittyihin analyyseihin (ei spesifikaatiokalasteluun!) – turhien analyysien ajo vie sinulta (ja muilta) aikaa
  6. 6. Ehdotus 2. Noudata tehokasta projektinhallintastrategiaa • Tee näin: – lue Gentzkow & Shapiro – noudata heidän ohjeitaan • Miksi? – säästät paljon aikaa – teet vähemmän virheitä – kuormitat vähemmän etäyhteyttä
  7. 7. Ehdotus 3. Tee itsellesi harjoitteludata • Tee näin: – ota analyysisi perusdatasta pieni otos – kirjoita koodi käyttäen tätä dataa – aja tulokset koko datalla kun koodi on valmis • Miksi? – säästää sinun (ja muiden!) aikaa – teet parempaa tutkimusta (muistuttaa spesifikaatioon ennalta sitoutumista)
  8. 8. Ehdotus 4. Koodaa tehokkaasti • Tee näin: – lue Gentzkow & Shapiro – noudata heidän ohjeitaan • Miksi? – säästät paljon aikaa – teet vähemmän virheitä – kuormitat vähemmän etäyhteyttä
  9. 9. Ehdotus 5. Seuraa resurssien käyttöä(si) • Tee näin: – käynnistä Task Manager painamalla ctrl-shift-esc – katso paljonko resursseja käytät – katso paljonko muut käyttävät – oleta että muut tekevät samoin • Miksi? – seuraavat kalvot
  10. 10. Ehdotus 6. Tee suuret ajot viikonloppuna / yöllä • Tee näin: – pistä iso ajo pyörimään – sulje etäyhteysikkuna, mutta älä kirjaudu ulos (ajo jää pyörimään) • Miksi? – kaikki osaavat nyt seurata resurssiesi käyttöä – … ja jotkut saatavat noudattaa seuraavaakin ohjetta
  11. 11. Ehdotus 7. Anna palautetta • Tee näin: – jos jokin ei toimi, kerro siitä henkilölle joka pystyy sen korjaamaan – jos osaat, ehdota miten asian voisi korjata • Muista kuitenkin: – joskus on pakko ajaa isoja ajoja (päivälläkin) – tutkijapalveluissa on töissä liian vähän ihmisiä (ja tämä ei ole heidän vikansa) – jotkut ongelmat on vaikea ratkaista
  12. 12. Ehdotus 8. Pyydä vain tarpeelliset tulokset ulos • Tee näin: – mieti mitä oikeasti aiot raportoida – varmista että et pyydä mitään, mitä ulos ei voi antaa – laita output kansioon readme-tiedosto, jossa kerrot täsmällisesti mitä pyytämäsi materiaali on, miksi sen antaminen ei ole laitonta ja millä koodilla se on tehty • Miksi? – tutkijapalveluissa on töissä liian vähän ihmisiä (ja tämä ei ole heidän – tai muiden tutkijoiden – vika) • Ehdotus TK:lle: – ilmainen ”välitila” etäyhteydettömille kanssakirjoittajille, jossa tarkastamattomia tuloksia voisi hallitusti katsella

×