SlideShare a Scribd company logo
1 of 42
Download to read offline
Bioinformatika



            Jan Pačes
      jan.paces@img.cas.cz


Ústav molekulární genetiky AV ČR
organizace dat


project   archive / orig    (electronic)
          bin / programs    notebook / notes
          data / storage
          results           to-do / changes
          pic / figures /
          graphs            README
          doc
          ws / tmp /
          working

          old
          help
          perl
bezpečnost dat


            přístupnost    vs   bezpečnost
            použitelnost        ochrana



hesla                             zálohy, verze
https                             checklist
ssh                               formáty souborů
pgp (gpg)                         tištěné kopie

(šifrovaný souborový
systém)
typy souborů

●   obrázky:
        vektorové
             svg (standart vector graphics)
             coreldraw, adobe illustrator
        bitmapy (barevná hloubka - color depth)
             tiff, png, gif (komprese bez ztráty kvality)
             jpg (komprese se ztrátou kvality)

●   dokumenty:
       txt, html, rtf (rich text format),
       pdf (portable document format)

●   data:
        xml (extended markup language)
síťová komunikace

                 http
                  ftp
                 ssh
ports                           ports
 80       high level protocol    80
 20                              20
 23                              23
          low level protocol

                tcp/ip
                netbui


             client / server
                  p2p
WWW


●   URL: Unique Resource Locator
●   HTML: Hyper Text Markup Language
●   XML: eXtensible Markup Language
    http://www.w3.org/XML


protocol://computer:port/dir/document#position
      http://bio.img.cas.cz/index.html#prfuk
social bookmarking
social bookmarking

výhody:
●   oproti “web spiderům” (google,
    yahoo) jsou stránky anotovány lidmi,
    kteří rozumějí jejich obsahu
●   automatický ranking systém
●   tagy nejsou stanoveny rigidně
    zvnějšku
●   seskupování uživatelů s podobnými
    zájmy
social bookmarking



nevýhody:
●   z hlediska vyhledávání tag systém
    neobsahuje definovaný slovník
●   tagy nemají hierarchické uspořádání
●   absence systematičnosti a někdy i
    logiky
co se hodí jednomu,
nemusí vyhovovat druhému
del.icio.us
del.icio.us
del.icio.us
organizace odborné literatury

  ●   http://www.citeulike.org
  ●   http://www.conotea.org
každý problém vyžaduje
  specifické nástroje
citeulike
citeulike
citeulike
citeulike
databáze


    SQL: Structured Query Language


●   MySQL    http://www.mysql.org
●   Postgres http://www.postgresql.org


●   Access
●   Oracle   http://www.oracle.com
databáze - princip

databáze
     tabulka
           záznam
                datový typ
datové typy


●   integer(M)
●   float(M,D)
●   char(M), varchar(M)
●   date, time
●   text, blob
●   set, enum
●   boolean
datové typy
problémy se záznamem dat


jména autorů:
●   John B. Smith
●   J. B. Smith
●   JB Smith
●   Smith, John B
●   Smith, JB
●   Smith JB
●   Smith J B
problémy se záznamem dat


jména autorů:       řešení
●   John B. Smith   ●   striktní datové
●   J. B. Smith         typy
●   JB Smith
                    ●   definovaný
                        slovník
●   Smith, John B
●   Smith, JB
●   Smith JB
●   Smith J B
relační databáze


databáze článků:
hledejte efektní a elegantní řešení
relační databáze


●   časopis (VARCHAR)
●   název článku (TEXT)
●   rok vydání (DATE)
●   …


●   autor (?)
●   keyword (?)
relační databáze

id        journal       title   year   rest
INTEGER   VARCHAR(20)   TEXT    DATE   TEXT
relační databáze


id        journal         title        year     rest
INTEGER   VARCHAR(20)     TEXT         DATE     TEXT




                        aid       id          name
                        INTEGER   INTEGER     VARCHAR(20)



                        kid       id          keyword
                        INTEGER   INTEGER     VARCHAR(20)
relační databáze
relační databáze
relační databáze
online help
firefox toolbar
firefox toolbar
firefox toolbar
firefox toolbar
firefox toolbar
firefox toolbar
Bioinformatics course - lesson 2

More Related Content

Similar to Bioinformatics course - lesson 2

Vlastimil Krejčíř - Systémový pohled na software Archivematica
Vlastimil Krejčíř - Systémový pohled na software ArchivematicaVlastimil Krejčíř - Systémový pohled na software Archivematica
Vlastimil Krejčíř - Systémový pohled na software ArchivematicaLTP-portal-cz
 
Borek Bernard: TypeScript - příčetný jazyk pro web
Borek Bernard: TypeScript - příčetný jazyk pro webBorek Bernard: TypeScript - příčetný jazyk pro web
Borek Bernard: TypeScript - příčetný jazyk pro webDevelcz
 
Ondra Kučera: Otevřený web a jeho současný stav
Ondra Kučera: Otevřený web a jeho současný stavOndra Kučera: Otevřený web a jeho současný stav
Ondra Kučera: Otevřený web a jeho současný stavTomáš Holas
 
Blok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, PojektyBlok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, PojektyMoravskaZemskaKnihovna
 
Metadata a metadatové standardy užívané v knihovnách
Metadata a metadatové standardy užívané v knihovnáchMetadata a metadatové standardy užívané v knihovnách
Metadata a metadatové standardy užívané v knihovnáchMoravskaZemskaKnihovna
 
Window Design and Development
Window Design and DevelopmentWindow Design and Development
Window Design and DevelopmentJiri Danihelka
 

Similar to Bioinformatics course - lesson 2 (10)

Vlastimil Krejčíř - Systémový pohled na software Archivematica
Vlastimil Krejčíř - Systémový pohled na software ArchivematicaVlastimil Krejčíř - Systémový pohled na software Archivematica
Vlastimil Krejčíř - Systémový pohled na software Archivematica
 
Borek Bernard: TypeScript - příčetný jazyk pro web
Borek Bernard: TypeScript - příčetný jazyk pro webBorek Bernard: TypeScript - příčetný jazyk pro web
Borek Bernard: TypeScript - příčetný jazyk pro web
 
Ondra Kučera: Otevřený web a jeho současný stav
Ondra Kučera: Otevřený web a jeho současný stavOndra Kučera: Otevřený web a jeho současný stav
Ondra Kučera: Otevřený web a jeho současný stav
 
Blok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, PojektyBlok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, Pojekty
 
Screen scraping se ScraperWiki (Jindřich Mynarz)
Screen scraping se ScraperWiki (Jindřich Mynarz)Screen scraping se ScraperWiki (Jindřich Mynarz)
Screen scraping se ScraperWiki (Jindřich Mynarz)
 
Metadata a metadatové standardy užívané v knihovnách
Metadata a metadatové standardy užívané v knihovnáchMetadata a metadatové standardy užívané v knihovnách
Metadata a metadatové standardy užívané v knihovnách
 
Google App Engine
Google App EngineGoogle App Engine
Google App Engine
 
Window Design and Development
Window Design and DevelopmentWindow Design and Development
Window Design and Development
 
06 Cvičení.pptx
06 Cvičení.pptx06 Cvičení.pptx
06 Cvičení.pptx
 
Lekce 1
Lekce 1Lekce 1
Lekce 1
 

Bioinformatics course - lesson 2