Este documento discute a história da relação entre informática e biodiversidade, onde estamos atualmente e para onde podemos ir. Começa com o início da informatização de coleções biológicas nas décadas de 1970-1980 e o surgimento de padrões e bancos de dados on-line na década de 1990. Atualmente, existem muitos dados biodiversidade online, porém ainda precisamos integrar e documentar melhor a diversidade de todos os grupos, incluindo micro-organismos. No futuro, novas tecnologias podem ajudar a analisar
ATIVIDADE 1 - SISTEMAS DISTRIBUÍDOS E REDES - 52_2024.docx
Informática na Biodiversidade
1. Informática na Biodiversidade:
onde estamos, como chegamos
aqui e para onde vamos
Seminário LNCC
Setembro de 2013
Eduardo Dalcin
Núcleo de Computação Científica e Geoprocessamento
Diretoria de Pesquisas
Instituto de Pesquisas Jardim Botânico do Rio de Janeiro
2. Tópicos da apresentação
• Um pouco de história
– O início da relação da Biodiversidade com a
Informática
– A “renascença”
– Como chegamos onde estamos
• Onde estamos?
• Para onde estamos indo?
• O que precisamos
3. Meu viés
• Biólogo
• Botânica - Inst. De Pesquisas Jardim Botânico do Rio de Janeiro
(1983)
• Banco de Dados e Qualidade de Dados
– Qualidade de Dados em Bancos de Dados Taxonômicos (Ph.D. - 2005)
• Biodiversidade
– Diversidade de espécies (taxa) e suas ocorrências (indivíduos e
populações)
• Coleções científicas botânicas
– Herbário
• Interesses
– Gestão e entrega de informação sobre biodiversidade (“biodiversity
information management and delivery”)
– Governança de Dados sobre Biodiversidade
– Arquitetura de Informações e Sistemas sobre Biodiversidade
4. O que é Biodiversidade?
• Diversidade biológica significa a variabilidade de organismos vivos
de todas as origens, compreendendo, dentre outros, os
ecossistemas terrestres, marinhos e outros ecossistemas aquáticos e
os complexos ecológicos de que fazem parte; compreendendo ainda
a diversidade dentro de espécies, entre espécies e de ecossistemas
(“Convenção sobre Diversidade Biológica - CDB”, 1992).
• Há, então, três níveis de biodiversidade:
– Diversidade de ecossistemas, representada pela diversidade de
combinações únicas da diversidade de organismos e ambientes e suas
relações que formam os diferentes ecossistemas.
– Diversidade de espécies, representada pela diversidade de espécies
individuais.
– Diversidade genética, representada pela diversidade de genes dentro
de cada espécie, e pela diversidade de suas combinações em cada
espécie.
5. O encontro da informática com a biodiversidade
Voltando no Tempo...
6. Charles Babbage (1791 - 1871)
Charles Darwin (1809 - 1882)
1859
“Engenho analítico” (1837)
33. Até 1977 era assim
Organismos unicelulares na sua vasta
maioria e que não apresentam seu
material genético delimitado por uma
membrana
Os seres vivos com células com um
núcleo celular rodeado por uma
membrana e com vários organelas.
34.
35. As arquebactérias são semelhantes às bactérias em muitos aspectos da estrutura celular – o mais
importante dos quais é a ausência de um núcleo celular diferenciado - e metabolismo, mas apresentam
diferenças importantes como, por exemplo, os processos de transcrição do DNA e da síntese proteica
que são idênticos aos dos eucariotas, mas o aspecto mais marcante talvez seja o metabolismo de alguns
destes seres:
• Algumas espécies de Archaea (Halobacteria), produzem energia a partir da luz, por uma estrutura
celular chamada bacteriorrodopsina.
• Outras vivem em fumarolas nas profundezas do oceano, sendo a base da vida destes ambientes,
como as plantas são em terra.
• Há ainda aquelas que vivem no trato intestinal de vários animais, produzindo metano.
36. “Renascimento”
A década de 80 e 90
• Período marcado por transformações
• Assinala o fim da Idade Média e o início
da Idade Moderna
• Período de grande produtividade
intelectual e, consequentemente,
bibliográfica na Informática na
Biodiversidade
37. “Suppose all the information stored in
computers everywhere were linked... All
the best information in every computer at
CERN and on the planet would be available
to me and enyone else.”
Tim Berners-Lee, 1980
“TCP + DNS + HTTP + HTML = WEB!”
42. • The first meeting of the Taxonomic Databases
Working Group was held at the Conservatoire
et Jardin botaniques in Geneva, from 28th to
30th September, 1985.
52. Nomes
Espécie (Taxon)
Vicia faba
Vicia faba
Vicia alba
Vicia alba
Vicia alba
Vicia faba
Vicia adriatica
Vicia adriatica
Vicia adriatica
Vicia alba
Vicia faba
Vicia adriatica
53. Ainda é um problema!
Pris, U. Conceptual Structures for Knowledge Creation and Communication Lecture Notes
in Computer Science Volume 2746, 2003, pp 309-322
63. •
“Pauly recruited Rainer Froese, and the beginnings of a software database along
these lines was encoded in 1988. This database, initially confined to tropical fish,
became the prototype for FishBase. FishBase was subsequently extended to cover
all finfish, and was launched on the Web in August 1996. It is now the largest and
most accessed online database for fish in the world. In 1995 the first CD-ROM was
released as "FishBase 100". Subsequent CDs have been released annually.”
85. Em resumo
•
Experimentar
– Taxonomia numérica
– Início da informatização das
coleções
•
Informatizar
– Coleções e Herbários
– Evolução dos modelos
•
Publicar
– Internet
– Global Species Databases
•
Integrar
– Padrões e Protocolos
•
Qualificar
– “Data Cleaning”
•
“Reutilizar”
– SOA
– “Web Services”
1960
92. Cabeças pensantes e falantes
“…If I'd like to see one thing in biodiversity informatics in 2013 it is the
emergence of a "platform" that makes the links the centre of their
efforts. Because without the links we are not building "platforms", we
are building silos…."
http://iphylo.blogspot.com.br/2013/01/megascience-platforms-forbiodiversity.html
93. “We conclude by noting that each aggregator out there seems to want to mint its own
flavor of GUIDs, perhaps as much to “brand” an identifier space as for any other
reason. We wonder if this strategy of proliferating such spaces is a great idea. A
huge advantage of DOIs and EZIDs is abstraction. You know what they mean and how
to resolve them because they are well-known and have organizations with specific
missions to support identifier creation. This strategy ensures that identifiers can
persist and resolve well into the future, and be recognizable not just within the
biodiversity informatics community but any other community we interoperate with:
genomics, publishing, ecology, earth sciences. This is what we’re talking about when
we want to break down walled gardens.”
101. Presentations and documents for
the conference may be found at:
http://www.gbic2012.org
Unprocessed outputs from all the
workshops are stored in Google
Docs and may be accessed via:
http://bit.ly/LLUhUb
109. • 1999
• Cientistas fotografam a
baleia “#1363” na costa
do Brasil (Fernando de
Noronha)
• 2001
• Um turista fotografa a
cauda de uma baleia na
costa de Madagascar
• 2009
• O turista compartilha a
foto no Flickr
110. Dados de migração de baleias-corcunda foram atualizados, de
uma média de 3.000 milhas para 6.000 milhas
123. Um líquen é uma unidade viva, mas não é um
"indivíduo" como classicamente concebido. Nem
pode ser decomposto em indivíduos sem a perda da
sua essência e sua viabilidade.
Um líquen é um organismo composto, que não pode
ser subdividido em "indivíduos" e permanecer vivo.
Como isto se encaixa com a ideia do "indivíduo",
como a "unidade fundamental” da natureza?
Os liquens são seres vivos “muito simples” que constituem uma simbiose de um
organismo formado por um fungo e uma alga ou cianobactéria.
124. Ok. Mas liquens
podem ser
considerados casos
especiais. Uma
exceção à regra...
Mesmo não sendo
raros....
125. E os cupins?
São criticamente importantes,
algumas vezes espécies dominantes
em alguns ecossistemas, que não
sobrevivem sem a presença de
organismos simbiontes no seu
aparelho digestivo.
Podemos considerar que são exceções
também?
129. Figure 1 Variation in diversity. Researchers of the Human
Microbiome Project are studying the microbial inhabitants
of the human body, using samples taken from 242 healthy
adults at 15 (for males) or 18 (for females) body sites —
from the skin (four sites), mouth and throat (nine sites),
vagina (three sites), nostrils and faeces (to represent the
distal gastrointestinal tract). Huttenhower et al. and
Methé et al. have estimated the number of microbial
species and their genes in these samples, and found
substantial variation in microbial community composition
at different body habitats. The two groups used different
counting methodologies, and their numbers vary
accordingly, such that exact figures are not available.
However, crude estimations of number of microbial
species (red) and number of microbial genes (blue) are
shown for examples of: sites containing high species
diversity, such as the gastrointestinal tract and teeth
(supragingival plaque); sites with intermediate diversity,
such as the inside of the cheek (buccal mucosa) and
nostrils (anterior nares); and sites with lower diversity,
such as the vaginal posterior fornix. The authors also
found substantial variation in both the diversity and the
composition of the microbial communities at different
sites within the same general body region.
Dentro de nós habitam cerca de 7.300
espécies diferentes.
130. “Micróbios”
• Além Isso significa dizer que em nos
de ser onipresente e abundantes
organismos colher de sopa de solo,
“macro”, procariontes ocorrem
uma ambientes imagináveis (e talvez
em todos os
temos entre 2.000 a 18.000
um pouco mais);
• Existem mais bactérias em um balde de água
espécies diferentes!
do mar do que mamíferos em toda a África;
• Localmente diversos – em 1g de solo existem
Isso é que é DIVERSIDADE!
7-109 células procarióticas, com 2.000 –
10
18.000 genomas diferentes.
131. Se o objetivo dos estudos
da biodiversidade é
entender toda a
diversidade na biosfera
terrestre…
A noção de que podemos
atingir essa meta somente
olhando para esta parte é
equivocada.
Precisamos documentar e
entender a diversidade
microbiótica.
134. O que precisamos
•
•
•
•
•
•
•
•
A aplicação de ferramentas computacionais para analisar o volume avassalador de dados
relacionado com o fato biológico, em seus escopos espaciais, temporais, biológicos, ambientais e
socioeconômicos é a chave que abre a porta que leva ao conhecimento, conservação e uso
sustentado e socialmente justo da biodiversidade;
Precisamos de uma nova plataforma para lidar e, acima de tudo, integrar essa quantidade
monumental de dados;
Caminhamos muito na organização (modelos, padrões, protocolos, etc.) de dados primários de uma
parte da biodiversidade;
Caminhamos pouco no registro do fato biológico em grupos taxonômicos menos “carismáticos”;
Caminhamos muito pouco na indexação e integração de diferentes “recursos de informação”
relacionados com a Biodiversidade (bibliografia, dados socioeconômicos, histórico-culturais, etc);
Precisamos urgentemente formar recursos humanos que irão desenvolver os algoritmos, modelos e
ferramentas computacionais necessárias para organizar, integrar, analisar e oferecer os dados e
informações sobre a Biodiversidade à sociedade, geradores de conhecimento, formadores de
opinião, tomadores de decisão e formuladores de políticas públicas;
Precisamos promover junto aos órgãos de fomento e as sociedades científicas uma política de
premiação e reconhecimento pelo compartilhamento e qualificação de dados sobre a
Biodiversidade;
Precisamos de uma infraestrutura (inter)nacional de informação sobre biodiversidade, baseada em
padrões e sistemas abertos e colaborativos, modular, escalável, baseada em serviços, e que
promova a “open and networked science” de forma plena e justa.
136. Obrigado!
Eduardo Dalcin
Instituto de Pesquisas Jardim Botânico do Rio de Janeiro
Diretoria de Pesquisas
Núcleo de Computação Científica e Geoprocessamento
edalcin@jbrj.gov.br