SlideShare a Scribd company logo
1 of 32
SELECTION

          For

Web Archiving Programme
Selection Policy
Selection policy is determined by a number of different factors

- Remit and Mission of the collecting organization
- Intellectual property rights issue
- Institutional resources available
Usage of Web Archiving Program
Web archiving program can be implemented by a variety of
institutions
- Libraries
- Archives
- Research Organization
- Learned societies
- Commercial Organization
Quality of Web

- Interconnectedness
- Dynamic Nature
Objectives of this Topic

• A model process for making selection decisions
• The context in which the decision is going to take
  place
• Possible approaches for selection
• Selection Criteria
• Element required to create the selection and
  collection list
The Selection Process
The selection process can be broken down into smaller components
 POLICY DEFINITION



SELECTION POILICY


                                             MAINTAINCE
    SELECTION



  COLLECTION LIST

                                             QUALITY ASSURANCE
   COLLECTION
STAGES IN SELECTION PROCESS

• Selection Policy
• Selection
• Maintaince
Selection Policy

A well defined selection policy is an essential foundation for any
web archiving program. The nature of the policy depends upon
the individual organizational requirements but its formulation
will typically require the following steps
- Context
- Selection Methods
- Selection Criteria
Selection Context

An understanding of the broader context in which the selection
policy is going to work is the main part to the formulation of the
policy itself.
SELECTION METHODS

A number of different approaches for selection are possible
which may be categorized according to there scope.

- Unselective Approach
- Selective Approach
- Thematic Approach
Unselective Approach

In this approach one has to take a decision not to select but rather
to collect everything possible. It is based on 4 main arguments

1- Complete Contents of the Resource (Interconnectedness)
2- Expensive and Time Consuming
3- Technical Feasibility (Deep Web / Surface Web)
Thematic Approach

It is also called as Semi Selective Approach. In this approach 4
points are considerable

1- Subject: Selection according to the name of the Domain
2- Creator: Selection according to the name of the creator of that
             web Resource. It may be any govt agency, Publisher
3- Genre: The scope of selection may be according to the
            specific genre of resource, such as publications, blog,
            web art or govt records.
4- Domain :The scope of selection defined in terms of specific
             web domains such as “.uk” , “.edu”
Selective Approach

The most narrowly defined selection method is to identify specific
web resource for collection, such as single web publication or
website.
SELECTION CRITERIA
Once the selection method is identified than a set of specific
selection criteria will be finalized. The criteria allow individual
selection decision to be made which in turn be translated into a
list of web resources to be collected. The criteria based on 3
issues
- Content
- Extent
- Timing and Frequency
Content
Criteria must be established to define the nature of the web resources eligible
              for selection in terms of their intellectual context.

                                 Extent
    To establish criteria for determining the extent of selected resources.
                                   Example
    It may be stated that no external links from websites will be collected.

                   Timings and Frequency
The timing and frequency of collection of each selected web resources should
be clearly defined in the collection list. These may be influenced by a number
of factors. These are

1- Lifecycle                                 3- Risk Assessment
2- Topicality/ Significance                  4- Rate of Content Change
Lifecycle

The nature of the web resources may be defined in terms of its
active lifecycle, which may be open ended or limited duration.

Example: Many websites may exist and evolve over an indefinite

          period of time and some event based websites may
          have a planned completion point, after which the
          content becomes fixed and the website may even cease
          to be maintained.
Rate of Change

A web resource content may be dynamic or fixed. Some websites
or individual pages may remain static for months, whereas other
may change enormously per day.

Example: A typical website page may be updated on a regular
         basis, whereas a journal article may be published to the
         web in a finished form.

  The rate of change will therefore be an important factor in
  determining the frequency with which a resource should be
                           collected.
Risk Assessment

The selection policy should identify the types of risks monitored
              which can effect on specific resource

Example :The name and version of a web server can be

          identified through analysis of the HTTP header
          generated by the site.

Automated tools can be used to monitor the availability of a
website and track the frequency and duration of any downtime.
The use of outdated web server and occurrence of frequent
periods of downtime could be indicators of poor management
practices and therefore signifies a high degree of risk.
Topicality and Significance

A major factor in determining the frequency of collection may
   be
a subjective assessment of the topicality or underlying
significance of a given resource.

Example :The “National Archives” collects the majority of UK
         govt websites on a biannual basis. However, for the
         duration of the iraq conflict in 2004, it prioritized
         websites related to defense and foreign policy for high
         intensity collection at weekly intervals.
Defining the Boundaries
Once the selection policy is implemented, it will generate a list of web
resources to be collected. This list may be contained in the selection policy
itself., if it is static, or exist as freestanding document, if it is dynamic. In
selection policy the boundaries of each selected web resource should be
defined to allow it to be collected.
Web Resources are defined in terms of a uniform resource locator (URL),
which provides a unique address for that resource within the world wide web.
A URL comprises of following elements..
1- Scheme
2- Domain
3- Path
Scheme

Scheme defines the format of the URL, which usually use a
communication protocol such as the Hypertext Transfer Protocol
(HTTP) or the File Transfer Protocol (FTP).


                   Scheme : http://
Domain

Defines the host for the web resource. This comprises of two or more labels
separated by dots ‘.’ and is read from right to left.

           Domain Name: WWW.NATIONALARCHIVE.GOV.UK/
The right most label is the top level domain, which specifies either a country code
(such as uk for United Kingdom) or (.com for Commercial Organization).

The label to this left is the second level domain which is generally describing the
name of the hosting organization, (microsoft.com) or (gov.uk).

Labels to the left of this may be used to define further domain and sub domain
levels.
Domain Name

  The domain name must be translated into an internet protocol
 (IP) address which uniquely identify each host computer on the
   internet. This translation is performed by a “Domain Name
System” DNS server which maintained a record of domain names
                           and IP address.
Path

The path specifies the location of the web resource within the
directory of structure of the host web server and is read from left
to right.

         PATH : preservation/webarchive/default.htm

In the above example the URL points to a file called default.htm
located within the directory path preservation/webarchive/
hosted in the “National Archives.gov.uk” with the
host web server WWW
Timings and Frequency of Collection

The collection list must define the timings and the frequency with
which each selected web resource is to be collected. Four basic
scenarios are possible

-   Repeated Collection
-   Ad-Hoc Collection
-   One Off Collection
-   Comprehensive Collection
Repeated Collection

In this approach the web resource is collected at repeated
intervals. This approach is suitable for dynamic resource
collection with open ended lifecycles. To capturing changes can
be collected by using static “snapshots” of the resource according
to the collection policy defines. The normal practices are weekly,
monthly or annually.
A decision has to make that what kind of criteria we are
following in the selection policy for the collection of dynamic
resources. There are two kinds of collection techniques
- Incremental
- Complete
Ad-Hoc Collection

Web resources may change at un predictable rates. Where this is
the case, repeated collection at a fixed frequency may prove
inefficient, resulting in the repeated collection of the same
content. An alternative approach is to collect in response to a
trigger event, such as some form of automated or manual
monitoring of the resources or an alert from some external
source.
One Off Collection

In some cases a specific web resource may be selected for collection on a one
off basis. This will typically apply to resources which have fixed content, such
as online publication. In addition, certain types of material may change over a
set of period of time, and then stabilize in a fixed form.

Example :
The website for government public inquiry which may change rapidly while
the inquiry is in progress and new content is being added, but will then
    become
fixed once the inquiry has published its findings. In such cases it may be
considered appropriate to collect the site only once it has become fixed. If the
changes are significant or material is being removed as well as added, repeated
collection may also be required during the dynamic stage of the resources
lifecycle.
Comprehensive Collection

It may be necessary in some case to capture complete lifecycle of
a dynamic and open ended web resource. It is mostly required
where online transactions needs to be preserved for evidential
purpose. In such a case collection for archival purposes will
needs to be integrated within the website management workflow.
This is least commonly applied selection approach.
Maintaince
The selection policy must be updated it should not be static. It should reflect
the changes in the internal and external factors such as new organization
priorities and developments in the world wide web. Equally the collection list
whether a part of selection policy or not will clearly be dynamic. Feed back
from the quality assurance of web resources should be used to refine
the selection process.

Example :
1- When resources are collected, new resources may be identified
   that need to be considered for selection.
2- There must be lessons to be learned, the availability of the organizational
   resources and infrastructure, including specific strengths or limitations of
   the available collection technologies.
Maintaince
The regularity with which the maintaince needs to be undertaken
will depends upon the selection method adopted, and the
frequency of collection.
A clearly and well maintained selection policy is the most
important part of any web archiving program and an essential
pre-requisite for building a coherent and meaningful collection.
QUIZ IN THE NEXT CLASS

More Related Content

What's hot

Proposal manajemen proyek
Proposal manajemen proyekProposal manajemen proyek
Proposal manajemen proyekAnandaAyu ZB
 
Basis Data : Pemodelan Erd
Basis Data : Pemodelan ErdBasis Data : Pemodelan Erd
Basis Data : Pemodelan Erdamalianuryamin
 
pengolahan citra digital dengan java
pengolahan citra digital dengan javapengolahan citra digital dengan java
pengolahan citra digital dengan javasoftscients
 
0 proposal penawaran software aplikasi sistem informasi manajemen kementerian...
0 proposal penawaran software aplikasi sistem informasi manajemen kementerian...0 proposal penawaran software aplikasi sistem informasi manajemen kementerian...
0 proposal penawaran software aplikasi sistem informasi manajemen kementerian...Ahmad SKT
 
Sistem Basis Data Kepegawaian Supermarket.
Sistem Basis Data Kepegawaian Supermarket.Sistem Basis Data Kepegawaian Supermarket.
Sistem Basis Data Kepegawaian Supermarket.Febry San
 
04 Testing Perangkat Lunak
04 Testing Perangkat Lunak04 Testing Perangkat Lunak
04 Testing Perangkat LunakMrirfan
 
Perkembangan sistem informasi
Perkembangan sistem informasiPerkembangan sistem informasi
Perkembangan sistem informasiUlmi_Kalsum
 
Bab 9 class dan object diagram 2010
Bab 9 class dan object diagram 2010Bab 9 class dan object diagram 2010
Bab 9 class dan object diagram 2010donasiilmu
 
Konsep dasar thread programming
Konsep dasar thread programmingKonsep dasar thread programming
Konsep dasar thread programmingcyberbebek
 
Pengertian sistem informasi perusahaan
Pengertian sistem informasi perusahaanPengertian sistem informasi perusahaan
Pengertian sistem informasi perusahaandodykalbuadi430
 
Project Charter Sistem Informasi Posko Keamanan
Project Charter Sistem Informasi Posko KeamananProject Charter Sistem Informasi Posko Keamanan
Project Charter Sistem Informasi Posko KeamananPutriAprilliandini
 
Analisis Perbandingan 2 Aplikasi Rekam Medik
Analisis Perbandingan 2 Aplikasi Rekam MedikAnalisis Perbandingan 2 Aplikasi Rekam Medik
Analisis Perbandingan 2 Aplikasi Rekam MedikRumah Studio
 
Makalah I Rancangan Database CDM dan PDM
Makalah I Rancangan Database CDM dan PDMMakalah I Rancangan Database CDM dan PDM
Makalah I Rancangan Database CDM dan PDMElma Fiana
 
Pertemuan14 keamananwirelessnetworking
Pertemuan14 keamananwirelessnetworkingPertemuan14 keamananwirelessnetworking
Pertemuan14 keamananwirelessnetworkingRoziq Bahtiar
 
Contoh makalah "Virus Komputer"
Contoh makalah "Virus Komputer"Contoh makalah "Virus Komputer"
Contoh makalah "Virus Komputer"PT serba gratiz
 
Presentation consolidation
Presentation consolidationPresentation consolidation
Presentation consolidationDanis Maulana
 
Modul web design - studi kasus website portal berita
Modul web design - studi kasus website portal beritaModul web design - studi kasus website portal berita
Modul web design - studi kasus website portal beritaDoni Andriansyah
 
Perkuliahan Ke 4 Rekayasa Perangkat Lunak
Perkuliahan Ke 4 Rekayasa Perangkat LunakPerkuliahan Ke 4 Rekayasa Perangkat Lunak
Perkuliahan Ke 4 Rekayasa Perangkat LunakRakhmi Khalida, M.M.S.I
 

What's hot (20)

Proposal manajemen proyek
Proposal manajemen proyekProposal manajemen proyek
Proposal manajemen proyek
 
Keamanan Sistem
Keamanan SistemKeamanan Sistem
Keamanan Sistem
 
Basis Data : Pemodelan Erd
Basis Data : Pemodelan ErdBasis Data : Pemodelan Erd
Basis Data : Pemodelan Erd
 
pengolahan citra digital dengan java
pengolahan citra digital dengan javapengolahan citra digital dengan java
pengolahan citra digital dengan java
 
0 proposal penawaran software aplikasi sistem informasi manajemen kementerian...
0 proposal penawaran software aplikasi sistem informasi manajemen kementerian...0 proposal penawaran software aplikasi sistem informasi manajemen kementerian...
0 proposal penawaran software aplikasi sistem informasi manajemen kementerian...
 
Sistem Basis Data Kepegawaian Supermarket.
Sistem Basis Data Kepegawaian Supermarket.Sistem Basis Data Kepegawaian Supermarket.
Sistem Basis Data Kepegawaian Supermarket.
 
Mppl 1
Mppl 1Mppl 1
Mppl 1
 
04 Testing Perangkat Lunak
04 Testing Perangkat Lunak04 Testing Perangkat Lunak
04 Testing Perangkat Lunak
 
Perkembangan sistem informasi
Perkembangan sistem informasiPerkembangan sistem informasi
Perkembangan sistem informasi
 
Bab 9 class dan object diagram 2010
Bab 9 class dan object diagram 2010Bab 9 class dan object diagram 2010
Bab 9 class dan object diagram 2010
 
Konsep dasar thread programming
Konsep dasar thread programmingKonsep dasar thread programming
Konsep dasar thread programming
 
Pengertian sistem informasi perusahaan
Pengertian sistem informasi perusahaanPengertian sistem informasi perusahaan
Pengertian sistem informasi perusahaan
 
Project Charter Sistem Informasi Posko Keamanan
Project Charter Sistem Informasi Posko KeamananProject Charter Sistem Informasi Posko Keamanan
Project Charter Sistem Informasi Posko Keamanan
 
Analisis Perbandingan 2 Aplikasi Rekam Medik
Analisis Perbandingan 2 Aplikasi Rekam MedikAnalisis Perbandingan 2 Aplikasi Rekam Medik
Analisis Perbandingan 2 Aplikasi Rekam Medik
 
Makalah I Rancangan Database CDM dan PDM
Makalah I Rancangan Database CDM dan PDMMakalah I Rancangan Database CDM dan PDM
Makalah I Rancangan Database CDM dan PDM
 
Pertemuan14 keamananwirelessnetworking
Pertemuan14 keamananwirelessnetworkingPertemuan14 keamananwirelessnetworking
Pertemuan14 keamananwirelessnetworking
 
Contoh makalah "Virus Komputer"
Contoh makalah "Virus Komputer"Contoh makalah "Virus Komputer"
Contoh makalah "Virus Komputer"
 
Presentation consolidation
Presentation consolidationPresentation consolidation
Presentation consolidation
 
Modul web design - studi kasus website portal berita
Modul web design - studi kasus website portal beritaModul web design - studi kasus website portal berita
Modul web design - studi kasus website portal berita
 
Perkuliahan Ke 4 Rekayasa Perangkat Lunak
Perkuliahan Ke 4 Rekayasa Perangkat LunakPerkuliahan Ke 4 Rekayasa Perangkat Lunak
Perkuliahan Ke 4 Rekayasa Perangkat Lunak
 

Viewers also liked

publishing production
publishing productionpublishing production
publishing productionEssam Obaid
 
Quality Assurance and Cataloguing
Quality Assurance and Cataloguing Quality Assurance and Cataloguing
Quality Assurance and Cataloguing Essam Obaid
 
COLLECTION METHODS
COLLECTION METHODSCOLLECTION METHODS
COLLECTION METHODSEssam Obaid
 
PRESERVATION Web archiving
PRESERVATION  Web archivingPRESERVATION  Web archiving
PRESERVATION Web archivingEssam Obaid
 
7 شخصيات يجب أن تحذفهم فورا من الفيسبوك
7 شخصيات يجب أن تحذفهم فورا من الفيسبوك7 شخصيات يجب أن تحذفهم فورا من الفيسبوك
7 شخصيات يجب أن تحذفهم فورا من الفيسبوكEssam Obaid
 
تقنيات 6 سيجما فى المؤسسات الاكاديمية والمعلوماتية
تقنيات 6 سيجما فى المؤسسات الاكاديمية والمعلوماتيةتقنيات 6 سيجما فى المؤسسات الاكاديمية والمعلوماتية
تقنيات 6 سيجما فى المؤسسات الاكاديمية والمعلوماتيةEssam Obaid
 
تفاعل ادارة السجلات والوثائق مع مواقع التواصل الاجتماعى
تفاعل ادارة السجلات والوثائق مع مواقع التواصل الاجتماعىتفاعل ادارة السجلات والوثائق مع مواقع التواصل الاجتماعى
تفاعل ادارة السجلات والوثائق مع مواقع التواصل الاجتماعىEssam Obaid
 
Cloud computing دور الحوسبة السحابية فى المكتبات الرقمية ونظم الارشفة الالكتر...
Cloud computing دور الحوسبة السحابية فى المكتبات الرقمية ونظم الارشفة الالكتر...Cloud computing دور الحوسبة السحابية فى المكتبات الرقمية ونظم الارشفة الالكتر...
Cloud computing دور الحوسبة السحابية فى المكتبات الرقمية ونظم الارشفة الالكتر...Essam Obaid
 
The development of web archiving 3
The development of web archiving 3The development of web archiving 3
The development of web archiving 3Essam Obaid
 
ادارة السجلات والارشفة الالكترونية - E archive
ادارة السجلات والارشفة الالكترونية - E archiveادارة السجلات والارشفة الالكترونية - E archive
ادارة السجلات والارشفة الالكترونية - E archiveEssam Obaid
 
ECM نظم إدارة المحتوى المؤسسى
 ECM نظم إدارة المحتوى المؤسسى ECM نظم إدارة المحتوى المؤسسى
ECM نظم إدارة المحتوى المؤسسىEssam Obaid
 
models of e publishing
models of e publishingmodels of e publishing
models of e publishingEssam Obaid
 
الاتجاهات البحثية فى إدارة المعرفة
الاتجاهات البحثية فى إدارة المعرفةالاتجاهات البحثية فى إدارة المعرفة
الاتجاهات البحثية فى إدارة المعرفةEssam Obaid
 
introduction to electronic publishing
 introduction to electronic publishing introduction to electronic publishing
introduction to electronic publishingEssam Obaid
 
E archive ادارة السجلات والارشفة الالكترونية - المفاهيم والمصطلحات
E archive  ادارة السجلات والارشفة الالكترونية - المفاهيم والمصطلحات   E archive  ادارة السجلات والارشفة الالكترونية - المفاهيم والمصطلحات
E archive ادارة السجلات والارشفة الالكترونية - المفاهيم والمصطلحات Essam Obaid
 
content analysis
content analysiscontent analysis
content analysisEssam Obaid
 
1356947482.9353caiibgbmmarketingmngtmodule d
1356947482.9353caiibgbmmarketingmngtmodule d1356947482.9353caiibgbmmarketingmngtmodule d
1356947482.9353caiibgbmmarketingmngtmodule dمحمد الجوري
 

Viewers also liked (20)

publishing production
publishing productionpublishing production
publishing production
 
Quality Assurance and Cataloguing
Quality Assurance and Cataloguing Quality Assurance and Cataloguing
Quality Assurance and Cataloguing
 
COLLECTION METHODS
COLLECTION METHODSCOLLECTION METHODS
COLLECTION METHODS
 
PRESERVATION Web archiving
PRESERVATION  Web archivingPRESERVATION  Web archiving
PRESERVATION Web archiving
 
7 شخصيات يجب أن تحذفهم فورا من الفيسبوك
7 شخصيات يجب أن تحذفهم فورا من الفيسبوك7 شخصيات يجب أن تحذفهم فورا من الفيسبوك
7 شخصيات يجب أن تحذفهم فورا من الفيسبوك
 
تقنيات 6 سيجما فى المؤسسات الاكاديمية والمعلوماتية
تقنيات 6 سيجما فى المؤسسات الاكاديمية والمعلوماتيةتقنيات 6 سيجما فى المؤسسات الاكاديمية والمعلوماتية
تقنيات 6 سيجما فى المؤسسات الاكاديمية والمعلوماتية
 
تفاعل ادارة السجلات والوثائق مع مواقع التواصل الاجتماعى
تفاعل ادارة السجلات والوثائق مع مواقع التواصل الاجتماعىتفاعل ادارة السجلات والوثائق مع مواقع التواصل الاجتماعى
تفاعل ادارة السجلات والوثائق مع مواقع التواصل الاجتماعى
 
Cloud computing دور الحوسبة السحابية فى المكتبات الرقمية ونظم الارشفة الالكتر...
Cloud computing دور الحوسبة السحابية فى المكتبات الرقمية ونظم الارشفة الالكتر...Cloud computing دور الحوسبة السحابية فى المكتبات الرقمية ونظم الارشفة الالكتر...
Cloud computing دور الحوسبة السحابية فى المكتبات الرقمية ونظم الارشفة الالكتر...
 
The development of web archiving 3
The development of web archiving 3The development of web archiving 3
The development of web archiving 3
 
ادارة السجلات والارشفة الالكترونية - E archive
ادارة السجلات والارشفة الالكترونية - E archiveادارة السجلات والارشفة الالكترونية - E archive
ادارة السجلات والارشفة الالكترونية - E archive
 
ECM نظم إدارة المحتوى المؤسسى
 ECM نظم إدارة المحتوى المؤسسى ECM نظم إدارة المحتوى المؤسسى
ECM نظم إدارة المحتوى المؤسسى
 
models of e publishing
models of e publishingmodels of e publishing
models of e publishing
 
الاتجاهات البحثية فى إدارة المعرفة
الاتجاهات البحثية فى إدارة المعرفةالاتجاهات البحثية فى إدارة المعرفة
الاتجاهات البحثية فى إدارة المعرفة
 
introduction to electronic publishing
 introduction to electronic publishing introduction to electronic publishing
introduction to electronic publishing
 
E archive ادارة السجلات والارشفة الالكترونية - المفاهيم والمصطلحات
E archive  ادارة السجلات والارشفة الالكترونية - المفاهيم والمصطلحات   E archive  ادارة السجلات والارشفة الالكترونية - المفاهيم والمصطلحات
E archive ادارة السجلات والارشفة الالكترونية - المفاهيم والمصطلحات
 
content analysis
content analysiscontent analysis
content analysis
 
Brothers meetting للنشر
Brothers meetting   للنشرBrothers meetting   للنشر
Brothers meetting للنشر
 
دورة صيانة الذات
دورة صيانة الذاتدورة صيانة الذات
دورة صيانة الذات
 
من سيربح المليون للنشر
من سيربح المليون   للنشرمن سيربح المليون   للنشر
من سيربح المليون للنشر
 
1356947482.9353caiibgbmmarketingmngtmodule d
1356947482.9353caiibgbmmarketingmngtmodule d1356947482.9353caiibgbmmarketingmngtmodule d
1356947482.9353caiibgbmmarketingmngtmodule d
 

Similar to SELECTION for Web Archiving Programme

Evaluation of Web Scale Discovery Services
Evaluation of Web Scale Discovery ServicesEvaluation of Web Scale Discovery Services
Evaluation of Web Scale Discovery ServicesNikesh Narayanan
 
Arcomem training system-overview_advanced
Arcomem training system-overview_advancedArcomem training system-overview_advanced
Arcomem training system-overview_advancedarcomem
 
Cloud web scale discovery services landscape an overview
Cloud web scale discovery services landscape an overviewCloud web scale discovery services landscape an overview
Cloud web scale discovery services landscape an overviewNikesh Narayanan
 
Internet browsing techniques
Internet browsing techniquesInternet browsing techniques
Internet browsing techniquesTola Odugbesan
 
Management of electronic resources for electronic librarianship
Management of electronic resources for electronic librarianshipManagement of electronic resources for electronic librarianship
Management of electronic resources for electronic librarianshipPachaloTembo
 
Implementing web scale discovery services: special reference to Indian Librar...
Implementing web scale discovery services: special reference to Indian Librar...Implementing web scale discovery services: special reference to Indian Librar...
Implementing web scale discovery services: special reference to Indian Librar...Nikesh Narayanan
 
UKSG webinar - TERMS revisited: developing the combination of electronic reso...
UKSG webinar - TERMS revisited: developing the combination of electronic reso...UKSG webinar - TERMS revisited: developing the combination of electronic reso...
UKSG webinar - TERMS revisited: developing the combination of electronic reso...UKSG: connecting the knowledge community
 
Developing Infrastructure to Support Closer Collaboration of Aggregators with...
Developing Infrastructure to Support Closer Collaboration of Aggregators with...Developing Infrastructure to Support Closer Collaboration of Aggregators with...
Developing Infrastructure to Support Closer Collaboration of Aggregators with...Nancy Pontika
 
Moving Shared Print to the Network Level
Moving Shared Print to the Network LevelMoving Shared Print to the Network Level
Moving Shared Print to the Network LevelMaine_SharedCollections
 
Inverted textindexing
Inverted textindexingInverted textindexing
Inverted textindexingKhwaja Aamer
 
Cloud Library: Precipitating change in library infrastructure
Cloud Library: Precipitating change in library infrastructureCloud Library: Precipitating change in library infrastructure
Cloud Library: Precipitating change in library infrastructureOCLC Research
 
NISO Standards update: KBart and Demand Driven Acquisitions Best Practices
NISO Standards update: KBart and Demand Driven Acquisitions Best PracticesNISO Standards update: KBart and Demand Driven Acquisitions Best Practices
NISO Standards update: KBart and Demand Driven Acquisitions Best PracticesJason Price, PhD
 
UKSG 2018 Breakout - TERMS redefined: developing the combination of electroni...
UKSG 2018 Breakout - TERMS redefined: developing the combination of electroni...UKSG 2018 Breakout - TERMS redefined: developing the combination of electroni...
UKSG 2018 Breakout - TERMS redefined: developing the combination of electroni...UKSG: connecting the knowledge community
 
Web Archiving Intro (circa 2015)
Web Archiving Intro (circa 2015)Web Archiving Intro (circa 2015)
Web Archiving Intro (circa 2015)Anna Perricci
 
Data accessibilityandchallenges
Data accessibilityandchallengesData accessibilityandchallenges
Data accessibilityandchallengesjyotikhadake
 
Moore RDAP11 Policy-based Data Management
Moore RDAP11 Policy-based Data ManagementMoore RDAP11 Policy-based Data Management
Moore RDAP11 Policy-based Data ManagementASIS&T
 

Similar to SELECTION for Web Archiving Programme (20)

Evaluation of Web Scale Discovery Services
Evaluation of Web Scale Discovery ServicesEvaluation of Web Scale Discovery Services
Evaluation of Web Scale Discovery Services
 
Web content mining
Web content miningWeb content mining
Web content mining
 
Arcomem training system-overview_advanced
Arcomem training system-overview_advancedArcomem training system-overview_advanced
Arcomem training system-overview_advanced
 
Cloud web scale discovery services landscape an overview
Cloud web scale discovery services landscape an overviewCloud web scale discovery services landscape an overview
Cloud web scale discovery services landscape an overview
 
Internet browsing techniques
Internet browsing techniquesInternet browsing techniques
Internet browsing techniques
 
Management of electronic resources for electronic librarianship
Management of electronic resources for electronic librarianshipManagement of electronic resources for electronic librarianship
Management of electronic resources for electronic librarianship
 
Implementing web scale discovery services: special reference to Indian Librar...
Implementing web scale discovery services: special reference to Indian Librar...Implementing web scale discovery services: special reference to Indian Librar...
Implementing web scale discovery services: special reference to Indian Librar...
 
UKSG webinar - TERMS revisited: developing the combination of electronic reso...
UKSG webinar - TERMS revisited: developing the combination of electronic reso...UKSG webinar - TERMS revisited: developing the combination of electronic reso...
UKSG webinar - TERMS revisited: developing the combination of electronic reso...
 
Text Indexing and Retrieval
Text Indexing and RetrievalText Indexing and Retrieval
Text Indexing and Retrieval
 
Developing Infrastructure to Support Closer Collaboration of Aggregators with...
Developing Infrastructure to Support Closer Collaboration of Aggregators with...Developing Infrastructure to Support Closer Collaboration of Aggregators with...
Developing Infrastructure to Support Closer Collaboration of Aggregators with...
 
IR-AUDIT
IR-AUDITIR-AUDIT
IR-AUDIT
 
Moving Shared Print to the Network Level
Moving Shared Print to the Network LevelMoving Shared Print to the Network Level
Moving Shared Print to the Network Level
 
Inverted textindexing
Inverted textindexingInverted textindexing
Inverted textindexing
 
Cloud Library: Precipitating change in library infrastructure
Cloud Library: Precipitating change in library infrastructureCloud Library: Precipitating change in library infrastructure
Cloud Library: Precipitating change in library infrastructure
 
NISO Standards update: KBart and Demand Driven Acquisitions Best Practices
NISO Standards update: KBart and Demand Driven Acquisitions Best PracticesNISO Standards update: KBart and Demand Driven Acquisitions Best Practices
NISO Standards update: KBart and Demand Driven Acquisitions Best Practices
 
UKSG 2018 Breakout - TERMS redefined: developing the combination of electroni...
UKSG 2018 Breakout - TERMS redefined: developing the combination of electroni...UKSG 2018 Breakout - TERMS redefined: developing the combination of electroni...
UKSG 2018 Breakout - TERMS redefined: developing the combination of electroni...
 
Building blocks for success: criteria for trusted institutional repositories
Building blocks for success: criteria for trusted institutional repositoriesBuilding blocks for success: criteria for trusted institutional repositories
Building blocks for success: criteria for trusted institutional repositories
 
Web Archiving Intro (circa 2015)
Web Archiving Intro (circa 2015)Web Archiving Intro (circa 2015)
Web Archiving Intro (circa 2015)
 
Data accessibilityandchallenges
Data accessibilityandchallengesData accessibilityandchallenges
Data accessibilityandchallenges
 
Moore RDAP11 Policy-based Data Management
Moore RDAP11 Policy-based Data ManagementMoore RDAP11 Policy-based Data Management
Moore RDAP11 Policy-based Data Management
 

More from Essam Obaid

دورة مجاناً تاسيس إدارة الاعلام بالمؤسسات
دورة مجاناً تاسيس إدارة الاعلام بالمؤسساتدورة مجاناً تاسيس إدارة الاعلام بالمؤسسات
دورة مجاناً تاسيس إدارة الاعلام بالمؤسساتEssam Obaid
 
استراتيجية الاعلام الاجتماعى فى ادارة المعرفة الذكية
استراتيجية الاعلام الاجتماعى فى ادارة المعرفة الذكيةاستراتيجية الاعلام الاجتماعى فى ادارة المعرفة الذكية
استراتيجية الاعلام الاجتماعى فى ادارة المعرفة الذكيةEssam Obaid
 
الادارة الالكترونية
الادارة الالكترونيةالادارة الالكترونية
الادارة الالكترونيةEssam Obaid
 
الدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوط
الدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوطالدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوط
الدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوطEssam Obaid
 
الدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوط
الدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوطالدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوط
الدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوطEssam Obaid
 
مكتبات الجمعيات الأهلية و المؤسسات الخاصة بمحافظة الإسكندرية
مكتبات الجمعيات الأهلية و المؤسسات الخاصة بمحافظة الإسكندريةمكتبات الجمعيات الأهلية و المؤسسات الخاصة بمحافظة الإسكندرية
مكتبات الجمعيات الأهلية و المؤسسات الخاصة بمحافظة الإسكندريةEssam Obaid
 
مراقب وثائق الجودة
مراقب وثائق الجودةمراقب وثائق الجودة
مراقب وثائق الجودةEssam Obaid
 
برمجيات الأرشفة والسجلات الالكترونية بين التسويق والتطبيق
برمجيات الأرشفة والسجلات الالكترونية  بين التسويق والتطبيقبرمجيات الأرشفة والسجلات الالكترونية  بين التسويق والتطبيق
برمجيات الأرشفة والسجلات الالكترونية بين التسويق والتطبيقEssam Obaid
 
دليل لقيادة المشاريع واجتياز اختبار PMP
دليل لقيادة المشاريع واجتياز اختبار PMPدليل لقيادة المشاريع واجتياز اختبار PMP
دليل لقيادة المشاريع واجتياز اختبار PMPEssam Obaid
 
إدارة المعرفة والادارة الالكترونية فى المؤسسات
إدارة المعرفة  والادارة الالكترونية فى المؤسساتإدارة المعرفة  والادارة الالكترونية فى المؤسسات
إدارة المعرفة والادارة الالكترونية فى المؤسساتEssam Obaid
 
التطوع الالكتروني واستقطاب المتطوعين مهارات التطوع الافتراضي
 التطوع الالكتروني واستقطاب المتطوعين مهارات التطوع الافتراضي   التطوع الالكتروني واستقطاب المتطوعين مهارات التطوع الافتراضي
التطوع الالكتروني واستقطاب المتطوعين مهارات التطوع الافتراضي Essam Obaid
 
إدارة السجلات والارشفة الالكترونية
إدارة السجلات والارشفة الالكترونيةإدارة السجلات والارشفة الالكترونية
إدارة السجلات والارشفة الالكترونيةEssam Obaid
 
أنظمة البحث والاسترجاع في المكتبات العامة دراسة تقييميه لنظام مكتبة الملك عبد...
أنظمة البحث والاسترجاع في المكتبات العامة دراسة تقييميه لنظام مكتبة الملك عبد...أنظمة البحث والاسترجاع في المكتبات العامة دراسة تقييميه لنظام مكتبة الملك عبد...
أنظمة البحث والاسترجاع في المكتبات العامة دراسة تقييميه لنظام مكتبة الملك عبد...Essam Obaid
 
تطبيق منهجية 6 سيجما (Six Sigma) في المكتبات: دراسة استطلاعية لآراء مدراء الم...
تطبيق منهجية 6 سيجما (Six Sigma) في المكتبات: دراسة استطلاعية لآراء مدراء الم...تطبيق منهجية 6 سيجما (Six Sigma) في المكتبات: دراسة استطلاعية لآراء مدراء الم...
تطبيق منهجية 6 سيجما (Six Sigma) في المكتبات: دراسة استطلاعية لآراء مدراء الم...Essam Obaid
 
ادارة المشروعات الرقمية
ادارة المشروعات الرقميةادارة المشروعات الرقمية
ادارة المشروعات الرقميةEssam Obaid
 
إدارة محتوى مواقع التواصل الاجتماعي في المؤسسات الخدمية والتجارية
إدارة  محتوى مواقع التواصل الاجتماعي  في المؤسسات الخدمية والتجاريةإدارة  محتوى مواقع التواصل الاجتماعي  في المؤسسات الخدمية والتجارية
إدارة محتوى مواقع التواصل الاجتماعي في المؤسسات الخدمية والتجاريةEssam Obaid
 
تطبيق مبادئ إدارة الجودة الشاملة
تطبيق مبادئ  إدارة الجودة الشاملةتطبيق مبادئ  إدارة الجودة الشاملة
تطبيق مبادئ إدارة الجودة الشاملةEssam Obaid
 
تأثير النشر الالكتروني في خدمات المكتبات الجامعية
تأثير النشر الالكتروني في خدمات المكتبات الجامعية  تأثير النشر الالكتروني في خدمات المكتبات الجامعية
تأثير النشر الالكتروني في خدمات المكتبات الجامعية Essam Obaid
 
واقع العمل التطوعي فى المكتبات العامة المصرية
واقع العمل التطوعي فى المكتبات العامة المصريةواقع العمل التطوعي فى المكتبات العامة المصرية
واقع العمل التطوعي فى المكتبات العامة المصريةEssam Obaid
 
التخطيط الاستراتيجى فى مؤسسات المعلومات السعودية
التخطيط الاستراتيجى فى مؤسسات المعلومات السعوديةالتخطيط الاستراتيجى فى مؤسسات المعلومات السعودية
التخطيط الاستراتيجى فى مؤسسات المعلومات السعوديةEssam Obaid
 

More from Essam Obaid (20)

دورة مجاناً تاسيس إدارة الاعلام بالمؤسسات
دورة مجاناً تاسيس إدارة الاعلام بالمؤسساتدورة مجاناً تاسيس إدارة الاعلام بالمؤسسات
دورة مجاناً تاسيس إدارة الاعلام بالمؤسسات
 
استراتيجية الاعلام الاجتماعى فى ادارة المعرفة الذكية
استراتيجية الاعلام الاجتماعى فى ادارة المعرفة الذكيةاستراتيجية الاعلام الاجتماعى فى ادارة المعرفة الذكية
استراتيجية الاعلام الاجتماعى فى ادارة المعرفة الذكية
 
الادارة الالكترونية
الادارة الالكترونيةالادارة الالكترونية
الادارة الالكترونية
 
الدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوط
الدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوطالدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوط
الدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوط
 
الدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوط
الدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوطالدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوط
الدوريات الأجنبية فى مكتبات الكليات العلمية فى جامعة أسيوط
 
مكتبات الجمعيات الأهلية و المؤسسات الخاصة بمحافظة الإسكندرية
مكتبات الجمعيات الأهلية و المؤسسات الخاصة بمحافظة الإسكندريةمكتبات الجمعيات الأهلية و المؤسسات الخاصة بمحافظة الإسكندرية
مكتبات الجمعيات الأهلية و المؤسسات الخاصة بمحافظة الإسكندرية
 
مراقب وثائق الجودة
مراقب وثائق الجودةمراقب وثائق الجودة
مراقب وثائق الجودة
 
برمجيات الأرشفة والسجلات الالكترونية بين التسويق والتطبيق
برمجيات الأرشفة والسجلات الالكترونية  بين التسويق والتطبيقبرمجيات الأرشفة والسجلات الالكترونية  بين التسويق والتطبيق
برمجيات الأرشفة والسجلات الالكترونية بين التسويق والتطبيق
 
دليل لقيادة المشاريع واجتياز اختبار PMP
دليل لقيادة المشاريع واجتياز اختبار PMPدليل لقيادة المشاريع واجتياز اختبار PMP
دليل لقيادة المشاريع واجتياز اختبار PMP
 
إدارة المعرفة والادارة الالكترونية فى المؤسسات
إدارة المعرفة  والادارة الالكترونية فى المؤسساتإدارة المعرفة  والادارة الالكترونية فى المؤسسات
إدارة المعرفة والادارة الالكترونية فى المؤسسات
 
التطوع الالكتروني واستقطاب المتطوعين مهارات التطوع الافتراضي
 التطوع الالكتروني واستقطاب المتطوعين مهارات التطوع الافتراضي   التطوع الالكتروني واستقطاب المتطوعين مهارات التطوع الافتراضي
التطوع الالكتروني واستقطاب المتطوعين مهارات التطوع الافتراضي
 
إدارة السجلات والارشفة الالكترونية
إدارة السجلات والارشفة الالكترونيةإدارة السجلات والارشفة الالكترونية
إدارة السجلات والارشفة الالكترونية
 
أنظمة البحث والاسترجاع في المكتبات العامة دراسة تقييميه لنظام مكتبة الملك عبد...
أنظمة البحث والاسترجاع في المكتبات العامة دراسة تقييميه لنظام مكتبة الملك عبد...أنظمة البحث والاسترجاع في المكتبات العامة دراسة تقييميه لنظام مكتبة الملك عبد...
أنظمة البحث والاسترجاع في المكتبات العامة دراسة تقييميه لنظام مكتبة الملك عبد...
 
تطبيق منهجية 6 سيجما (Six Sigma) في المكتبات: دراسة استطلاعية لآراء مدراء الم...
تطبيق منهجية 6 سيجما (Six Sigma) في المكتبات: دراسة استطلاعية لآراء مدراء الم...تطبيق منهجية 6 سيجما (Six Sigma) في المكتبات: دراسة استطلاعية لآراء مدراء الم...
تطبيق منهجية 6 سيجما (Six Sigma) في المكتبات: دراسة استطلاعية لآراء مدراء الم...
 
ادارة المشروعات الرقمية
ادارة المشروعات الرقميةادارة المشروعات الرقمية
ادارة المشروعات الرقمية
 
إدارة محتوى مواقع التواصل الاجتماعي في المؤسسات الخدمية والتجارية
إدارة  محتوى مواقع التواصل الاجتماعي  في المؤسسات الخدمية والتجاريةإدارة  محتوى مواقع التواصل الاجتماعي  في المؤسسات الخدمية والتجارية
إدارة محتوى مواقع التواصل الاجتماعي في المؤسسات الخدمية والتجارية
 
تطبيق مبادئ إدارة الجودة الشاملة
تطبيق مبادئ  إدارة الجودة الشاملةتطبيق مبادئ  إدارة الجودة الشاملة
تطبيق مبادئ إدارة الجودة الشاملة
 
تأثير النشر الالكتروني في خدمات المكتبات الجامعية
تأثير النشر الالكتروني في خدمات المكتبات الجامعية  تأثير النشر الالكتروني في خدمات المكتبات الجامعية
تأثير النشر الالكتروني في خدمات المكتبات الجامعية
 
واقع العمل التطوعي فى المكتبات العامة المصرية
واقع العمل التطوعي فى المكتبات العامة المصريةواقع العمل التطوعي فى المكتبات العامة المصرية
واقع العمل التطوعي فى المكتبات العامة المصرية
 
التخطيط الاستراتيجى فى مؤسسات المعلومات السعودية
التخطيط الاستراتيجى فى مؤسسات المعلومات السعوديةالتخطيط الاستراتيجى فى مؤسسات المعلومات السعودية
التخطيط الاستراتيجى فى مؤسسات المعلومات السعودية
 

SELECTION for Web Archiving Programme

  • 1. SELECTION For Web Archiving Programme
  • 2. Selection Policy Selection policy is determined by a number of different factors - Remit and Mission of the collecting organization - Intellectual property rights issue - Institutional resources available
  • 3. Usage of Web Archiving Program Web archiving program can be implemented by a variety of institutions - Libraries - Archives - Research Organization - Learned societies - Commercial Organization
  • 4. Quality of Web - Interconnectedness - Dynamic Nature
  • 5. Objectives of this Topic • A model process for making selection decisions • The context in which the decision is going to take place • Possible approaches for selection • Selection Criteria • Element required to create the selection and collection list
  • 6. The Selection Process The selection process can be broken down into smaller components POLICY DEFINITION SELECTION POILICY MAINTAINCE SELECTION COLLECTION LIST QUALITY ASSURANCE COLLECTION
  • 7. STAGES IN SELECTION PROCESS • Selection Policy • Selection • Maintaince
  • 8. Selection Policy A well defined selection policy is an essential foundation for any web archiving program. The nature of the policy depends upon the individual organizational requirements but its formulation will typically require the following steps - Context - Selection Methods - Selection Criteria
  • 9. Selection Context An understanding of the broader context in which the selection policy is going to work is the main part to the formulation of the policy itself.
  • 10. SELECTION METHODS A number of different approaches for selection are possible which may be categorized according to there scope. - Unselective Approach - Selective Approach - Thematic Approach
  • 11. Unselective Approach In this approach one has to take a decision not to select but rather to collect everything possible. It is based on 4 main arguments 1- Complete Contents of the Resource (Interconnectedness) 2- Expensive and Time Consuming 3- Technical Feasibility (Deep Web / Surface Web)
  • 12. Thematic Approach It is also called as Semi Selective Approach. In this approach 4 points are considerable 1- Subject: Selection according to the name of the Domain 2- Creator: Selection according to the name of the creator of that web Resource. It may be any govt agency, Publisher 3- Genre: The scope of selection may be according to the specific genre of resource, such as publications, blog, web art or govt records. 4- Domain :The scope of selection defined in terms of specific web domains such as “.uk” , “.edu”
  • 13. Selective Approach The most narrowly defined selection method is to identify specific web resource for collection, such as single web publication or website.
  • 14. SELECTION CRITERIA Once the selection method is identified than a set of specific selection criteria will be finalized. The criteria allow individual selection decision to be made which in turn be translated into a list of web resources to be collected. The criteria based on 3 issues - Content - Extent - Timing and Frequency
  • 15. Content Criteria must be established to define the nature of the web resources eligible for selection in terms of their intellectual context. Extent To establish criteria for determining the extent of selected resources. Example It may be stated that no external links from websites will be collected. Timings and Frequency The timing and frequency of collection of each selected web resources should be clearly defined in the collection list. These may be influenced by a number of factors. These are 1- Lifecycle 3- Risk Assessment 2- Topicality/ Significance 4- Rate of Content Change
  • 16. Lifecycle The nature of the web resources may be defined in terms of its active lifecycle, which may be open ended or limited duration. Example: Many websites may exist and evolve over an indefinite period of time and some event based websites may have a planned completion point, after which the content becomes fixed and the website may even cease to be maintained.
  • 17. Rate of Change A web resource content may be dynamic or fixed. Some websites or individual pages may remain static for months, whereas other may change enormously per day. Example: A typical website page may be updated on a regular basis, whereas a journal article may be published to the web in a finished form. The rate of change will therefore be an important factor in determining the frequency with which a resource should be collected.
  • 18. Risk Assessment The selection policy should identify the types of risks monitored which can effect on specific resource Example :The name and version of a web server can be identified through analysis of the HTTP header generated by the site. Automated tools can be used to monitor the availability of a website and track the frequency and duration of any downtime. The use of outdated web server and occurrence of frequent periods of downtime could be indicators of poor management practices and therefore signifies a high degree of risk.
  • 19. Topicality and Significance A major factor in determining the frequency of collection may be a subjective assessment of the topicality or underlying significance of a given resource. Example :The “National Archives” collects the majority of UK govt websites on a biannual basis. However, for the duration of the iraq conflict in 2004, it prioritized websites related to defense and foreign policy for high intensity collection at weekly intervals.
  • 20. Defining the Boundaries Once the selection policy is implemented, it will generate a list of web resources to be collected. This list may be contained in the selection policy itself., if it is static, or exist as freestanding document, if it is dynamic. In selection policy the boundaries of each selected web resource should be defined to allow it to be collected. Web Resources are defined in terms of a uniform resource locator (URL), which provides a unique address for that resource within the world wide web. A URL comprises of following elements.. 1- Scheme 2- Domain 3- Path
  • 21. Scheme Scheme defines the format of the URL, which usually use a communication protocol such as the Hypertext Transfer Protocol (HTTP) or the File Transfer Protocol (FTP). Scheme : http://
  • 22. Domain Defines the host for the web resource. This comprises of two or more labels separated by dots ‘.’ and is read from right to left. Domain Name: WWW.NATIONALARCHIVE.GOV.UK/ The right most label is the top level domain, which specifies either a country code (such as uk for United Kingdom) or (.com for Commercial Organization). The label to this left is the second level domain which is generally describing the name of the hosting organization, (microsoft.com) or (gov.uk). Labels to the left of this may be used to define further domain and sub domain levels.
  • 23. Domain Name The domain name must be translated into an internet protocol (IP) address which uniquely identify each host computer on the internet. This translation is performed by a “Domain Name System” DNS server which maintained a record of domain names and IP address.
  • 24. Path The path specifies the location of the web resource within the directory of structure of the host web server and is read from left to right. PATH : preservation/webarchive/default.htm In the above example the URL points to a file called default.htm located within the directory path preservation/webarchive/ hosted in the “National Archives.gov.uk” with the host web server WWW
  • 25. Timings and Frequency of Collection The collection list must define the timings and the frequency with which each selected web resource is to be collected. Four basic scenarios are possible - Repeated Collection - Ad-Hoc Collection - One Off Collection - Comprehensive Collection
  • 26. Repeated Collection In this approach the web resource is collected at repeated intervals. This approach is suitable for dynamic resource collection with open ended lifecycles. To capturing changes can be collected by using static “snapshots” of the resource according to the collection policy defines. The normal practices are weekly, monthly or annually. A decision has to make that what kind of criteria we are following in the selection policy for the collection of dynamic resources. There are two kinds of collection techniques - Incremental - Complete
  • 27. Ad-Hoc Collection Web resources may change at un predictable rates. Where this is the case, repeated collection at a fixed frequency may prove inefficient, resulting in the repeated collection of the same content. An alternative approach is to collect in response to a trigger event, such as some form of automated or manual monitoring of the resources or an alert from some external source.
  • 28. One Off Collection In some cases a specific web resource may be selected for collection on a one off basis. This will typically apply to resources which have fixed content, such as online publication. In addition, certain types of material may change over a set of period of time, and then stabilize in a fixed form. Example : The website for government public inquiry which may change rapidly while the inquiry is in progress and new content is being added, but will then become fixed once the inquiry has published its findings. In such cases it may be considered appropriate to collect the site only once it has become fixed. If the changes are significant or material is being removed as well as added, repeated collection may also be required during the dynamic stage of the resources lifecycle.
  • 29. Comprehensive Collection It may be necessary in some case to capture complete lifecycle of a dynamic and open ended web resource. It is mostly required where online transactions needs to be preserved for evidential purpose. In such a case collection for archival purposes will needs to be integrated within the website management workflow. This is least commonly applied selection approach.
  • 30. Maintaince The selection policy must be updated it should not be static. It should reflect the changes in the internal and external factors such as new organization priorities and developments in the world wide web. Equally the collection list whether a part of selection policy or not will clearly be dynamic. Feed back from the quality assurance of web resources should be used to refine the selection process. Example : 1- When resources are collected, new resources may be identified that need to be considered for selection. 2- There must be lessons to be learned, the availability of the organizational resources and infrastructure, including specific strengths or limitations of the available collection technologies.
  • 31. Maintaince The regularity with which the maintaince needs to be undertaken will depends upon the selection method adopted, and the frequency of collection. A clearly and well maintained selection policy is the most important part of any web archiving program and an essential pre-requisite for building a coherent and meaningful collection.
  • 32. QUIZ IN THE NEXT CLASS