The HDF Product Designer – Interoperability in the First Mile

The HDF Group
www.hdfgroup.orgDecember 17, 2014 American Geophysical Union Fall Meeting
HDF Product Designer:
Interoperability in the First Mile
H. Joe Lee (hyoklee@hdfgroup.org),
Aleksandar Jelenak, and Ted Habermann
The HDF Group

www.hdfgroup.orgAmerican Geophysical Union Fall Meeting
Data Life Cycle – First and Last Miles
Archive Discovery AnalysisQuestion Processing Distribution
Repurposing
Data
Collection

Principal Investigator Someone Else
Repurposing
Data
Collection

Repurposing
Data
Collection
Experts Non-Experts

Repurposing
Data
Collection
# Users
Experts Non-Experts

Repurposing
Data
Collection
# Users
Experts Non-Experts
Standards and
Conventions

Repurposing
Data
Collection
# Users
Experts Non-Experts
? Standards and
Conventions

Repurposing
Data
Collection
To facilitate collaborative design of
interoperable and standards-compliant
data products in HDF5 as early as possible
in the mission development process.

Repurposing
Data
Collection
To facilitate collaborative design of
interoperable and standards-compliant
data products in HDF5 as early as possible
in the mission development process.
Interoperability in the First Mile

www.hdfgroup.orgAmerican Geophysical Union Fall MeetingDecember 17, 2014
Mission Data Producer’s Conundrum
Mission Requirements
• Science objectives
• Data processing
• Data discovery & distribution
• Data documentation
• User engagement,
preparedness, feedback

Interoperability
• Standards
• Conventions
• Best Practices
• Metadata
• Software Tools
• netCDF4, CF
• Data processing

HDF FeaturesInteroperability
• Datatypes
• Groups
• Attributes
• Scale/offset
• Dimension scales
• Compression
• Chunking
• Standards
• Conventions
• Best Practices
• Metadata
• Software Tools
• netCDF4, CF
• Data processing

HDF FeaturesInteroperability
HDF Product
Designer
• Datatypes
• Groups
• Attributes
• Scale/offset
• Dimension scales
• Compression
• Chunking
• Standards
• Conventions
• Best Practices
• Metadata
• Software Tools
• netCDF4, CF
• Data processing

Collaboration
Individuals

Collaboration
Individuals
Teams

Collaboration
Individuals
Teams
Projects
Programs

HDF5 Product Design Architecture
Desktop
Client

Desktop
Client
Restful
Service
(Tornado/Py
thon)

Data Store
(PostgreSQL)
Desktop
Client
Restful
Service
(Tornado/Py
thon)
HDF5
Server

Data Store
(PostgreSQL)
Desktop
Client
Restful
Service
(Tornado/Py
thon)
HDF5
JSON
HDF4 MAP
XML
NcML HDF5
Server
Flexible
Input

Data Store
(PostgreSQL)
Desktop
Client
HDF5
JSON
Fortran IDL MATLAB Python
Restful
Service
(Tornado/Py
thon)
CSV
(Excel)
HDF5
JSON
HDF4 MAP
XML
NcML HDF5
Server
HDF5 File
Template
Flexible
Input
Flexible Output

Convention Support
• Initial:
• NetCDF User’s Guide (NUG)
• Attribute Convention for Data Discovery (ACDD)
• Object Convention for Data Discovery (OCDD)
• Climate and Forecast (CF)
• HDF-EOS
• Implementation:
• Conventions for groups and variables
• Convention for connected variables (e.g.
coordinate dimensions)
• Compliance checkers on entire file
• Support for community components

Conclusion
• enable individuals and mission teams to
design products quickly and easily
• enable collaboration at many levels
• promote data management best practices
HDF Product Designer is being built using a
flexible architecture to support multiple front
and back ends. It will:

The HDF Product Designer – Interoperability in the First Mile

Recommended

Recommended

More Related Content

What's hot

What's hot (19)

Viewers also liked

Viewers also liked (14)

Similar to The HDF Product Designer – Interoperability in the First Mile

Similar to The HDF Product Designer – Interoperability in the First Mile (20)

Recently uploaded

Recently uploaded (20)

The HDF Product Designer – Interoperability in the First Mile