„Hochschulübergreifende Kooperation im Content Management:
das Beispiel MyCoRe“
oder
„GRID-orientierte CM-Architekturen für
Collaboratory-Funktionen“
oder
„Interoperabilität in verteilten,
heterogenen CM-Szenarien“
oder
„Mit den anderen Kindern spielen ...“
Dr. Stefan Gradmann
Universität Hamburg / Regionales Rechenzentrum
[email protected]
www.rrz.uni-hamburg.de/RRZ/S.Gradmann
Interoperabilität im Content Management
Überblick
Leitfrage: Wieviel Content Repositories brauchen Deutsche
Universitäten? Und wie interoperabel müssen sie sein?
CMS in der UHH
MILESS / MyCoRe: Architekturabstraktionen
MyCoRe: SW-Architektur, Funktionalität und Community
CMS MyCoRe im GAP-Verbund
=> Interoperabilität in heterogenen Szenarien
Was konkret bedeutet Interoperabilität von CMSen? Use cases.
Zwei Implementierungsansätze für Interoperabitlität:
Applikationsebene: OAI-PMH/Handle/OpenURL
Repository-Ebene: JSR 170 (1.0)/ JSR 283 (2.0)
Konsequenzen für die Schnittstellenlozierung
2
Interoperabilität im Content Management
Credits
Präsentation basiert auf Arbeiten / Präsentationen von
Herbert van der Sompel (LANL)
David Nüscheler (Day/JCP)
Frank Lützenkirchen (MyCoRe)
Norbert Ritter (UHH, VSYS)
Iris Brückner (IBM)
Und ... und ...
3
Interoperabilität im Content Management
CMS im Informationskontinuum
UHH
Forschung
& Lehre
OUTPUT
Publikationsfunktion
'user': Wissenschaftler
und
Studierende
Forschungsbericht und
-dokumentation
Lehr-/Lernmaterial
‘Collaboratory’Szenarien
…
MyCoRe: Aggregation & Transfer
CM: Texte, Bilder, Töne …
Informationsmanagement
4
Storage: bits&bytes
INPUT
Bibliotheksfunktion
Interoperabilität im Content Management
Was ist MyCoRe?
MyCoRe ist ...
Ein Open-Source CMS
Eine Gemeinschaftsentwicklung
von inzwischen mehr als 10 deutschen Universitäten
Mehr als ein Web-CMS! Eher schon ein Wissenschafts-DMS, ein
Aggregationsinstrument für die Gestaltung von digitalen
Bibliotheksdiensten.
5
Interoperabilität im Content Management
MILESS: Architekturabstraktion
MILESS (oder andere
marktgängige CMS)
GUI, Workflow,
Search & Retrieval
...
Repository
(proprietär:
IBM-CM)
6
Monolithisch
Proprietäres Repository API
Standard-API
nur auf Applikationsebene
Kunden“bindung“ ('lock-in')
Jede Funktionalitätserweiterung
erfordert produktspezifisches
Know-How
Interoperabilität im Content Management
MyCoRe: Architekturabstraktion
GUI, Workflow,
Search & Retrieval
...
CMS Applikation
CMS APP
MyCoRe
'Persistenzlayer'
(proprietär)
Unterschiedliche
proprietäre Backends
Repository
7
Repository Infrastruktur
Mit Datenbank-/
XML-Schnittstelle
Interoperabilität im Content Management
MyCoRe: Detailarchitektur
8
Interoperabilität im Content Management
MyCoRe: Funktionalität
Modellierung und Administration von Dokumentenund Personen-Metadaten
Hierarchische Klassifikationssysteme
Integriertes WCMS-Modul
Benutzer- und Autoren-Interface
Integration von Audio- und Video-Streamings-Servern
Verteilte Suche und Schnittstellen zu OAI-PMH
Internes Dateisystem
9
Interoperabilität im Content Management
MyCoRe: Community
Uni Würzburg
Physik
Kopal:
DDB
SUB
GWDG
IBM
Dt.Hochsch. f.
Sport
TU BS, FB5
TU München
Uni Düsseldorf
FU Berlin
TU BS Bibl./RZ
Uni Münster
Uni EssenDuisburg
TU Dresden
Uni Kiel
Bonn
alle FBs,Bibliothek
MILESS
FHG Rostock
Uni Leipzig
Uni Jena
Uni Greifswald
Uni Leipzig
Rechtsmedizin
Uni Krakow
Jagiellonska
10
Kunstgeschichte
DFG
Videoteaching
Landesbib.MV
Landesarchiv
Greifswald
Uppsala
MyCoRe
Open Source Code
Uni Rostock
FHs
in
MV
Uni Hamburg
Uni Halle
Uni Freiburg
ohne MyCoRe
Museums
mit MyCoRe
-Eremitage, St Petersb.
MoMA, NY
Ägypt National Museum
SMK, Kopenh.
Leistungsangebote
Media customers:
nur MyCoRe
CNN
Sesam Workshop
National Geographic
Interoperabilität im Content Management
CMS MyCoRe im GAP-Verbund
Mitarb
eiter Kund
Guta
en
chter
Auto
Hambu
ren
rg
UP
Front
Offices
Univ.Verlag
Mitarb
GÖ
eiter Kund
Guta
en
chter
Auto
ren
Academic
Communities
11
...
...
...
- Organisation
- Publikation
(funktional &
technisch)
- Logistik&
Marketing
CMS!
Guta
chter
Univ.Verlag
KA
Mitarb
eiter Kund
Auto
ren
en
Mitarb
eiter Kund
Guta
en
chter
Auto
ren
BISVerlag
OL
Backoffice
FQS / FU
Berlin
Mitarb
eiter Kund
Guta
en
chter
Auto
ren
Interoperabilität im Content Management
CMS-Zugriff / monolithisch
(Hamburg UP)
WWW
Hamburg UP
Hamburg UP Portal Funcs
MyCoRe
IBM-CM
DB2
(Objekte)
12
CMS-Zugriff / verteilt und
heterogen (GAP+)
Interoperabilität im Content Management
WWW
GAP BO
'Kleiner' Partner
'Sehr kleiner' Partner
Funktionen
Portal
CMS
Zope
Portal
Data
Store
Hamburg UP
FU Berlin
Portal
MyCoRe
IBM-CM
DB2
13
Brasilien
Portal
Portal
NPS
Oracle
Zope
MySQL
Interoperabilität im Content Management
Schnittstellen: zu welchem Zweck?
Search & Retrieval von Metadaten (Z39.50, OAI)
aber auch:
Verteilte Bearbeitung: Lesen + Schreiben (=> Linking,
Locking etc.)
Reviewing
Annotation
Versionierung
Authentifizierung von Akteuren und Dokumenten
Search & Retrieval von Primärdaten (Volltext)!
14
Interoperabilität im Content Management
Schnittstellen: wo?!
GUI, Workflow,
Search & Retrieval
...
CMS
APPS
CMS APP
MyCoRe
Proprietärer
'Persistenzlayer'
Unterschiedliche
proprietäre Backends
Repository
15
aDORe
JSR
Repositories
Interoperabilität im Content Management
ADORe: APP (und Repository?)
HvdS @ OAI4 (2005)
Standards used in aDORe include:
XML,
XML Schema,
MPEG-21 Digital Item Declaration,
MPEG-21 Digital Item Identification,
W3C XML Signatures,
OAI-PMH,
NISO OpenURL Framework for Context-Sensitive Services,
Internet Archive ARC file format,
OAIS concepts
Mixtur von Applikations- und Repository-Schnittstellen
16
TechReport
ARC
OAI-PMH request
DIDs
DID
DID
DID
A&I
DID
DID +
DIM
DID
A&I
Identifier
Locator
DID
FTXT
DID
DID
ARC
OpenURL
OpenURL
Profile/
Behavior
Registry
baseURL(4)
DID
OpenURL
DID
transformed
content
ARC
DID
Registry
of transformations
ARC
OpenURL
DID
baseURL(3)
DID
OpenURL
DID
DIM
Inserter
ARC
DID
DID
MPEG-21
DIP
Engine
ARC
OpenURL
DID
Content-id or
Package-id
baseURL(n) & Package-id
baseURL(2)
OAI-PMH Federator
DID, METS,
IMS-CP, ...
DID
OpenURL
DID
OAI-PMH request
Identifier
Locator
ARC
DID
DID
OAI-PMH request
ARC
OpenURL
Compound
objects
DID
baseURL(1)
DID
OpenURL
DID
DID
FTXT
ARC
OAI-PMH request
DID
DID
DID
DID
Repository
Index
Ingest
Repository
Registry
baseURL(1)
baseURL(2)
baseURL(3)
baseURL(4)
baseURL(x)
BaseURL
ARC
OpenURL
OpenURL gateway
DID
baseURL(x)
OpenURL
OpenURL
DID
TechReport
ARC
OAI-PMH request
DID
DIDs
DID
DID
OAI-PMH
Federator
DID
DID
DID
DID
A&I
Identifier
Locator
Dynamic
Dissemination
Engine
DID
FTXT
DID
DID
DID
ARC
OpenURL
OpenURL
Profile/
Behavior
Registry
baseURL(4)
DID
ARC
OpenURL
DID
Registry
of transformations
ARC
OpenURL
DID
baseURL(3)
DID
OpenURL
DID
DIM
Inserter
ARC
DID
DID
MPEG-21
DIP
Engine
ARC
OpenURL
DID +
DIM
DID
transformed
content
baseURL(2)
DID
DID
Content-id or
Package-id
baseURL(n) & Package-id
ARC
DID
OAI-PMH request
OAI-PMH Federator
DID, METS,
IMS-CP, ...
A&I
OpenURL
OAI-PMH request
ARC
OpenURL
DID
baseURL(1)
DID
OpenURL
DID
FTXT
ARC
OAI-PMH request
DID
DID
DID
DID
Repository
Index
Ingest
BaseURL
baseURL(1)
baseURL(2)
baseURL(3)
baseURL(4)
baseURL(x)
OpenURL
Resolver
ARC
OpenURL
OpenURL gateway
DID
baseURL(x)
OpenURL
OpenURL
DID
Interoperabilität im Content Management
aDORe: Funktionalität
Protokollbasierte modulübergreifende Interaktion
Für Operationen über
'Compound Objects'
Has a persistent identifier
Contain materials and metadata about those materials
Can contain other compound objects
19
Interoperabilität im Content Management
Schnittstellen: wo?!
GUI, Workflow,
Search & Retrieval
...
CMS
APPS
CMS APP
MyCoRe
JSR 170 / 283
JSR-konforme
Backends
(IBM, Apache ...)
Repository
20
Repositories
JSR 170 / 283: Gekapselte
Funktionalität (Auswahl)
Granular Read/Write Access Interoperabilität im Content Management
This is the bi-directional interaction of content elements.
Issues with access on a property level and not just on a "document" leve
Versioning -
Transparent version handling across the entire content repository, would provide the
ability to create versions of any content within the repository and select versions for any content
access or modification.
Hard- and Soft-structured Content - An Object Model that defines how hard and softstructured content could be addressed.
Event Monitoring (Observation) -
Possible use of JMS based notification framework
allowing for subscription on content modification.
Full-text Search and filtering -
The entire (non-binary) content of the repository could be
indexed by a full-text search engine that enables exact and sub-string searching of content.
Access Control -
Unified, extensible, access control mechanisms.
Namespaces & Standard Properties -
Defining default standard properties that will
maintain namespace uniqueness and hierarchy.
Locking and Concurrency -
Standardized access to locking and concurrency features of a
repository.
Linking -
A standard mechanism to soft/hard link items and properties in a repository along with
providing a mechanism to create relationships in the repository.
21
Interoperabilität im Content Management
Konsequenzen für die
Schnittstellenlozierung
+ aDORe: W3C Mainstream
- aDORe: unklare / unzureichende Funktionalität
- aDORe: Komplexität, Entwicklungsaufwand (in Open SourceProjekten tödlich!)
+ JSR: Mächtige Funktionalität
+ JSR: Entwicklungsökonomie
- JSR: Backend-Unterstützung
=> Lassen Sie uns gemeinsam darüber sprechen!
Danke für Geduld und Aufmerksamkeit!
Mehr
unter http://www.mycore.de und http://www.rrz.uni-hamburg.de
22

Logistik& Marketing CMS!