070315 mediator praesentation tsi mms final by XNWk4d6R

VIEWS: 0 PAGES: 27

									„Abfrage heterogener Ressourcen durch Mediatoren“
                           Präsentation
                           Lennart Reuther

                           T-Systems MMS GmbH
                           15.März 2007
Abfrage heterogener Ressourcen durch Mediatoren

      Überblick

      •    Mediator
      •    Schichten der Datenintegration
            • Datenschicht
            „Abfrage heterogener Ressourcen durch Mediatoren“
            • Ontologieschicht

            • Inhaltsschicht             Präsentation
                                         Lennart Reuther
      •    Vorteile
                                         T-Systems MMS GmbH
      •    Anwendungsgebiete             15.März 2007




12-09-16                 Abfrage heterogener Resourcen durch Mediatoren   2
Datenbank / Internet abgrenzung
•deklarative Datenbanksprachen   •Webseiten
(Bsp.: SQL)                           Foren

    erlauben gezielte Suche
                                      Präsentationsseiten
     nach Information und             Wissensbasen
    liefern eine gefilterte
                                 •RSS-Feeds
     Teilmenge des
                                      Podcast
     zugrundeliegenden
     Informationsbestandes.           Live-Bookmarks

                                      SMIL-Präsentationen
       owner events
               prescription
select * from from estateAgent   stellen Sichten auf die verteilten
     where date=now()
           patient=“Th. Unglaub“
  where city=“Berlin“
  andand city=“dresden“ good“;
      condition = „very
         medicine=“stimulant„
                                 Datenquellen des WWW dar
               date >= date_sub(
           and style=“jazz“;
                now(), 14 days);




12-09-16                Abfrage heterogener Resourcen durch Mediatoren   3
förderatives DBMS
mehrere lokale Datenhaltungssysteme
          durch homogene Software-Schicht vereint
          erlaubt integrierte, einheitliche Verwendung der
           verschiedenen heterogenen Datenbestände




                                             GUI




12-09-16                 Abfrage heterogener Resourcen durch Mediatoren   4
Mediator
mehrere Informationsquellen durch virtuelle Integration
zusammengefasst




                                      GUI




12-09-16          Abfrage heterogener Resourcen durch Mediatoren   5
Mediator




                               GUI




12-09-16   Abfrage heterogener Resourcen durch Mediatoren   6
Mediator
                         Anfrage                                  Teilanfragen




           GUI




   nimmt Anfragen entgegen,
   kommuniziert mit den untereinander
    heterogenen Quellen
   fasst deren Ergebnisse zusammen
   beantwortet die gestellte Anfrage
                     Komposition                                 Teilergebnisse
12-09-16                     Abfrage heterogener Resourcen durch Mediatoren       7
DatenintegrationSchichtenmodell



                                         Inhaltsschicht




                                                                           Domänen-
                                                                           wissen
                                  Ontologieschicht



                              Datenschicht




           
              inhaltlicher Ergebnisse aus verschiedenen Quellen
               Angleichen derVergleich des gewonnenen Wissen
               Vereinheitlichen der
               in struktureller Weise
               Wortwahl/Begriffsbedeutung konzeptionell
               der voneinander unabhängigen Quellen
12-09-16                  Abfrage heterogener Resourcen durch Mediatoren              8
Datenschicht
Angleichen der Ergebnisse aus verschiedenen Quellen
in struktureller Weise
          lokales Komponentenschema in integriertes Schema
           umwandeln
          relevante Daten erfassen
          redundante Bestandteile vernachlässigen




12-09-16                  Abfrage heterogener Resourcen durch Mediatoren   9
Datenschicht
Umsetzung:
          XSLT, XQuery für XML-Formate
          SPARQL für RDF
          Ansatz LMU München: Xcerpt




12-09-16                 Abfrage heterogener Resourcen durch Mediatoren   10
DatenschichtMediator
                    Anfrage                                 Teilanfragen




           GUI




                 Komposition                               Teilergebnisse
12-09-16               Abfrage heterogener Resourcen durch Mediatoren       11
DatenschichtMediator
                 Anfrage                                                        Teilanfragen
                                      Dekomposition und
                                 Transformation in Teilanfragen

             Integriertes
            Komponenten-
               schema




           GUI                                                                          Wrapper
                                                                                       für lokales
                                                                                     Komponenten-
                                                                                        schema




            Komposition                    transformierte
                                           Teilergebnisse                    Teilergebnisse

12-09-16                    Abfrage heterogener Resourcen durch Mediatoren                           12
DatenintegrationSchichtenmodell



                                      Inhaltsschicht




                                                                        Domänen-
                                                                        wissen
                             Ontologieschicht



                           Datenschicht




          Vereinheitlichen der
           Wortwahl/Begriffsbedeutung konzeptionell
12-09-16               Abfrage heterogener Resourcen durch Mediatoren              13
Ontologieschicht
konzeptionelles Vereinheitlichen


Wortwahl/Begriffsbedeutung
          Ober-/Unterbegriffe
          Term beschreibt unterschiedliche Konzepte (Blume)
          Verneinung
          abweichende Modellierungsparadigmen, -konventionen
          abweichende Granularität
          verschiedene Abdeckung
          unterschiedliche Standpunkte
abweichende Begriffstermini/ Relationsbezeichnungen
ausgleichen



12-09-16                 Abfrage heterogener Resourcen durch Mediatoren   14
Ontologieschicht
Konzepte
Instanzen


technische Umsetzung
          RDF/RDF-S
           (Ressource Description Framework)
          OWL - Web Ontology Language
          Ontology-Alignment-Systeme




12-09-16                 Abfrage heterogener Resourcen durch Mediatoren   15
OntologieschichtMediator
                 Anfrage                                                       Teilanfragen
                                     Dekomposition und
                                Transformation in Teilanfragen




           GUI




            Komposition                   transformierte
                                          Teilergebnisse                    Teilergebnisse

12-09-16                   Abfrage heterogener Resourcen durch Mediatoren                     16
OntologieschichtMediator
                  Anfrage                                                          Teilanfragen
                                        Dekomposition und
                                   Transformation in Teilanfragen




           GUI




                 Ontologie-
                 Anpassung

            Komposition                      Konzept-
                                              wissen                           Teilergebnisse

12-09-16                      Abfrage heterogener Resourcen durch Mediatoren                      17
DatenintegrationSchichtenmodell



                                 Inhaltsschicht




                                                                    Domänen-
                                                                    wissen
                           Ontologieschicht



                       Datenschicht




    inhaltlicher Vergleich des gewonnenen Wissen der
     voneinander unabhängigen Quellen
12-09-16           Abfrage heterogener Resourcen durch Mediatoren              18
Inhaltsschicht
vergleicht gewonnenes Wissen inhaltlich
          typographische Anpassung
          Standardisierung
          Datenaufnahme-Fehler
          Wortvertauschungen (Swapping)
          falsche Buchstabierung
Identifizierung und Zuordnung von Duplikaten anhand
inhaltlicher Informationen
   Verknüpfung von als identisch erkannten Klassen




12-09-16                  Abfrage heterogener Resourcen durch Mediatoren   19
Inhaltsschicht
Blockierungen
          Entfernen von Vergleichsdatensätzen, die auf keinen
           Fall zusammengehören
Frequenzbasierte Anpassungen
          Gewichtung von Datensätzen aufgrund der
           Gesamthäufigkeit ihrer Subterme
statische Zeichenketten-Vergleiche
          Untersuchung von Wortgruppen nach
           typographischen Abweichungen
Klassifizierung
          Beschreibung



12-09-16                  Abfrage heterogener Resourcen durch Mediatoren   20
InhaltsschichtMediator




           GUI




                                 Konzept-
                                  wissen

12-09-16         Abfrage heterogener Resourcen durch Mediatoren   21
InhaltsschichtMediator




           GUI




                                 Konzept-
                                  wissen

12-09-16         Abfrage heterogener Resourcen durch Mediatoren   22
Vorteile
Zeit-Ersparnis
          Abfrage-Dauer = Dauer der langsamsten Quelle +
           Umwandlungsdauer
          Quellen-Abfrage von besser angebundenem System
          Nur „Essenz“ für den Kunden
Übersichtlichkeit:
          homogene Sicht auf Gesamtergebnis, Sortierung möglich,
          Nutzung innerhalb weiterer Obersysteme
Mehrwert für bestehende Suchmaschinen
          zentrale Kunden-Anlaufstelle
          Individualisierbar



12-09-16                  Abfrage heterogener Resourcen durch Mediatoren   23
Anwendung
individuelle Termin-Zusammenstellung
          – Preisabfragen
Abgleich personenbezogener, medizinischer Daten




12-09-16           Abfrage heterogener Resourcen durch Mediatoren   24
Zusammenfassung
    Mediator  Suchmaschine „on demand“
    Interessantes Thema für die T-Systems MMS?




12-09-16          Abfrage heterogener Resourcen durch Mediatoren   25
Zusammenfassung




12-09-16   Abfrage heterogener Resourcen durch Mediatoren   26
„Abfrage heterogener Ressourcen durch Mediatoren“
                           Vielen Dank für Ihre
                           Aufmerksamkeit…

								
To top