Benzinpreis - Studenten f�r Studenten, Hausarbeiten, Referate by 3QU3z74

VIEWS: 38 PAGES: 11

									B 2. Daten auswerten mit Kenngrößen (statistische Parameter)

In der Phase der Datenauswertung wird versucht, charakteristische Aspekte von
Häufigkeitsverteilungen in Maßzahlen zu quantifizieren. Zielsetzung ist, mit Hilfe nur
einiger weniger Maßzahlen zu einem groben, aber tendenziell charakteristischen und
zutreffenden Bild der Masse zu kommen, ohne sie im Detail betrachten zu müssen.
Die Maßzahlen sind Kennzahlen vergleichbar, die die Reduktion großer Datenmen-
gen mit vielen Details in einige wenige Kerninformationen bewerkstelligen sollen.
Dazu ist eine gezielte und massive Auswertung der Daten notwendig, die über die
bereits behandelte Datenaufbereitung weit hinausgeht.

Für die in diesem Abschnitt behandelten univariaten Häufigkeitsverteilungen sind im
allgemeinen eine Reihe von Aspekten typisch, die folgende Übersicht zeigt.

                               Verteilungsaspekte


               Lage          Streuung              Schiefe         Wölbung

Lagemaße sollen – wie die Bezeichnung bereits andeutet – vor allem die
charakteristische Lage der Häufigkeitsverteilung eines Merkmals in einer Maßzahl
zum Ausdruck bringen. Mittelwerte als wichtigste Lagemaße sollen die „tendenzielle
Mitte“ einer Verteilung angeben. So soll etwa bei der Leistungsbeurteilung ein
Mittelwert Auskunft darüber geben, ob die Leistungen insgesamt tendenziell eher gut
oder eher ausreichend sind.

Mit einem Streuungsmaß soll gemessen werden, in welchem Umfang die Werte
eines Merkmals in der Masse insgesamt variieren. So mögen etwa in einem Betrieb
überwiegend jüngere Mitarbeiter beschäftigt sein, während in einem anderen alle
Altersgruppen im erwerbstätigen Alter vorhanden sind. Quantifizieren kann man
diesen Unterschied durch die Werte eines geeigneten Streuungsmaßes.

Die Lage und insbes. die Mitte sowie die Streuung sind für alle Formen von Häufig-
keitsverteilungen relevant. Wegen ihrer großen praktischen Bedeutung werden die
wichtigsten Lage- und Streuungsmaße hier ausführlich behandelt. Schiefe und
Wölbung sind wichtige, aber nicht durchweg auftretende Charakteristika. Ihre
Maßgrößen werden hier nicht behandelt.

Die wichtigsten Lage- und Streuungsmaße für univariate Häufigkeitsverteilungen sind
in der folgenden Tabelle übersichtlich zusammengestellt.

Lagemaße insbes. Mittelwerte                    Streuungsmaße
Quartile                                        Spannweite
Häufigster Wert = Modus = Modalwert             Mittlerer bzw. zentraler Quartilsabstand
Zentralwert = Median                            durchschnittliche absolute Abweichung,
                                                durchschnittliche relative Abweichung
Durchschnittswert = arithmetisches Mittel       Varianz, Standardabweichung, Varia-
                                                tionskoeffizient

                                            1
An den Aufgaben dieses Abschnitts sollen Sie vor allem lernen wie man diese
Parameter   sachgerecht  ermittelt,   d.h.  das     Hauptlernziel  ist  die
Parameterermittlung.

Für die Ermittlung der meisten Parameter gibt es verschiedene Ansätze und For-
meln, die vor allem dadurch nötig werden, dass die Daten in unterschiedlichen
Formen (Datenstrukturen) vorliegen. Zu unterscheiden sind vor allem Ur- oder
Ranglisten, Häufigkeitsverteilungen und klassierte Häufigkeitsverteilungen. Für jeden
dieser praktisch wichtigen Fälle gibt es in diesem Abschnitt eine Aufgabe, die folgen-
de Zuordnungstabelle zeigt.

Vorliegende Datenstruktur          Aufgabe
Ur- oder Rangliste                 Benzinpreise
Häufigkeitsverteilung              Urlaub im Ostseebad
Klassierte Häufigkeitsverteilung   Umsatz Super-Döner

Bei der Parameterermittlung bietet EXCEL insgesamt gute Unterstützung.
 Für den Fall der Ur- oder Rangliste ist diese am weitestgehensten, da hier für die
   meisten Parameter spezifische statistische Funktionen zur Verfügung stehen.
 Für die anderen Fälle sind jeweils geeignete Formeln selbst einzugeben.
Beide Nutzungsmöglichkeiten von EXCEL werden bei der Lösung der Aufgaben im
Detail behandelt.

Ergänzende Lernziele sind:
 Eignungswürdigung und sinnvolle Auswahl von Parametern im jeweils vorliegen-
   den Anwendungsfall (Parameterauswahl).
 Interpretation sinnvoll ausgewählter und korrekt ermittelter Parameterwerte im
   Sachzusammenhang (sachgerechte Interpretation)

Bei diesen Lernzielen bietet EXCEL keine Unterstützung.

Die Eignungswürdigung - und die darauf basierende begründete Auswahl von im
jeweiligen Anwendungsfall sinnvollen Kenngrößen - ist eine wichtige Aufgabe der
sachlich sinnvollen methoden- und rechnergestützen quantitativen Datenanalyse.
Hier sollen sie lernen
 erst zu überlegen, bevor sie statistische Ansätze und Maßgrößen rechnerunter-
   stützt ermitteln bzw.
 bei bereits durch Systeme ermittelten Maßgrößen begründet auszuwählen,
   welche davon im vorliegenden Fall besonders geeignet sind.

Die sachgerechte Interpretation ermittelter Parameterwerte ist nicht immer ganz
einfach. Das liegt einmal daran, dass manche Maßgrößen nicht ganz einfach
konstruiert sind, und ihr Konstruktionskonzept vom Anwender verstanden sein muss.
Zum anderen daran, dass aufgrund ihrer Konstruktion und/oder der Dimension die
Parameterwerte für sich allein genommen nicht unmittelbar plausibel interpretierbar
sind. Meistens wird ein konkret ermittelter Parameterwert für den Anwender vor allem
durch Vergleich mit anderen Werten – Einzelwerten, Gruppenwerten und anderen
Parameterwerten – Bedeutung erlangen und im Sachzusammenhang zusätzliche
Erkenntnisse liefern können.



                                          2
B.2.1 Kenngrößen aus Ur- oder Rangliste

Bei dieser Aufgabe geht es schwerpunktmäßig um die Ermittlung von typischen
Kenngrößen zur Charakterisierung einer Häufigkeitsverteilung, hier einer
Benzinpreisverteilung von 20 Tankstellen in einer Stadt. Da die Benzinpreise als
aufsteigend sortierte Erhebungsdaten (Rangliste) vorliegen, sind die meisten
Kenngrößen durch in EXCEL verfügbare statistische Funktionen ermittelbar.

Die folgende Übersichtstabelle zeigt die im einzelnen nötigen Arbeiten und ihre
EXCEL- Unterstützung.

Fachliche Arbeiten                        EXCEL- Unterstützung             Symbol
Erhebungsdaten (Rangliste)                ------------------------------
Eingeben
Relevante Merkmalsausprägungen            Funktion Fortschreibung
sinnvoll geordnet eingeben
Absolute Häufigkeitsfunktion              Stat. Funktion „Häufigkeit“
ermitteln
Relative Häufigkeitsfunktion              Formel eingeben
ermitteln
Grafische         Darstellung      der    Diagramm-Assistent
Häufigkeitsfunktion erstellen
Quartile ermitteln                        Stat. Funktion „Quartil“
Häufigster Wert (Modus) ermitteln         Stat. Funktion „Modalwert“
Zentralwert (Median) ermitteln            Stat. Funktion „Median“
Durchschnittswert (arithmetisches         Stat. Funktion „Mittelwert“
Mittel) ermitteln
Spannweite ermitteln                      Formel eingeben
Mittleren Quartilsabstand ermitteln       Formel eingeben
Durchschnittliche             absolute    Stat. Funktion „Mittelabw.“
Abweichung ermitteln
Durchschnittliche              relative   Formel eingeben
Abweichung ermitteln
Varianz ermitteln                         Stat. Funktion „Varianzen“
Standardabweichung ermitteln               Stat. Funktion „Stabwn.“,
                                            Formel eingeben
Variationskoeffizient ermitteln           Formel eingeben

Ergänzend sind die ermittelten Kenngrößen auf ihre Eignung zur Charakterisierung
der Benzinpreisverteilung zu überprüfen und zu beurteilen (Eignungswürdigung) und
die wichtigsten Ergebnisse sachgerecht zu interpretieren und in einer Executiv
Summary zusammenzufassen (sachgerechte Interpretation und Zusammenfassung).
Hierbei bietet EXCEL keine Unterstützung.




                                               3
Aufgabe “Benzinpreis“
Die Verbraucherberatung stellte an einem Stichtag bei 20 zufällig ausgewählten
Tankstellen einer Großstadt folgende Preise für SUPER fest (DM/Liter und
aufsteigend geordnet).

1,909 1,909 1,919 1,919 1,919 1,919 1,919 1,929 1,939 1,939
1,959 1,959 1,959 1,969 1,979 1,979 1,979 1,989 1,989 1,999

Aufgabenstellungen
a. Ermitteln Sie die Häufigkeitsverteilung in einer Tabelle, stellen Sie sie in
   geeigneter Form grafisch dar und benennen Sie ihre Charakteristika (formal und
   inhaltlich).
b. Ermitteln Sie nachvollziehbar das untere und obere Quartil, den häufigsten, den
   mittleren und den durchschnittlichen Benzinpreis. Welche dieser Maßgrößen sind
   im vorliegenden Fall zur kompakten Charakterisierung der Benzinpreisverteilung
   Ihrer Meinung besonders geeignet? (Begründung)
c. Ermitteln Sie nachvollziehbar die Spannweite, den mittleren Quartilsabstand, die
   durchschnittliche    absolute      Abweichung      (auch    relativ),   Varianz,
   Standardabweichung und Variationskoeffizient. Welche dieser Maßgrößen sind im
   vorliegenden Fall zur kompakten Charakterisierung der Streuung der
   Benzinpreisverteilung Ihrer Meinung besonders geeignet? (Begründung)
d. Fassen Sie die wichtigsten Ergebnisse ihrer quantitativen Datenanalyse kurz und
   bündig zusammen (Executive Summary).

Aufgabenlösungen
a. Ermittlung,   grafische       Darstellung      und     Charakterisierung       der
   Benzinpreisverteilung

Ermittlung der Häufigkeitsfunktion (Häufigkeitstabelle)
Die folgende Abbildung zeigt die zu ermittelnde Häufigkeitsfunktion in Tabellenform.
Sie wird durch Erarbeiten der Spalteninhalte von links nach rechts erzeugt.

                                  1. Urliste bzw. Rangliste (Spalte A):
                                     Eingabe der vorliegenden Erhebungsdaten.

                                  2. Merkmalsausprägungen (SpalteB):
                                     Eingabe bzw. rechnerunterstützte Erzeugung
                                     aller sinnvollen, aufsteigend geordneten
                                     Merkmalsausprägungen.

                                  3. Absolute Häufigkeiten (Spalte C):
                                     Ermittlung mit der statistischen Funktion „Häu-
                                     figkeit“.

                                  4. Relative Häufigkeiten (Spalte D)
                                     Ermittlung      durch        Eingabe      und
                                     „Herunterkopieren“ einer geeigneten Formel.

Einzelheiten zur rechnergestützten Durchführung von 2.- 4. findet man im Abschnitt
1.1. bei der Aufgabe „Private Telefonate“.

                                          4
Grafische Darstellung der Häufigkeitsfunktion
Zur grafischen Darstellung der Häufigkeitsfunktion eines quantitativen, diskreten und
nicht-klassierten Merkmals ist das Stab- bzw. Liniendiagramm gut geeignet. Es ist in
Excel nicht als eigenständiger Diagrammtyp verfügbar. Man kann es in guter
Näherung aus dem Diagrammtyp „Säulendiagramm“ erzeugen. Dazu muß man mit
der Kontexttaste eine beliebige Säule markieren und bei der Option Datenreihen
formatieren den Säulenabstand im Register Optionen so groß wie möglich wählen.

Die folgende Abbildung zeigt das resultierende Stabdiagramm.


                                            Benzinpreisentwicklung

                      0,3


                     0,25
   Rel. Häufigkeit




                      0,2


                     0,15


                      0,1


                     0,05


                       0
                            1,909   1,919   1,929   1,939   1,949   1,959   1,969   1,979   1,989   1,999

                                                       Benzinpreis (DM/l)


Charakteristika
Formal: die Verteilungsform ist mehrdeutig:
 zum einen kann man sie als eingipflig und rechtsschief ansehen;
 zum anderen kann man sie aber auch als zweigipflig deuten.
Inhaltlich: es gibt eine deutliche Zweiteilung der Häufigkeitsverteilung:
 eine Häufung bei niedrigen Preisen zwischen 1,909 und 1,939 mit dem häufigs-
   ten Preis von 1,919 (DM/L).
 eine zweite Häufung bei hohen Benzinpreisen zwischen 1,959 und 1,999 (DM/L).
Zwischen diesen beiden Häufigkeitsmassierungen hat die Verteilung ein kleines,
aber wahrnehmbares „Loch“.

b. Wichtige Lagemaße insbes. Mittelwerte
Ermittlung
Zur Ermittlung von Lageparametern eindimensionaler Häufigkeitsverteilungen stehen
in Excel statistische Funktionen zur Verfügung. Anwendungsvoraussetzungen
dieser Funktionen sind durchweg:
 quantitative Merkmale, die metrisch skaliert sind.
 Daten aus Ur- oder Ranglisten, nicht aber aus Häufigkeitsverteilungen.
Beide Anwendungsvoraussetzungen sind im vorliegenden Fall erfüllt.

                                                             5
Die gewünschten Lagemaße können alle mit den verfügbaren statistischen
Funktionen ermittelt werden. Diese werden vom ungeübten Benutzer am
einfachsten mit Hilfe des Funktionsassistenten aufgerufen und ausgeführt. Der
geübte Benutzer wird dagegen unter Umständen den direkten Funktionsaufruf
durch Eingabe der korrekten Funktionsbezeichnung und –parameter vorziehen.

1. Quartile
= Quartil (Matrix; Quartil)
Nach Aufruf der Funktion Quartile erscheint die unten abgebildete Dialogbox. Diese
enthält im unteren Teil Erläuterungen und im oberen Teil die Funktionsparameter
mit Feldern für die Parameterwerte.
Der Parameter Matrix bezeichnet den Datenbereich, für den Quartile ermittelt
werden sollen. Beim Parameter Quartil ist anzugeben, welches Quartil ermittelt
werden soll. Dabei entspricht dem Parameterwert 1 das erste oder unterer Quartil,
dem Wert 2 das 2. oder mittlere Quartil (Median) und dem Wert 3 das 3. oder obere
Quartil.

                                                            In der Abbildung ist die
                                                            Parameterversorgung zur
                                                            Berechnung       des       1.
                                                            Quartils auf den Daten der
                                                            Rangliste     und       eine
                                                            Vorschau       auf       das
                                                            Ergebnis                 der
                                                            Funktionsausführung zu
                                                            sehen: 1,919 (DM/l) ist
                                                            der Benzinpreis, der von
                                                            den      25%      billigsten
Tankstellen nicht überschritten wird. Die übrigen Quartile berechnet man analog.

2. Häufigster Wert (Modus, Modalwert)
= MODALWERT (Zahl1; Zahl 2; ...)
Nach Aufruf der Funktion Modalwert erscheint die unten abgebildete Dialogbox.
Diese enthält im unteren Teil Erläuterungen und im oberen Teil die
Funktionsparameter mit Feldern für die Parameterwerte. Der Parameter Zahl1
kennzeichnet den Datenbereich, dessen häufigster Wert ermittelt werden soll.
EXCEL kann für max. 30 Datenbereiche gleichzeitig den Modus berechnen.
                                                        Enthält einer der Bereiche
                                                        leere Zellen, Texte oder
                                                        Wahrheitswerte, werden
                                                        diese Zellen ignoriert.
                                                        Zellen, die den Wert 0
                                                        enthalten,         werden
                                                        dagegen berücksichtigt.
                                                        Falls in den Bereichen
                                                        keine mehrfachen Werte
                                                        vorkommen, liefert die
                                                        Formel den Fehlerwert
#NV.


                                           6
In der obigen Abbildung ist die Datenversorgung der Funktion aus der Rangliste und
eine Vorschau auf das Ergebnis der Funktionsausführung zu sehen: 1,919 (DM/l) ist
der häufigste Benzinpreis, was allerdings bereits aus der Häufigkeitsfunktion (Tabelle
oder Diagramm) bekannt ist.

3. Mittlerer Wert (Zentralwert, Median)
=MEDIAN(Zahl1;Zahl 2;...)
Nach Aufruf der Funktion Median erscheint die unten abgebildete Bildschirmmaske.
Sie ist in Aufbau und Parametern identisch mit der der Funktion Modalwert.
Die dort gemachten Ausführungen zu den Parametern Zahl 1 usw. gelten analog.

                                                           EXCEL       ermittelt    den
                                                           Median        aus       einer
                                                           Rangliste       als      den
                                                           Merkmalswert             des
                                                           mittleren Elements. Bei
                                                           einer geraden Zahl von
                                                           Elementen gibt es kein
                                                           Element, das genau in der
                                                           Mitte liegt. In diesem Fall
                                                           berechnet EXCEL als Me-
                                                           dian      das       einfache
arithmetische Mittel der beiden mittleren Elemente. Diese Berechnungsweise ist nicht
unstrittig, da der so ermittelte Median kein tatsächlich in der Masse
vorkommender Merkmalswert mehr ist. Außerdem kann er von andersartig
berechneten abweichen. So kann man den Median als mittleres Quartil auch über die
Funktion Quartil berechnen.
In der obigen Abbildung ist die Datenversorgung der Funktion aus der Rangliste und
eine Vorschau auf das Ergebnis der Funktionsausführung zu sehen: 1,949 (DM/L) ist
der mittlere Benzinpreis.

4. Durchschnittswert (Arithmetisches Mittel)
=MITTELWERT(Zahl1;Zahl 2;...)
Nach Aufruf der Funktion Mittelwert erscheint die unten abgebildete
Bildschirmmaske. Sie ist in Aufbau und Parametern identisch mit der der Funktionen
Modalwert und Median. Die dort gemachten Ausführungen zu den Parametern Zahl
1 usw. gelten analog.
                                                          In der nebenstehenden
                                                          Abbildung      ist     die
                                                          Datenversorgung       der
                                                          Funktion     aus      der
                                                          Rangliste    und     eine
                                                          Vorschau      auf     das
                                                          Ergebnis              der
                                                          Funktionsausführung zu
                                                          sehen: 1,949 (DM/L) ist
                                                          der     durchschnittliche
                                                          Benzinpreis.




                                           7
                                 Im Bildschirmausschnitt links sind die berechneten
                                 Lagemaße zusammengestellt.




Eignungswürdigung
Bei quantitativen, metrisch skalierten Merkmalen sind alle ermittelten Lagemaße
prinzipiell zulässig anwendbar.
 Die Quartile sind praktisch immer – so auch im vorliegenden - geeignet, die Lage
    und die strukturellen Proportionen einer Verteilung zu charakterisieren.
 Der Modus ist praktisch immer – so auch im vorliegenden Fall – ein die maximale
    Häufigkeitsballung charakterisierender Wert.
 Der Median ist ein gut verständlicher und interpretierbarer Mittelwert. Er ist auch
    bei kleinen statistischen Massen und nicht-symmetrischen Verteilungsformen –
    wie im vorliegenden Fall – zu Charakterisierung der tendenziellen Mitte einer
    Verteilung i.a. gut geeignet.
 Das         arithmetische       Mittel  –     wegen       seiner     mathematischen
    Optimalitätseigenschaften im allgemeinen der genaueste und in der Praxis am
    häufigsten benutzte Mittelwert – ist im vorliegenden Fall nicht besonders gut
    geeignet. Gründe sind die relativ kleine statistische Masse und die U-förmige
    Verteilungsform. Letztere führt dazu, daß der durchschnittliche Benzinpreis mit
    1,949 (DM/l) genau in das „Verteilungsloch“ fällt, und damit im vorliegenden Fall
    gerade nicht charakteristisch ist.


c. Wichtige Streuungsmaße
Ermittlung
Zur Ermittlung von Streuungsmaßen eindimensionaler Häufigkeitsverteilungen
stehen     in     Excel   statistische Funktionen     zur      Verfügung.
Anwendungsvoraussetzungen dieser Funktionen sind - wie auch bei den
Lagemaßen - durchweg :

   quantitative Merkmale, die metrisch skaliert sind.
   Daten aus Ur- oder Ranglisten, nicht aber aus Häufigkeitsverteilungen.

Beide Anwendungsvoraussetzungen sind im vorliegenden Fall erfüllt.

Die meisten der gewünschten Streuungsmaße können mit den verfügbaren
statistischen Funktionen ermittelt werden. Diese werden vom ungeübten Benutzer
am einfachsten mit Hilfe des Funktionsassistenten aufgerufen und ausgeführt. Der
geübte Benutzer wird dagegen unter Umständen den direkten Funktionsaufruf
durch Eingabe der korrekten Funktionsbezeichnung und –parameter vorziehen.

Für die Spannweite und den mittleren Quartilsabstandes stehen in Excel keine
spezifischen statistischen Funktionen zur Verfügung, so daß diese durch
Eingabe geeigneter Formeln zu ermitteln sind.

1. Spannweite


                                          8
                        Die Spannweite ist die Differenz zwischen dem kleinsten (MIN)
                        und dem größten Merkmalswert (MAX). Der kleinste und der
                        größte Wert können durch die gleichnamigen statistischen
                        Funktionen oder im vorliegenden Fall einfacher aus der
                        Rangliste übernommen werden. Der Bildschirmausschnitt links
                        zeigt
die für die Subtraktion einzugebende Formel. Als Ergebnis der der Formelausführung
erhält man den Wert 0,09. Zwischen dem höchsten und dem niedrigsten Benzinpreis
liegt eine Preisspanne von 9 (Pfg/L).

2. Mittlerer Quartilsabstand
                       Der mittlere Quartilsabstand ist die Differenz zwischen dem 3.
                       und dem 1. Quartil. Der Bildschirmausschnitt links zeigt die für
                       die Subtraktion einzugebende Formel. Als Ergebnis erhält
man den Wert 0,06. In diesem 6 (Pfg/L) breiten Intervall liegen die mittleren 50% der
Benzinpreise.

3. Durchschnittliche absolute Abweichung
=MITTELABW (Zahl1;Zahl 2;...)

Die durchschnittliche absolute Abweichung ist das arithmetische Mittel der absoluten
Abweichungen von einem Mittelwert, normalerweise vom arithmetischen Mittel. Wird
die Abweichung auf den Median als Mittelwert berechnet, wird sie häufig mittlere
absolute Abweichung genannt.
                                                         Im          nebenstehenden
                                                         Bildschirmausschnitt ist die
                                                         Datenversorgung          der
                                                         Funktion aus der Rangliste
                                                         und eine Vorschau auf das
                                                         Ergebnis                 der
                                                         Funktionsausführung       zu
                                                         sehen:
                                                         Im Durchschnitt weichen die
                                                         Benzinpreise um 2,7 (Pfg./L)
                                                         vom       durchschnittlichen
Benzinpreis ab.
Im allgemeinen ist es sinnvoll, die durchschnittliche absolute Abweichung ergänzend
als relative Größe – anwenderfreundlich in Prozent ausgedrückt - anzugeben. Diese
relative absolute Abweichung ist durch Eingabe einer geeigneten Formel zu
errechnen. Sie beträgt 1,385 %.

4. Varianz
=VARIANZEN(Zahl1;Zahl 2;...)
Die Varianz ist die durchschnittliche quadratische Abweichung aller Werte vom
Durchschnittswert. Der folgende Bildschirmausschnitt zeigt die Datenversorgung der
                                                     Funktion aus der Rangliste
                                                     und eine Vorschau auf das
                                                     Ergebnis                  der
                                                     Funktionsausführung:    0,087
                                                     (Pfennig zum Quadrat).


                                           9
Für den Anwender ist diese wichtige Streuungsgröße der Statistik allein schon wegen
der quadratischen Dimension sehr schwer anschaulich zu interpretieren. Deshalb
wird aus Anwendungssicht im allgemeinen die Standardabweichung bevorzugt.




5. Standardabweichung
=STABWN(Datenbereich1;Datenbereich2;...)
                                                   Die Standardabweichung
                                                   ist die Wurzel aus der
                                                   Varianz.
                                                   Im    Bildschirmausschnitt
                                                   links        ist      die
                                                   Datenversorgung       der
                                                   Funktion       aus    der
                                                   Rangliste      und   eine
                                                   Vorschau        auf   das
                                                   Ergebnis              der
                                                   Funktionsausführung zu
sehen: 2,9495762 (Pfg./L) ist die Standardabweichung vom durchschnittlichen
Benzinpreis.

6. Variationskoeffizient
Der Variationskoeffizient ist die relative Standardabweichung, bezogen auf den
Durchschnittswert. Er wird – wie auch die relative absolute Abweichung –
anwenderfreundlich meist in Prozent angegeben. Er ist durch Eingabe einer
geeigneten Formel zu ermitteln und beträgt im vorliegenden Fall 1,553 %.

                        Die ermittelten Streuungsmaße sind im Bildschirmausschnitt
                        links zusammengestellt.

                        Eignungswürdigung
                        Bei quantitativen, metrisch skalierten Merkmalen sind alle
                        ermittelten Streuungsmaße
                        prinzipiell zulässig anwendbar.

                           Die Spannweite ist allgemein - und auch im
                            vorliegenden Fall - ein ganz grobes Streuungsmaß, das
                            meist nur als Indikator dafür benutzt wird festzustellen,
                            ob eine genauere Streuungsermittlung nötig oder sinnvoll
                            ist.

   Der mittlere Quartilsabstand ist allgemein – und auch im vorliegenden Fall - ein
    einfaches und gut verständliches Maß zu Charakterisierung der mittleren 50%
    einer Häufigkeitsverteilung.

   Die mittlere absolute Abweichung ist allgemein eine gut verständliche und
    interpretierbare Streuungsgröße, die recht genau die durchschnittliche
    Abweichung aller übrigen Werte von einem Mittelwert mißt. Im vorliegenden Fall

                                         10
    ist sie die genaueste, sinnvoll ermittelbare Streungsgröße, da sie typischerweise
    auf den Median als Mittelwert berechnet wird, der als sinnvoller Mittelwert
    erachtet wurde.

   Varianz und Standardabweichung - als Standardstreuungsgrößen auch wegen
    ihrer hohen Genauigkeit häufig verwendet – sind im vorliegenden Fall nicht
    sinnvoll anwendbar, da das arithmetische Mittel, auf das sie berechnet werden, im
    vorliegenden Fall nicht als besonders geeignet angesehen wurde.



d. Ergebniszusammenfassung
Die Verteilung der Benzinpreise der betrachteten Tankstellen zeigt eine besondere
Form: sie ist tendenziell zweigipflig mit dem häufigsten Preis bei 1,919 (DM/L), einer
zweiten Häufigkeitsballung bei höheren Preisen [1.95,9 - 1.99,9 (DM/L)] und sehr
geringen Häufigkeiten im mittleren Preisbereich. Zur kompakten Charakterisierung
der Verteilung durch Kenngrößen eignen sich auf jeden Fall der häufigste
Benzinpreis mit 1,919 (DM/L) und als Mittelwert der mittlere Benzinpreis mit 1,949
(DM/L). Der mittlere Preis hat hohe Aussagekraft, da die durchschnittliche
Abweichung von ihm nur 2,7 (Pfg./L) bzw. ~1,3 % beträgt. Die geringe Streuung wird
auch durch den zentralen Quartilsabstand gut erfaßt: die mittleren 50% der
Benzinpreise liegen im Preisbereich zwischen 1,919 und 1,979 (DM/L).




                                         11

								
To top