Benzinpreis - Studenten f�r Studenten, Hausarbeiten, Referate
Document Sample


B 2. Daten auswerten mit Kenngrößen (statistische Parameter)
In der Phase der Datenauswertung wird versucht, charakteristische Aspekte von
Häufigkeitsverteilungen in Maßzahlen zu quantifizieren. Zielsetzung ist, mit Hilfe nur
einiger weniger Maßzahlen zu einem groben, aber tendenziell charakteristischen und
zutreffenden Bild der Masse zu kommen, ohne sie im Detail betrachten zu müssen.
Die Maßzahlen sind Kennzahlen vergleichbar, die die Reduktion großer Datenmen-
gen mit vielen Details in einige wenige Kerninformationen bewerkstelligen sollen.
Dazu ist eine gezielte und massive Auswertung der Daten notwendig, die über die
bereits behandelte Datenaufbereitung weit hinausgeht.
Für die in diesem Abschnitt behandelten univariaten Häufigkeitsverteilungen sind im
allgemeinen eine Reihe von Aspekten typisch, die folgende Übersicht zeigt.
Verteilungsaspekte
Lage Streuung Schiefe Wölbung
Lagemaße sollen – wie die Bezeichnung bereits andeutet – vor allem die
charakteristische Lage der Häufigkeitsverteilung eines Merkmals in einer Maßzahl
zum Ausdruck bringen. Mittelwerte als wichtigste Lagemaße sollen die „tendenzielle
Mitte“ einer Verteilung angeben. So soll etwa bei der Leistungsbeurteilung ein
Mittelwert Auskunft darüber geben, ob die Leistungen insgesamt tendenziell eher gut
oder eher ausreichend sind.
Mit einem Streuungsmaß soll gemessen werden, in welchem Umfang die Werte
eines Merkmals in der Masse insgesamt variieren. So mögen etwa in einem Betrieb
überwiegend jüngere Mitarbeiter beschäftigt sein, während in einem anderen alle
Altersgruppen im erwerbstätigen Alter vorhanden sind. Quantifizieren kann man
diesen Unterschied durch die Werte eines geeigneten Streuungsmaßes.
Die Lage und insbes. die Mitte sowie die Streuung sind für alle Formen von Häufig-
keitsverteilungen relevant. Wegen ihrer großen praktischen Bedeutung werden die
wichtigsten Lage- und Streuungsmaße hier ausführlich behandelt. Schiefe und
Wölbung sind wichtige, aber nicht durchweg auftretende Charakteristika. Ihre
Maßgrößen werden hier nicht behandelt.
Die wichtigsten Lage- und Streuungsmaße für univariate Häufigkeitsverteilungen sind
in der folgenden Tabelle übersichtlich zusammengestellt.
Lagemaße insbes. Mittelwerte Streuungsmaße
Quartile Spannweite
Häufigster Wert = Modus = Modalwert Mittlerer bzw. zentraler Quartilsabstand
Zentralwert = Median durchschnittliche absolute Abweichung,
durchschnittliche relative Abweichung
Durchschnittswert = arithmetisches Mittel Varianz, Standardabweichung, Varia-
tionskoeffizient
1
An den Aufgaben dieses Abschnitts sollen Sie vor allem lernen wie man diese
Parameter sachgerecht ermittelt, d.h. das Hauptlernziel ist die
Parameterermittlung.
Für die Ermittlung der meisten Parameter gibt es verschiedene Ansätze und For-
meln, die vor allem dadurch nötig werden, dass die Daten in unterschiedlichen
Formen (Datenstrukturen) vorliegen. Zu unterscheiden sind vor allem Ur- oder
Ranglisten, Häufigkeitsverteilungen und klassierte Häufigkeitsverteilungen. Für jeden
dieser praktisch wichtigen Fälle gibt es in diesem Abschnitt eine Aufgabe, die folgen-
de Zuordnungstabelle zeigt.
Vorliegende Datenstruktur Aufgabe
Ur- oder Rangliste Benzinpreise
Häufigkeitsverteilung Urlaub im Ostseebad
Klassierte Häufigkeitsverteilung Umsatz Super-Döner
Bei der Parameterermittlung bietet EXCEL insgesamt gute Unterstützung.
Für den Fall der Ur- oder Rangliste ist diese am weitestgehensten, da hier für die
meisten Parameter spezifische statistische Funktionen zur Verfügung stehen.
Für die anderen Fälle sind jeweils geeignete Formeln selbst einzugeben.
Beide Nutzungsmöglichkeiten von EXCEL werden bei der Lösung der Aufgaben im
Detail behandelt.
Ergänzende Lernziele sind:
Eignungswürdigung und sinnvolle Auswahl von Parametern im jeweils vorliegen-
den Anwendungsfall (Parameterauswahl).
Interpretation sinnvoll ausgewählter und korrekt ermittelter Parameterwerte im
Sachzusammenhang (sachgerechte Interpretation)
Bei diesen Lernzielen bietet EXCEL keine Unterstützung.
Die Eignungswürdigung - und die darauf basierende begründete Auswahl von im
jeweiligen Anwendungsfall sinnvollen Kenngrößen - ist eine wichtige Aufgabe der
sachlich sinnvollen methoden- und rechnergestützen quantitativen Datenanalyse.
Hier sollen sie lernen
erst zu überlegen, bevor sie statistische Ansätze und Maßgrößen rechnerunter-
stützt ermitteln bzw.
bei bereits durch Systeme ermittelten Maßgrößen begründet auszuwählen,
welche davon im vorliegenden Fall besonders geeignet sind.
Die sachgerechte Interpretation ermittelter Parameterwerte ist nicht immer ganz
einfach. Das liegt einmal daran, dass manche Maßgrößen nicht ganz einfach
konstruiert sind, und ihr Konstruktionskonzept vom Anwender verstanden sein muss.
Zum anderen daran, dass aufgrund ihrer Konstruktion und/oder der Dimension die
Parameterwerte für sich allein genommen nicht unmittelbar plausibel interpretierbar
sind. Meistens wird ein konkret ermittelter Parameterwert für den Anwender vor allem
durch Vergleich mit anderen Werten – Einzelwerten, Gruppenwerten und anderen
Parameterwerten – Bedeutung erlangen und im Sachzusammenhang zusätzliche
Erkenntnisse liefern können.
2
B.2.1 Kenngrößen aus Ur- oder Rangliste
Bei dieser Aufgabe geht es schwerpunktmäßig um die Ermittlung von typischen
Kenngrößen zur Charakterisierung einer Häufigkeitsverteilung, hier einer
Benzinpreisverteilung von 20 Tankstellen in einer Stadt. Da die Benzinpreise als
aufsteigend sortierte Erhebungsdaten (Rangliste) vorliegen, sind die meisten
Kenngrößen durch in EXCEL verfügbare statistische Funktionen ermittelbar.
Die folgende Übersichtstabelle zeigt die im einzelnen nötigen Arbeiten und ihre
EXCEL- Unterstützung.
Fachliche Arbeiten EXCEL- Unterstützung Symbol
Erhebungsdaten (Rangliste) ------------------------------
Eingeben
Relevante Merkmalsausprägungen Funktion Fortschreibung
sinnvoll geordnet eingeben
Absolute Häufigkeitsfunktion Stat. Funktion „Häufigkeit“
ermitteln
Relative Häufigkeitsfunktion Formel eingeben
ermitteln
Grafische Darstellung der Diagramm-Assistent
Häufigkeitsfunktion erstellen
Quartile ermitteln Stat. Funktion „Quartil“
Häufigster Wert (Modus) ermitteln Stat. Funktion „Modalwert“
Zentralwert (Median) ermitteln Stat. Funktion „Median“
Durchschnittswert (arithmetisches Stat. Funktion „Mittelwert“
Mittel) ermitteln
Spannweite ermitteln Formel eingeben
Mittleren Quartilsabstand ermitteln Formel eingeben
Durchschnittliche absolute Stat. Funktion „Mittelabw.“
Abweichung ermitteln
Durchschnittliche relative Formel eingeben
Abweichung ermitteln
Varianz ermitteln Stat. Funktion „Varianzen“
Standardabweichung ermitteln Stat. Funktion „Stabwn.“,
Formel eingeben
Variationskoeffizient ermitteln Formel eingeben
Ergänzend sind die ermittelten Kenngrößen auf ihre Eignung zur Charakterisierung
der Benzinpreisverteilung zu überprüfen und zu beurteilen (Eignungswürdigung) und
die wichtigsten Ergebnisse sachgerecht zu interpretieren und in einer Executiv
Summary zusammenzufassen (sachgerechte Interpretation und Zusammenfassung).
Hierbei bietet EXCEL keine Unterstützung.
3
Aufgabe “Benzinpreis“
Die Verbraucherberatung stellte an einem Stichtag bei 20 zufällig ausgewählten
Tankstellen einer Großstadt folgende Preise für SUPER fest (DM/Liter und
aufsteigend geordnet).
1,909 1,909 1,919 1,919 1,919 1,919 1,919 1,929 1,939 1,939
1,959 1,959 1,959 1,969 1,979 1,979 1,979 1,989 1,989 1,999
Aufgabenstellungen
a. Ermitteln Sie die Häufigkeitsverteilung in einer Tabelle, stellen Sie sie in
geeigneter Form grafisch dar und benennen Sie ihre Charakteristika (formal und
inhaltlich).
b. Ermitteln Sie nachvollziehbar das untere und obere Quartil, den häufigsten, den
mittleren und den durchschnittlichen Benzinpreis. Welche dieser Maßgrößen sind
im vorliegenden Fall zur kompakten Charakterisierung der Benzinpreisverteilung
Ihrer Meinung besonders geeignet? (Begründung)
c. Ermitteln Sie nachvollziehbar die Spannweite, den mittleren Quartilsabstand, die
durchschnittliche absolute Abweichung (auch relativ), Varianz,
Standardabweichung und Variationskoeffizient. Welche dieser Maßgrößen sind im
vorliegenden Fall zur kompakten Charakterisierung der Streuung der
Benzinpreisverteilung Ihrer Meinung besonders geeignet? (Begründung)
d. Fassen Sie die wichtigsten Ergebnisse ihrer quantitativen Datenanalyse kurz und
bündig zusammen (Executive Summary).
Aufgabenlösungen
a. Ermittlung, grafische Darstellung und Charakterisierung der
Benzinpreisverteilung
Ermittlung der Häufigkeitsfunktion (Häufigkeitstabelle)
Die folgende Abbildung zeigt die zu ermittelnde Häufigkeitsfunktion in Tabellenform.
Sie wird durch Erarbeiten der Spalteninhalte von links nach rechts erzeugt.
1. Urliste bzw. Rangliste (Spalte A):
Eingabe der vorliegenden Erhebungsdaten.
2. Merkmalsausprägungen (SpalteB):
Eingabe bzw. rechnerunterstützte Erzeugung
aller sinnvollen, aufsteigend geordneten
Merkmalsausprägungen.
3. Absolute Häufigkeiten (Spalte C):
Ermittlung mit der statistischen Funktion „Häu-
figkeit“.
4. Relative Häufigkeiten (Spalte D)
Ermittlung durch Eingabe und
„Herunterkopieren“ einer geeigneten Formel.
Einzelheiten zur rechnergestützten Durchführung von 2.- 4. findet man im Abschnitt
1.1. bei der Aufgabe „Private Telefonate“.
4
Grafische Darstellung der Häufigkeitsfunktion
Zur grafischen Darstellung der Häufigkeitsfunktion eines quantitativen, diskreten und
nicht-klassierten Merkmals ist das Stab- bzw. Liniendiagramm gut geeignet. Es ist in
Excel nicht als eigenständiger Diagrammtyp verfügbar. Man kann es in guter
Näherung aus dem Diagrammtyp „Säulendiagramm“ erzeugen. Dazu muß man mit
der Kontexttaste eine beliebige Säule markieren und bei der Option Datenreihen
formatieren den Säulenabstand im Register Optionen so groß wie möglich wählen.
Die folgende Abbildung zeigt das resultierende Stabdiagramm.
Benzinpreisentwicklung
0,3
0,25
Rel. Häufigkeit
0,2
0,15
0,1
0,05
0
1,909 1,919 1,929 1,939 1,949 1,959 1,969 1,979 1,989 1,999
Benzinpreis (DM/l)
Charakteristika
Formal: die Verteilungsform ist mehrdeutig:
zum einen kann man sie als eingipflig und rechtsschief ansehen;
zum anderen kann man sie aber auch als zweigipflig deuten.
Inhaltlich: es gibt eine deutliche Zweiteilung der Häufigkeitsverteilung:
eine Häufung bei niedrigen Preisen zwischen 1,909 und 1,939 mit dem häufigs-
ten Preis von 1,919 (DM/L).
eine zweite Häufung bei hohen Benzinpreisen zwischen 1,959 und 1,999 (DM/L).
Zwischen diesen beiden Häufigkeitsmassierungen hat die Verteilung ein kleines,
aber wahrnehmbares „Loch“.
b. Wichtige Lagemaße insbes. Mittelwerte
Ermittlung
Zur Ermittlung von Lageparametern eindimensionaler Häufigkeitsverteilungen stehen
in Excel statistische Funktionen zur Verfügung. Anwendungsvoraussetzungen
dieser Funktionen sind durchweg:
quantitative Merkmale, die metrisch skaliert sind.
Daten aus Ur- oder Ranglisten, nicht aber aus Häufigkeitsverteilungen.
Beide Anwendungsvoraussetzungen sind im vorliegenden Fall erfüllt.
5
Die gewünschten Lagemaße können alle mit den verfügbaren statistischen
Funktionen ermittelt werden. Diese werden vom ungeübten Benutzer am
einfachsten mit Hilfe des Funktionsassistenten aufgerufen und ausgeführt. Der
geübte Benutzer wird dagegen unter Umständen den direkten Funktionsaufruf
durch Eingabe der korrekten Funktionsbezeichnung und –parameter vorziehen.
1. Quartile
= Quartil (Matrix; Quartil)
Nach Aufruf der Funktion Quartile erscheint die unten abgebildete Dialogbox. Diese
enthält im unteren Teil Erläuterungen und im oberen Teil die Funktionsparameter
mit Feldern für die Parameterwerte.
Der Parameter Matrix bezeichnet den Datenbereich, für den Quartile ermittelt
werden sollen. Beim Parameter Quartil ist anzugeben, welches Quartil ermittelt
werden soll. Dabei entspricht dem Parameterwert 1 das erste oder unterer Quartil,
dem Wert 2 das 2. oder mittlere Quartil (Median) und dem Wert 3 das 3. oder obere
Quartil.
In der Abbildung ist die
Parameterversorgung zur
Berechnung des 1.
Quartils auf den Daten der
Rangliste und eine
Vorschau auf das
Ergebnis der
Funktionsausführung zu
sehen: 1,919 (DM/l) ist
der Benzinpreis, der von
den 25% billigsten
Tankstellen nicht überschritten wird. Die übrigen Quartile berechnet man analog.
2. Häufigster Wert (Modus, Modalwert)
= MODALWERT (Zahl1; Zahl 2; ...)
Nach Aufruf der Funktion Modalwert erscheint die unten abgebildete Dialogbox.
Diese enthält im unteren Teil Erläuterungen und im oberen Teil die
Funktionsparameter mit Feldern für die Parameterwerte. Der Parameter Zahl1
kennzeichnet den Datenbereich, dessen häufigster Wert ermittelt werden soll.
EXCEL kann für max. 30 Datenbereiche gleichzeitig den Modus berechnen.
Enthält einer der Bereiche
leere Zellen, Texte oder
Wahrheitswerte, werden
diese Zellen ignoriert.
Zellen, die den Wert 0
enthalten, werden
dagegen berücksichtigt.
Falls in den Bereichen
keine mehrfachen Werte
vorkommen, liefert die
Formel den Fehlerwert
#NV.
6
In der obigen Abbildung ist die Datenversorgung der Funktion aus der Rangliste und
eine Vorschau auf das Ergebnis der Funktionsausführung zu sehen: 1,919 (DM/l) ist
der häufigste Benzinpreis, was allerdings bereits aus der Häufigkeitsfunktion (Tabelle
oder Diagramm) bekannt ist.
3. Mittlerer Wert (Zentralwert, Median)
=MEDIAN(Zahl1;Zahl 2;...)
Nach Aufruf der Funktion Median erscheint die unten abgebildete Bildschirmmaske.
Sie ist in Aufbau und Parametern identisch mit der der Funktion Modalwert.
Die dort gemachten Ausführungen zu den Parametern Zahl 1 usw. gelten analog.
EXCEL ermittelt den
Median aus einer
Rangliste als den
Merkmalswert des
mittleren Elements. Bei
einer geraden Zahl von
Elementen gibt es kein
Element, das genau in der
Mitte liegt. In diesem Fall
berechnet EXCEL als Me-
dian das einfache
arithmetische Mittel der beiden mittleren Elemente. Diese Berechnungsweise ist nicht
unstrittig, da der so ermittelte Median kein tatsächlich in der Masse
vorkommender Merkmalswert mehr ist. Außerdem kann er von andersartig
berechneten abweichen. So kann man den Median als mittleres Quartil auch über die
Funktion Quartil berechnen.
In der obigen Abbildung ist die Datenversorgung der Funktion aus der Rangliste und
eine Vorschau auf das Ergebnis der Funktionsausführung zu sehen: 1,949 (DM/L) ist
der mittlere Benzinpreis.
4. Durchschnittswert (Arithmetisches Mittel)
=MITTELWERT(Zahl1;Zahl 2;...)
Nach Aufruf der Funktion Mittelwert erscheint die unten abgebildete
Bildschirmmaske. Sie ist in Aufbau und Parametern identisch mit der der Funktionen
Modalwert und Median. Die dort gemachten Ausführungen zu den Parametern Zahl
1 usw. gelten analog.
In der nebenstehenden
Abbildung ist die
Datenversorgung der
Funktion aus der
Rangliste und eine
Vorschau auf das
Ergebnis der
Funktionsausführung zu
sehen: 1,949 (DM/L) ist
der durchschnittliche
Benzinpreis.
7
Im Bildschirmausschnitt links sind die berechneten
Lagemaße zusammengestellt.
Eignungswürdigung
Bei quantitativen, metrisch skalierten Merkmalen sind alle ermittelten Lagemaße
prinzipiell zulässig anwendbar.
Die Quartile sind praktisch immer – so auch im vorliegenden - geeignet, die Lage
und die strukturellen Proportionen einer Verteilung zu charakterisieren.
Der Modus ist praktisch immer – so auch im vorliegenden Fall – ein die maximale
Häufigkeitsballung charakterisierender Wert.
Der Median ist ein gut verständlicher und interpretierbarer Mittelwert. Er ist auch
bei kleinen statistischen Massen und nicht-symmetrischen Verteilungsformen –
wie im vorliegenden Fall – zu Charakterisierung der tendenziellen Mitte einer
Verteilung i.a. gut geeignet.
Das arithmetische Mittel – wegen seiner mathematischen
Optimalitätseigenschaften im allgemeinen der genaueste und in der Praxis am
häufigsten benutzte Mittelwert – ist im vorliegenden Fall nicht besonders gut
geeignet. Gründe sind die relativ kleine statistische Masse und die U-förmige
Verteilungsform. Letztere führt dazu, daß der durchschnittliche Benzinpreis mit
1,949 (DM/l) genau in das „Verteilungsloch“ fällt, und damit im vorliegenden Fall
gerade nicht charakteristisch ist.
c. Wichtige Streuungsmaße
Ermittlung
Zur Ermittlung von Streuungsmaßen eindimensionaler Häufigkeitsverteilungen
stehen in Excel statistische Funktionen zur Verfügung.
Anwendungsvoraussetzungen dieser Funktionen sind - wie auch bei den
Lagemaßen - durchweg :
quantitative Merkmale, die metrisch skaliert sind.
Daten aus Ur- oder Ranglisten, nicht aber aus Häufigkeitsverteilungen.
Beide Anwendungsvoraussetzungen sind im vorliegenden Fall erfüllt.
Die meisten der gewünschten Streuungsmaße können mit den verfügbaren
statistischen Funktionen ermittelt werden. Diese werden vom ungeübten Benutzer
am einfachsten mit Hilfe des Funktionsassistenten aufgerufen und ausgeführt. Der
geübte Benutzer wird dagegen unter Umständen den direkten Funktionsaufruf
durch Eingabe der korrekten Funktionsbezeichnung und –parameter vorziehen.
Für die Spannweite und den mittleren Quartilsabstandes stehen in Excel keine
spezifischen statistischen Funktionen zur Verfügung, so daß diese durch
Eingabe geeigneter Formeln zu ermitteln sind.
1. Spannweite
8
Die Spannweite ist die Differenz zwischen dem kleinsten (MIN)
und dem größten Merkmalswert (MAX). Der kleinste und der
größte Wert können durch die gleichnamigen statistischen
Funktionen oder im vorliegenden Fall einfacher aus der
Rangliste übernommen werden. Der Bildschirmausschnitt links
zeigt
die für die Subtraktion einzugebende Formel. Als Ergebnis der der Formelausführung
erhält man den Wert 0,09. Zwischen dem höchsten und dem niedrigsten Benzinpreis
liegt eine Preisspanne von 9 (Pfg/L).
2. Mittlerer Quartilsabstand
Der mittlere Quartilsabstand ist die Differenz zwischen dem 3.
und dem 1. Quartil. Der Bildschirmausschnitt links zeigt die für
die Subtraktion einzugebende Formel. Als Ergebnis erhält
man den Wert 0,06. In diesem 6 (Pfg/L) breiten Intervall liegen die mittleren 50% der
Benzinpreise.
3. Durchschnittliche absolute Abweichung
=MITTELABW (Zahl1;Zahl 2;...)
Die durchschnittliche absolute Abweichung ist das arithmetische Mittel der absoluten
Abweichungen von einem Mittelwert, normalerweise vom arithmetischen Mittel. Wird
die Abweichung auf den Median als Mittelwert berechnet, wird sie häufig mittlere
absolute Abweichung genannt.
Im nebenstehenden
Bildschirmausschnitt ist die
Datenversorgung der
Funktion aus der Rangliste
und eine Vorschau auf das
Ergebnis der
Funktionsausführung zu
sehen:
Im Durchschnitt weichen die
Benzinpreise um 2,7 (Pfg./L)
vom durchschnittlichen
Benzinpreis ab.
Im allgemeinen ist es sinnvoll, die durchschnittliche absolute Abweichung ergänzend
als relative Größe – anwenderfreundlich in Prozent ausgedrückt - anzugeben. Diese
relative absolute Abweichung ist durch Eingabe einer geeigneten Formel zu
errechnen. Sie beträgt 1,385 %.
4. Varianz
=VARIANZEN(Zahl1;Zahl 2;...)
Die Varianz ist die durchschnittliche quadratische Abweichung aller Werte vom
Durchschnittswert. Der folgende Bildschirmausschnitt zeigt die Datenversorgung der
Funktion aus der Rangliste
und eine Vorschau auf das
Ergebnis der
Funktionsausführung: 0,087
(Pfennig zum Quadrat).
9
Für den Anwender ist diese wichtige Streuungsgröße der Statistik allein schon wegen
der quadratischen Dimension sehr schwer anschaulich zu interpretieren. Deshalb
wird aus Anwendungssicht im allgemeinen die Standardabweichung bevorzugt.
5. Standardabweichung
=STABWN(Datenbereich1;Datenbereich2;...)
Die Standardabweichung
ist die Wurzel aus der
Varianz.
Im Bildschirmausschnitt
links ist die
Datenversorgung der
Funktion aus der
Rangliste und eine
Vorschau auf das
Ergebnis der
Funktionsausführung zu
sehen: 2,9495762 (Pfg./L) ist die Standardabweichung vom durchschnittlichen
Benzinpreis.
6. Variationskoeffizient
Der Variationskoeffizient ist die relative Standardabweichung, bezogen auf den
Durchschnittswert. Er wird – wie auch die relative absolute Abweichung –
anwenderfreundlich meist in Prozent angegeben. Er ist durch Eingabe einer
geeigneten Formel zu ermitteln und beträgt im vorliegenden Fall 1,553 %.
Die ermittelten Streuungsmaße sind im Bildschirmausschnitt
links zusammengestellt.
Eignungswürdigung
Bei quantitativen, metrisch skalierten Merkmalen sind alle
ermittelten Streuungsmaße
prinzipiell zulässig anwendbar.
Die Spannweite ist allgemein - und auch im
vorliegenden Fall - ein ganz grobes Streuungsmaß, das
meist nur als Indikator dafür benutzt wird festzustellen,
ob eine genauere Streuungsermittlung nötig oder sinnvoll
ist.
Der mittlere Quartilsabstand ist allgemein – und auch im vorliegenden Fall - ein
einfaches und gut verständliches Maß zu Charakterisierung der mittleren 50%
einer Häufigkeitsverteilung.
Die mittlere absolute Abweichung ist allgemein eine gut verständliche und
interpretierbare Streuungsgröße, die recht genau die durchschnittliche
Abweichung aller übrigen Werte von einem Mittelwert mißt. Im vorliegenden Fall
10
ist sie die genaueste, sinnvoll ermittelbare Streungsgröße, da sie typischerweise
auf den Median als Mittelwert berechnet wird, der als sinnvoller Mittelwert
erachtet wurde.
Varianz und Standardabweichung - als Standardstreuungsgrößen auch wegen
ihrer hohen Genauigkeit häufig verwendet – sind im vorliegenden Fall nicht
sinnvoll anwendbar, da das arithmetische Mittel, auf das sie berechnet werden, im
vorliegenden Fall nicht als besonders geeignet angesehen wurde.
d. Ergebniszusammenfassung
Die Verteilung der Benzinpreise der betrachteten Tankstellen zeigt eine besondere
Form: sie ist tendenziell zweigipflig mit dem häufigsten Preis bei 1,919 (DM/L), einer
zweiten Häufigkeitsballung bei höheren Preisen [1.95,9 - 1.99,9 (DM/L)] und sehr
geringen Häufigkeiten im mittleren Preisbereich. Zur kompakten Charakterisierung
der Verteilung durch Kenngrößen eignen sich auf jeden Fall der häufigste
Benzinpreis mit 1,919 (DM/L) und als Mittelwert der mittlere Benzinpreis mit 1,949
(DM/L). Der mittlere Preis hat hohe Aussagekraft, da die durchschnittliche
Abweichung von ihm nur 2,7 (Pfg./L) bzw. ~1,3 % beträgt. Die geringe Streuung wird
auch durch den zentralen Quartilsabstand gut erfaßt: die mittleren 50% der
Benzinpreise liegen im Preisbereich zwischen 1,919 und 1,979 (DM/L).
11
Get documents about "