Das Gesetz der ersten Ziffer

Document Sample
Das Gesetz der ersten Ziffer Powered By Docstoc
					Sebastian Klink                                Moritz Henke
Korbacher Str. 337                             Thüringerstraße 7
34270 Schauenburg                              34314 Espenau
Tel.: 0 56 01 / 39 61                          Tel.: 0 56 73 / 91 38 69
Matrikelnummer: 21201914                       Matrikelnummer: 21209712




      Das Gesetz der ersten Ziffer




                     Projektarbeit im Rahmen des
                   Fachwissenschaftlichen Seminars

                               Leitung:
               Prof. Dr. Maria Specovius-Neugebauer




                             WS 2004/05
                        c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

Einleitung ___________________________________________________________________ 3


Geschichte ___________________________________________________________________ 4


Beispiele _____________________________________________________________________ 5


Einordnung __________________________________________________________________ 6


Mögliche Behandlung in der Schule ______________________________________________ 8


  Berechnung der Wahrscheinlichkeiten Pn(p) der ersten n natürlichen Zahlen als mögliche

  Zufallszahlen mittels Grenzwertbildung _______________________________________________ 8


  Grenzwertbestimmung: _____________________________________________________________ 9


  Die Ober- und Untergrenzen der anderen Ziffern ______________________________________ 10


  Benfords Gesetz: Veranschaulichung durch eine geometrische Reihe ______________________ 14


  Benfords Gesetz: Heuristische Erklärung _____________________________________________ 15


Was nütz es Benfords Gesetz zu kennen __________________________________________ 16


Auf Verbrecherjagd mit Benford ________________________________________________ 17


Literaturverzeichnis __________________________________________________________ 20




                                              2
                        c26ec13d-48e3-42e2-b508-9d23c949fb38.doc


Einleitung
Als wir anfingen, uns mit dem Gesetz der ersten Ziffer zu beschäftigen, konnten wir uns
noch nichts darunter vorstellen. Die einzige Häufigkeitsverteilung, die uns bis dahin
bekannt war, war die Gaußsche Normalverteilung. Das die Eins als Anfangsziffer in
natürlich entstandenen Datensätzen vorherrschend ist, war für uns beide neu. Für uns
hatte bis dahin jede Ziffer die gleiche Wahrscheinlichkeit (da die Null als erste Ziffer
nicht Zählt also 1/9) an erster Stelle zu stehen.
So gingen wir mit großer Neugier und hoher Motivation an die Bearbeitung des Themas.
Geschichte und Beispiele von Benfords Gesetz steigerten das Interesse am Thema.
Bei den mathematischen Hintergründen stießen wir jedoch schnell an unsere Grenzen,
da es sich hier um sehr komplexe mathematische Sachverhalte handelte (vgl. Pinkham
1961, Raimi 1969).
In einem Artikel der Istron-Gruppe (2000) fanden wir einen schönen Vorschlag, dieses
doch höchst spannende und realitätsbezogene Thema in den Mathematikunterricht
einzubringen und mit elementaren Mitteln zu behandeln.
Wir entschieden uns so dafür, diese mögliche Behandlung in der Schule vorzustellen.
Die geschichtliche Entwicklung, Einordnung und Nutzen des Gesetzes wollten wir dabei
jedoch nicht außer Acht lassen, da sie unserer Meinung einen interessanten Hintergrund
liefern.




                                              3
                           c26ec13d-48e3-42e2-b508-9d23c949fb38.doc


Geschichte
Berühmt wurde das Gesetzt durch Frank Benford, der 1938 Logarithmentafeln
beobachtete, doch schon 57 Jahre vor ihm hat Simon Newcomb dieses „Gesetzt“
beschrieben. In einem gewissen Sinn ist es zu Unrecht nach Benford benannt wurden.
Benford berichtete, dass die ersten Seiten von Logarithmentafeln viel dreckiger und
abgegriffener waren als die auf den hinteren. Bei anderen Büchern in der Bibliothek
wäre dies durchaus erklärbar, denn viele Leute beginnen ein Buch zu lesen und hören
aber vorzeitig damit auf, weil sie entweder keine Zeit mehr haben oder weil es ihnen zu
kompliziert wird (Fachbücher). Wenn viele Leute dies tun, ist es klar, dass diese
Beobachtung zutrifft, aber warum soll dies gerade bei Logarithmentafeln der Fall sein,
denn sie werden ja nach anderen Aspekten benutzt. Dies kann man sich nur dadurch
erklären, dass der Logarithmus von Zahlen mit niedrigen Anfangsziffern (1,2,…) häufiger
gesucht wurde als von Zahlen mit hohen Anfangsziffern (9,8,…). Aus diesem
Sachverhalt ergibt sich die Frage, ob Zahlen mit niedrigen Anfangsziffern in der Welt
häufiger vorkommen?
Es wird vermutet, dass sich dieses Gesetz dahinter verbirgt.


       P ( 1. Ziffer = p) = log10 (p+1) – log10 p, p= { 1,…,9 }
Addiert man die relativen Häufigkeiten der führenden Ziffern so ergibt sich der Wert 1.
 9
         p  1
 log
               1
               
i 1     p 
Dies kann man mit Hilfe der Logarithmengesetze leicht beweisen:
                      p  1
                      p 
P(1.Ziffer  p)  log      
                           

 9
         p  1       1  1        2  1              9  1        2 3 4 5 6 7 8 9 10      10 
 log
                log 
               
                        1 
                               log 
                                      2 
                                              ...  log 
                                                           9 
                                                                   log  * * * * * * * *   log    1
                                                                         1 2 3 4 5 6 7 8 9       1
i 1     p 




                                                  4
                           c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

Beispiele


Die folgenden Beispiele sollen zeigen, wo Benfords Gesetz überall auftritt. Benford
selber untersuchte das Auftreten der ersten Ziffer an 20 229 Datensätze (siehe Abb.1).




Abbildung 1: Relative Häufigkeit als Anfangsziffer, Benfords Fleißarbeit



Bei den ersten 100 Fibonaccizahlen tritt ebenfalls eine Verteilung der ersten Ziffer auf,
die der Verteilung nach Benford sehr ähnlich ist (siehe Abb.2).
                                                      Verteilung der Anfangsziffer bei den ersten
Ziffer          Verteilung nach Benfords Formel
                                                      100 Fibonaccizahlen
1               0,301030                              0,30
2               0,176091                              0,18
3               0,124939                              0,13
4               0,096910                              0,09
5               0,079181                              0,08
6               0,066947                              0,06
7               0,057992                              0,05
8               0,051153                              0,07
9               0,045757                              0,04

Abbildung 2: Verteilung der Anfangsziffern bei den ersten 100 Fibonaccizahlen (Quelle:
http://www.statistik.unidortmund.de/de/textonly/content/studieninteressierte/spiele/ziffern.html# )
Die nächste Abbildung zeigt graphisch die Ähnlichkeiten verschiedener Datensätze mit
der Benfordverteilung.




                                                  5
                          c26ec13d-48e3-42e2-b508-9d23c949fb38.doc




Abbildung 3: Häufigkeit der Anfangsziffern (Quelle: T.P. Hill, The First Digit Phenomenon,
American Scientist 86 (1998) Fig. 2)




Als Fazit lässt sich aus den erhobenen Daten folgendes festhalten:
An vielen völlig unterschiedlichen Zahlensammlungen und Datensätzen (sowohl
ganzzahliger als auch reeller Zahlen) beobachtet man folgendes: Lässt man die
führenden Nullen vor und nach dem Komma weg, so zeigt sich, dass als erste gültige
Ziffer (“First significant digit”) am häufigsten die 1 auftritt. Die 2 ist schon seltener, die 3
noch seltener, und so fort. Die 9 ist am seltensten. → Benfords Gesetz




Einordnung
Nicht alle Datenmengen gehorchen Benfords Gesetz. Es macht keinen Sinn, Daten zu
betrachten, die von vornherein auf einen Bereich eingeschränkt sind, der die Möglichkeit
für die erste Ziffer ziemlich einengt. Um eine Benford-Verteilung zu unterstellen, sollten
die folgenden Regeln erfüllt sein:


      Die zu analysierenden Zahlen sollten eine Größe der untersuchten Elemente
       beschreiben.
      Die Zahlen dürfen den Elementen nicht zu Identifikationszwecken zugeordnet
       worden sein (z.B. Kontonummer, Telefonnummer, Versicherungsnummer)

                                                 6
                           c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

          Es sollten keine festgelegten Grenzwerte innerhalb des Wertebereichs existieren.
           Andernfalls ist mit einer Häufung der Werte um diese definierten Minimum- bzw.
           Maximum-Grenzen zu rechnen.


Roger Pinkham zeigte, dass das Benford Gesetz universelle Gültigkeit besitzt und er
bewies außerdem, dass es das einzig mögliche Gesetz über Ziffernhäufigkeit ist,
welches skaleninvariant ist. Stewart (1994) beschreibt in seinem Aufsatz „Das Gesetzt
der ersten Ziffer“ skaleninvariant wie folgt:
„Ob du die Flächen der Bahama-Inseln in Quadratmeilen oder in Quadratkilometern mißt, ob du
alle Häuserzahlen mit sieben oder dreiundneunzig malnimmst, ob du die Halbwertszeiten
radioaktiver Isotope in Sekunden oder Jahrhunderten mißt - wenn die Datenmenge nur groß
genug ist, gilt stets dasselbe Gesetz.“


Wenn das Benford Gesetzt in einer Skala gilt, dann muss es auch für alle anderen
Skalen gelten. Die Verteilung des Vorkommens der ersten Ziffer darf sich also nicht
ändern, wenn die Zahlen (bei Umrechnung auf eine andere Skala) mit einem beliebigen
konstanten Faktor multipliziert werden. Die verwendeten Einheiten der physikalischen
Größen sind ja nicht von der Natur vorgegeben, sondern willkürlich vom Mensch
geschaffen. Letzte Zweifel konnte vor ein paar Jahren der Mathematiker Theodore Hill
ausräumen. Er fand heraus, dass es gewissermaßen die Mutter aller Verteilungsgesetze
ist.




                                                7
                             c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

Mögliche Behandlung in der Schule

Berechnung der Wahrscheinlichkeiten Pn(p) der ersten n natürlichen
Zahlen als mögliche Zufallszahlen mittels Grenzwertbildung


Zunächst ist klar, die Wahrscheinlichkeit für die einzelnen Ziffern, als erste Ziffer einer
Zufallszahl zu stehen, häng von der Grundgesamtheit des „Topfes“ ab, aus dem
gezogen wird. Das bedeutet, die Wahrscheinlichkeit jeder Ziffer = 1/9, wenn
Grundgesamtheit aus den ersten 9, 99, 999…natürlichen Zahlen besteht. Verfolgen wir
z. B. einmal die Wahrscheinlichkeit von 1 als erste Ziffer, wenn der Topf aus den ersten
n Natürlichen Zahlen besteht, d.h.
Wir betrachten die Folge           ( Pn(1))n 0
Hier gilt
                n  1  P1(1)  1


                n  2  P 2(1)    1
                                   2



                n  3  P 3(1)    1
                                   3



                n  9  P 9(1)    1
                                   9
                                       dann steigt es bis n  19 auf P19(1)             11 , um dann
                                                                                         19
                                                                                                        w ieder
                                       bis n  99 abzufallen ( P 99(1)    11
                                                                           99
                                                                                 1 ).
                                                                                  9

Die Folge ist sicher divergent, da sie sich nie auf einen stabilen Wert einpendeln wird.
Salopp formuliert: „Nach jeder neu dazukommenden Stelle wird die Ziffer eine lange Zeit
bevorzugt, bevor die anderen Ziffern der Reihe nach diesen Rückstand wieder
aufholen.“




Abbildung 4: Graphische Darstellung des Verlaufes von Pn(1) als kontinuierliche Funktion von n


                                                      8
                             c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

Abbildung 4 zeigt den Graphischen Verlauf von Pn(1), hier werden die Phasen des
Anstiegs und Abfalls sichtbar. Pn(1) schwankt immer zwischen 1/9 (Untergrenze) und
fast gleich bleibender Obergrenze ( Om(1)  19,,,,1 ).
                                            11,,,,1



Im Folgenden werden die Obergrenzen etwas genauer betrachtet.


Was passiert mit den Obergrenzen Om(1) (hierbei bezeichne m die Anzahl der Ziffern in
der m-ten Obergrenze)? Existiert ein Grenzwert für m → ∞?
Wir zeigen im Folgenden, dass Om(1) monoton fallend ist und nach unten beschränkt.
Dadurch wäre die Konvergenz gesichert.
Zunächst sucht man einen geschlossenen Term für Om(1):

  Zähler : 11...1 (m Stellen)  10 9 1
                                          m




  Nenner : 19...9                     1  10 m  1
                                       5

   Om(1)  5  10m 1
                      m

            9       10  5


Monotonie:
z.Z.:     om>om+1
5 10m 1      5 10m 1 1
9 10m 5       9 10m 1 5

 51
 om strengmonoton fallend

Grenzwertbestimmung:
Es gilt
               1 1m
Om          5   10
             9 1 5 .         Die Grenzwertbestimmung liefert also, dass Om(1) nach unten
                   m10

                     →0        durch 5/9 beschränkt ist.
                    m→∞
→ Om(1) konvergiert gegen den Grenzwert 5/9.




                                                      9
                         c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

Die Ober- und Untergrenzen der anderen Ziffern

Betrachten wir nun die Wahrscheinlichkeit, dass die erste Ziffer eine 9 ist

n=1, … ,8                     Pn (9)  0
n=9                                    1
                              P9 (9) 
                                       9
n=89                                      1
                              P89 (9) 
                                         89
n=99                                     11
                              P99 (9) 
                                         99
n=899                                      11
                              P899 (9) 
                                          899
n=999                                     111
                              P999 (9) 
                                          999
n=8999                                      111
                              P8999 (9) 
                                           8999

                           1
Pn (9) schwankt zwischen     Obergrenze und der Untergrenze
                           9
             1 11 111 1111
U m(9)    0, ,    ,    ,
             89 899 8999 89999



                                        1...1
Die Folge der Untergrenze: U m (9)           , m sei die Anzahl der Einsen im Zähler
                                       89...9

Sie ist monoton wachsend und nach oben beschränkt, sie konvergiert gegen den Wert
 1
   .
81


Beweis:

Grenzwert:
     10 m   1
           m
 1 10   m
           10
   
81          1
     10 m
        m
           9m
     10    10
     1
 1
   81
     1

   81



                                                  10
                            c26ec13d-48e3-42e2-b508-9d23c949fb38.doc


Beschränktheit nach oben

1 10 m  1 1
            
81         1 81
     10 
       m

           9
     10  1
       m
            1
          1
   10 m 
          9
                      1
 10 m  1  10 m 
                      9
            1
 1  
            9
wahr




Monotonie: Vermutung Streng monoton steigend

am < am+1

9 * 10 m  9 9 * 10 m 1  9
            
9 * 10 m  1 9 * 10 m 1  1


               
                         1
                                                    1
 9 10 m  1 * 910 m 1    9 10 m 1  1 * 910 m  
                         9                          9


                    1
                                              1
 10 m  1 * 10 m 1    10 m 1  1 * 10 m  
                      9                       9

             1                  1             1                   1
 10 2 m 1  * 10 m  10 m 1   10 2 m 1  * 10 m 1  10 m 
             9                  9             9                   9

   1                    1
  * 10 m  10 m 1   *10 m 1  10 m
   9                    9

   91 * 10 m    19 * 10 m
           
       9            9

 91 * 10 m  19 * 10 m


 91  19

wahr


                                                    11
                               c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

Die Folge konvergiert gegen 1/81 für immer größere werdende m nähert sich die Folge
beliebig dicht an 1/81 an.



                1... 1       1 10 m  1
U m (9)                        
             (9  1)9... 9 9 * 9          1
                                   10 m 
                                          9

                                                                      1
Während bei der Ziffer 1 die Untergrenze konstant U m (1)              war und bei der Ziffer 9 es
                                                                      9
eine konstante Obergrenze gab, sind bei den anderen Ziffern p = 2, …,8 die Werte der
jeweiligen Ober- bzw. Untergrenzen nicht mehr konstant.


                                                           11...1                         11...1
Tabelle 1 Wahrscheinlichkeit Pn(3): Obergrenzen Om(3)=            und Untergrenzen Um(3)=
                                                           39...9                         29...9
(nach Humenberger, 2000, S. 142)

n            2         3          29          39     299       399      2999      3999     29999
Pn(3)        0         1           1          11      11       111       111      1111      1111
                       3          29          39     299       399      2999      3999     29999



                                                           1                         11...1
Tabelle 2 Wahrscheinlichkeit Pn(p): Obergrenzen Om(3)=       und Untergrenzen Um(3)=        (nach
                                                           9                         89...9
Humenberger, 2000, S. 142)

n            8    9              89           99     899      999        8999     9999         89999
Pn(9)        0    1               1           11 1    11      111 1       111     1111 1        1111
                                                                                     
                  9              89           99 9   899      999 9      8999     9999 9       89999

Schüler können selbstständig die Form der Unter- bzw. Obergrenze für jede beliebige
Ziffer p erarbeiten.


                 1...1      1 10 m  1
U m ( p)                     
             ( p  1)9...9 9 p          1
                                 10 m 
                                        p
             11...1    10         10 m  1
Om ( p)                                  .
             p9...9 9( p  1)           10
                                10 
                                  m

                                       p 1

Die Schüler sollten erkennen, dass die Obergrenzen monoton fallend und die
Untergrenzen monoton wachsend sind.
Durch explizite Darstellung ist es auch nicht schwer den Grenzwert zu finden



                                                     12
                                 c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

      def
U ( p)  lim U m ( p) 
            m 

                    
                    
        1  10  1   1
                 m
 lim
  m   9 p       1  9p
            10 m  
                  p
und
      def
O( p)  lim Om ( p) 
            m 

                             
                             
       10  10  1   10 .
                       m
 lim
  m  9( p  1)         10  9( p  1)
                 10 m       
                        p 1 

Die so definierten(Grenz-) Werte sind natürlich Schranken für die Wahrscheinlichkeiten
P(p), falls diese überhaupt existieren.


Eine Nährung an die Benford Wahrscheinlichkeit bringt der Mittelwert.


Tabelle 3: Überblick über die Werte von U (p) bzw. O (p) (nach Humenberger, 2000, S. 143)

       p           [U (p) , O (p)]    [U (p) , O (p)]    (U (p) , O (p)) /2   P(p)=log(p+1)-log p
                   Brüche             3 Dezimalen        3 Dezimalen          3 Dezimalen
                         1 5
        1                9 , 9 
                               
                                      [0.111 , 0.555]        0.333 (0.271)           0.301

                        1 10 
        2              18 , 27 
                                 
                                      [0.056 , 0370]         0.213 (0.173)           0.176

                       1 5
        3               27 , 18 
                                 
                                      [0.037 , 0.278]        0.157 (0.128)           0.125

                         1 2
        4                36 , 9 
                                
                                      [0.028 , 0.222]        0.125 (0.102)           0.097

                       1 5
        5               45 , 27 
                                 
                                      [0.022 , 0.185]        0.104 (0.085)           0.079

                        1 10 
        6               54 , 63 
                                 
                                      [0.019 , 0.159]        0.089 (0.072)           0.067

                       1 5
        7               63 , 36 
                                 
                                      [0.016 , 0.139]        0.077 (0.063)           0.058

                        1 10 
        8               72 , 81 
                                 
                                      [0.014 , 0.123]        0.069 (0.056)           0.051

                         1 1
        9                81 , 9 
                                
                                      [0.012 , 0.111]        0.062 (0.050)           0.046




                                                        13
                                   c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

Ein möglicher Schritt zur Verbesserung der Genauigkeit der durch die
Intervallmittelpunkte gegebenen Schätzwerte könnte folgender sein:
Die Summe der vierten Spalte ergibt nicht 1, sondern 1,229. So ist es nahe liegend all
diese Werte der 3 Spalte dadurch zu dividieren.
Die Differenz zum exakten Wert wird wesentlich geringer.



Benfords Gesetz: Veranschaulichung durch eine geometrische Reihe
Am Beispiel bestimmter geometrischer Folgen kann man das Benford-Gesetz
besonders gut veranschaulichen.

Stellen wir uns dazu folgende geometrische Folge vor: (Aqn)nN. = (A, Aq, Aq2,
                                                                           1
                                                                                                Aq        2
Aq3,...) mit A, q > 0 und folgende kreisförmige logarithmische Skala: 8
                                                                        9
                                                                                                     Aq            3
                                                                                                              Aq
                                                                                                                           1
                                                                            7
Auf dieser Skala denken wir uns irgendwo                                                                                   2
                                                                                                                           3
einen Startpunkt A, wobei wir beim einzeichnen der                      6                                                  4

Folgeglieder jeweils um log q nach rechts gehen                                                                            5
                                                                                                                           6
(wenn q>1, sonst nach links) denn                                       5
                                                                                                                       2
                                                                                                                           7
Es gilt : Aq n 1  Aq n  q                                                                                               8
            n 1
 log(Aq           )  log(Aq )  log(q )
                               n
                                                                                                                           9
                                                                                4

Kommt man hierbei an das Ende der Skala, so kann man                                        3

                                                                      Abbildung 5: Kreisförmige logarithmische Skala
eine 10er-Potenz höher (niedriger) die Skala links (rechts)
verlassen und rechts (links) wieder betreten. Um dieses Zurückspringen zu vermeiden,
denkt man sich die Skala zu einem Kreis gebogen (siehe Abb. 5).
Anhand dieser Abbildung ist es nicht schwierig, sich zu überzeugen, dass viele
geometrische Folgen dass Gesetz von Benford befolgen, wenn ihre Glieder bis zu
einem hinreichend großen n betrachtet werden.
Der Umfang des Kreises beträgt log10 = 1 und der Abschnitt, z.B. zwischen 1 und 2
(dort liegen alle Werte die mit 1 beginnen) beträgt log2-log1 = log2.
Damit dies jedoch der Wahrscheinlichkeit für die 1 als erste Ziffer entspricht, muss
vorausgesetzt werden, dass die Folgeglieder gleich dicht in den einzelnen Abschnitten
zu liegen kommen. Ist q = 10 mir << 1, so dass bei jeder Multiplikation nur um ein
winziges Stück () weitergerückt wird, so kann man sich gut vorstellen, dass (bei einer
ganzen Umrundung) die Folgeglieder in jedem Abschnitt gleich dicht liegen und daher
die Wahrscheinlichkeiten der jeweiligen Bogenlänge entsprechen (log(p+1) – log p, also
dass Benford-Gesetz).


                                                     14
                       c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

Bei allen rationalen Potenzen von 10 als q wird der Ausgangspunkt wieder erreicht und
es entsteht immer wieder das gleiche Muster, die Annäherung an das logarithmische
Gesetz kann daher nach der Rückkehr zum Ausgangspunkt nicht besser werden.
Bei irrationalen Potenzen von 10 muss jeweils um ein irrationales Stück weitergerückt
werden, neue Punkte fallen immer zwischen zwei schon vorhandene, so dass die
Annäherung an das logarithmische Gesetz immer besser wird.
Die unendlichen geometrischen Folgen erfüllen in den meisten Fällen das Gesetz von
Benford, nämlich bei irrationalen Potenzen von 10 als Faktor – es gibt bekanntlich nur
abzählbar viele rationale Zahlen im Gegensatz zu den überabzählbar vielen Irrationalen;
bei z. B. hinreichen kleinen rationalen Werten a/bwird das Gesetz ebenfalls in guter
Nährung erfüllt.
Wenn also eine Zahl zufällig aus einer unendlichen geometrischen Folge gewählt wird
ist das Zustandekommen der ungleichen Verteilung der ersten Ziffer durch obigen
Gedanken erklärt.




Benfords Gesetz: Heuristische Erklärung

Betrachtung von Größen, die zeitlichen Veränderungen unterworfen sind

Die Eins ist auf der Zahlenskala nicht weiter entfernt als die Fünf von der Sechs. Für die
wirklichen Dinge allerdings, die gezählt, gemessen oder gewogen werden, kann der
Weg von der Eins zur Zwei sehr lang sein: Um ihn zurückzulegen, müssen sie auf das
Doppelte wachsen. Einer Fünf fehlt dagegen nur ein Fünftel, um zur Sechs zu werden.
Anhand des DAX ist dies leicht verständlich. Stünde der DAX gerade bei 1000 Punkte,
dann müssten sich die Aktienkurse im Schnitt verdoppeln, ehe der DAX die 2000
erreicht. Solange bliebe sie auf allen Listen. Stünde der DAX aber bei 5000 Punkten, so
müsste der Wert nur noch um 20 Prozent steigen, ehe mit 6000 die Fünf als erste Ziffer
abgelöst wird. Noch kleiner ist im Verhältnis der Schritt von 9000 auf 10000.
„Was wächst, schrumpft, verharrt deshalb relativ lang im Bereich der führenden Eins“
(Dworschak 1998, S.229)




                                            15
                            c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

Was nütz es Benfords Gesetz zu kennen
Mark Nigrini, Professor für Buchhaltungswesen an der Southern Methodist University in
Texas, hat ein Programm entwickelt namens Digital Analyzer, das zur Überprüfung von
Datenmenge benutz werden kann.
Nigrini (1996) hatte die Idee, die in einer Steuererklärung enthaltenen Zahlen zu testen.
Das Ergebnis dieser Untersuchung lautete:
Während ehrliche Steuererklärungen dem Benford-Gesetz entsprachen, wichen
gefälschte deutlich davon ab. Die folgende Graphik soll die deutliche Abweichung
gefälschter Daten von Benfords Gesetz zeigen.




Abbildung 6: Benfords Gesetz im Vergleich mit Gefälschten Daten (Quelle: T.P. Hill, The First Digit
Phenomenon, American Scientist 86 (1998) )



Man kommt zu der Erkenntnisse, dass mit Hilfe der Ziffernanalyse beispielsweise die
folgenden Datenbestände schnell auf ihre generelle Plausibilität hin überprüft werden
können: Investitionen und Einkaufsrechnungen, Umsatzbuchungen,
Lagerbewertungspreise, Aufwandskonten. Datenmengen, die nicht dieser Verteilung
genügen sind unter Umständen sehr verdächtig.

Eine Konformität mit Benfords Gesetz bedeutet jedoch nicht automatisch, das die
zugrunde liegenden Daten frei von „störenden“ Einflüssen sind. Eine Nichteinhaltung
des Gesetzes lässt jedoch in der Regel auf Ineffiziente, systematische Fehler oder auf
bewusste Manipulation schließen. Die sich bei einer Tiefergehenden Untersuchung
ergebenden Ziffer- und Zahlenmuster können wertvolle Hinweise auf erfundene Daten
und sonstige Fehler in Datenbeständen (z.B. verursacht durch EDV-System) geben.


                                                     16
                        c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

Vor kurzem hat Mark Nigrini ein Buch veröffentlicht (Digital Analysis, Using Benfords
Law) in dem er seine Methode und ein paar ernste Fälle vorstellt. Im Auftrag einer
Hotelkette kam er einem millionenschweren Versicherungsbetrug auf die Spur. Eine
Angestellte hatte Schecks der firmeneigenen Krankenversicherung gefälscht und
Herzoperationen abgerechnet, die nicht stattgefunden hatten, zu jeweils 6500 Dollar.
Die ersten beiden Ziffern 6 und 5 stachen aus Nigrinis Analyse hervor wie ein
Daumenabdruck.




Auf Verbrecherjagd mit Benford

Es stellt sich die Frage, ob man mit bloßer Ziffern-Analyse Verbrechern auf die Spur
kommt? Axel Bach vom Magazin Quarks & Co wollte dies genauer erfahren und bat die
Mitarbeiter der Revisionsabteilung des WDR um Hilfe. Rechnungen der letzten zwei
Monate wurde nach Auffälligkeiten untersucht, aber man konnte keine feststellen. Nun
wurden die Zahlen dreimal auf unterschiedliche Art und Weise manipuliert und von
Wirtschaftsprüfern untersucht. Die folgenden drei Fälle zeigen die Chancen und
Grenzen des Benford Gesetz auf:


      Die Unterschriftengrenze: Betrügerische Mitarbeiter können ein Unternehmen im
       Extremfall in den Ruin treiben.
      Die Bagatellegrenze: Verdächtig ist es, wenn oft Beträge knapp unterhalb der
       Bagatellgrenze gebucht werden.
      Erfundene Rechnungen: Am schwersten zu entdecken: Mitarbeiter steckt mit
       Lieferant unter einer Decke und zeichnet falsche Rechnungen ab.


Die folgenden Fälle würde von http://www.quarks.de/dyn/5320.phtml wörtlich
übernommen:
Erster Fall: Die Unterschriftengrenze
Ein Mitarbeiter im Einkauf bevorzugt einen bestimmten Lieferanten, obwohl der nicht der
günstigste ist. Solange die Bestellungen aber 5.000 Euro nicht überschreiten, merkt das
niemand. Seinen Chef muss er nämlich erst bei größeren Anschaffungen informieren.
Die Lieferfirma zeigt sich erkenntlich und spendiert hin und wieder einen Kurzurlaub.




                                           17
                        c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

Für diesen ersten Fall veränderten wir die ursprünglichen Rechnungsdaten: Bei 63
Rechnungen eines Lieferanten gingen wir auf Beträge knapp unter der gedachten
Unterschriftengrenze von 5.000 Euro. Wir waren gespannt: Würden die 63 geänderten
Rechnungen unter den 12.372 anderen auffallen?


Hier die Analyse der Experten von Ernst & Young:
"Bei der Untersuchung dieser Daten haben wir beim Erste-Ziffer-Test Auffälligkeiten bei
der Vier gefunden. Daraufhin sind wir auf einen Lieferanten gekommen, der eine
vermehrte Häufigkeit bei dieser Ziffer Vier aufweist. Bei genauerem Hinsehen erkannten
wir, dass diese Beträge mit der Vier als 1. Ziffer alle knapp unter 5.000 Euro liegen.
Dafür kann es mehrere Gründe geben: zum Beispiel eine Unterschriftenregelung oder
Ähnliches im Unternehmen."


Zweiter Fall: Die Bagatellegrenze
Verdächtig ist es, wenn oft Beträge knapp unterhalb der Bagatellgrenze gebucht werden
Ein schönes Ritual: Jeden Tag überweist ein Mitarbeiter Geld auf sein eigenes Konto.
Das fällt nicht auf, weil es in der Firma eine Bagatellegrenze gibt: Kleinbeträge werden
nicht überprüft. Aufs Jahr gerechnet kommt dabei aber einiges zusammen.


In unserer Datei mit den ungefälschten Daten erfanden wir einen neuen Lieferanten und
fügten für jede Woche fünf Überweisungen ein. Alle Beträge lagen zwischen 70 und 80
Euro. Wieder waren die Wirtschaftsprüfer an der Reihe. Dieses Mal waren aber noch
weniger Zahlen geändert. Aber trotzdem wurden sie fündig:


"Bei der Ziffer Sieben haben wir eine Auffälligkeit festgestellt. Wir haben uns diese
Beträge näher angeschaut und sind auf einen Lieferanten aufmerksam geworden, der
bestimmte Rechnungsbeträge zwischen 70 und knapp unter 80 Euro hatte. Es könnte
sein, dass es in diesem Unternehmen eine Bagatellegrenze gibt, unter der diese
Beträge liegen. Es könnte aber auch ein Systemfehler sein, weil die Beträge immer
werktags gebucht wurden."


Dritter Fall: Erfundene Rechnungen
Am schwersten zu entdecken: Mitarbeiter steckt mit Lieferant unter einer Decke und
zeichnet falsche Rechnungen ab. Ein Händler stellt neben den normalen Rechnungen



                                            18
                       c26ec13d-48e3-42e2-b508-9d23c949fb38.doc

noch weitere aus. In der belieferten Firma zeichnet sie ein Mitarbeiter ab, obwohl dafür
gar keine Leistungen erbracht wurden. Am Monatsende machen die beiden halbe-halbe.
In unserer Originaldatei erfanden wir bei einem Lieferanten für jede echte Rechnung
noch eine zusätzliche gefälschte. Dieser Test war besonders schwierig: Insgesamt
fügten wir nämlich nur 20 Rechnungsposten ein. Und tatsächlich: In der großen
Datenmenge waren diese 20 zufällig ausgedachten Rechnungssummen nicht mehr
auffällig. Aber: Immerhin zwei der drei Betrüger wären schon mit der einfachen Benford-
Analyse aufgeflogen.




                                           19
                        c26ec13d-48e3-42e2-b508-9d23c949fb38.doc


Literaturverzeichnis

Bücher

Stewart, I. (1997). Die gekämte Kugel (1. Auflage). Spektrum Verlag

Beiträge in Büchern

Humenberger, H. (2000). Das „BENFORD – Gesetz“ – warum ist die Eins als führende
Ziffer von Zahlen bevorzugt? In F. Förster, H.-W. Henn & J. Meyer (Hrsg.), Materialien
für einen Realitätsbezogenen Mathematikunterricht. Computeranwendungen
(Schriftenreihe der Istron Gruppe, Band 6, S. 138 - 150). Hildesheim-Berlin:
Franzbecker.

Stewart, I. (1999). Das Gesetz der ersten Ziffer. In

Zeitschriften

Hill, T.P. 1998. The first digit phenomenon. American Scientist 86(Juli-August), 358.

Newcomb, S. 1881. Note on the frequency of the use of digits in natural numbers.
American Journal of Mathematics 4, 39.


WWW-Seiten

Drton, Mathias (Universität Augsburg).Lebenslauf von Frank Benford. Zugriff am
07.06.2004 unter
http://www.student.uni-augsburg.de/~drtonma/fdanalysis/benford.html

Schwichtenberg, Günter. Benfords Gesetz, Über die führende Rolle der Ziffer „1“. Zugriff
am 27.11.2004 unter
http://www.hrz.uni-dortmund.de/computerPostille/Juni2004/Export20.html

Weiter Weg zur Zwei. Zugriff am 27.11.2004 unter
http://matheag-sii.bildung-rp.de/assets/html/Benford/SPIEGEL-Artikel.htm

Benfords Gesetz. Zugriff am 27.11.2004 unter
http://de.wikipedia.org/wiki/Benfordsches_Gesetz

http://www.mathekiste.de/neu2001/benfordsgesetz.htm, zugriff am 26.11.2004

Auf Verbrechjagd mit Benford. Zugriff am 03.11.2004 unter
http://www.quarks.de/dyn/5329.phtml




                                            20

				
DOCUMENT INFO
Shared By:
Categories:
Tags:
Stats:
views:11
posted:6/26/2012
language:
pages:20