Rangtransformation

  • Hallo!

    Vielleicht kann mir jemand folgende Frage beantworten:

    Warum soll man bei nicht normalverteilten Daten eine Rangtransformation (welche?) durchführen bevor man damit eine Regression rechnet?

    lg, Tangaroa

  • Hey Gast!
    Hast Du eine Frage, die Du gerne beantwortet haben möchtet? Klickt auf den folgenden Link und Du wirst die Antwort finden:

    Hier findest Du die Antworten

    Egal, ob es sich um eine Frage zu einem bestimmten Thema in eurem Studium oder um allgemeine Ratschläge handelt - wir haben die Antworten, die ihr sucht. Also zögert nicht und klickt auf den Link! Wir freuen uns darauf, euch zu helfen.

  • hallo und gruß nach wien

    wenn man eine korrelation intervallskaliertee daten
    auf signifikanz prüfen möchte, müssen diese daten normalverteilt sein
    oder die stichprobe sollte größer als 100 sein, weil der t-test als assymptotik
    eines "zu aufwendigen" randomisierungs-tests dies voraussetzt.
    sind die daten also nicht NV und die stichprobe ist klein, bleib
    als notbehelf der wechsel in das darunter liegende skalenniveau, also
    ordinalniveau , der test wäre dann "prüfen der kendall-summe" auf
    signifikanz. vergebe also range, ordnen der nach der größe.
    (ich kenn nur eine rangtranformation eben die vergabe
    von rängen)
    die möglichkeit einer regression, d.h. sätzung der einen variable
    durch eine andere bleibt dann aber verschlossen.

    ich hoffe ich konnte helfen

    gruß
    hebbel

  • Hallo Hebbel!

    Auf dich ist Verlass :) , danke!

    Da die Daten nicht normalverteilt sind hab ich für die Korrelationen von Haus aus auf Kendall und Spearman zurück gegriffen.
    Wenn ich dich richtig verstehe und ich nach Rängen ordne, dann darf ich Pearson verwenden, aber mit den Rängen kann ich dann keine Regression mehr rechnen?
    Kannst du mir vielleicht auch erklären warum das nicht mehr geht? Mir ist nämlich genau dies geraten worden...

    Was die Rangtransformation selbst betrifft, so gibt es im SPSS (mit diesem Programm arbeite ich) eine Reihe von verschiedenen Möglichkeiten Ränge bilden zu lassen. Leider werde ich nicht wirklich schlau aus dem, was im SPSS-Handbuch dazu steht. Am plausiblesten ist mir die Methode der "Normalrangwerte" bzw. "normal scores", da hier die z-Werte der Standardnormalverteilung berechnet werden und diese dann die Rangwerte bilden.
    Welche Methode hattest du denn im Sinn?

    lg, Tangaroa

  • hallo tangaroa

    aha
    also:
    ich dacht du wolltest korrealationen auf signifikanz prüfen
    diesbezüglich ist das skalennieveau der daten relevant
    intervallniveau versus ordinalniveau

    du hast aber offenbar daten auf intervallniveau vorliegen,
    deren verteilung ( nicht NV) unbekannt istund willst die verteilungsfunktion ( F(x) ) schätzen
    d.h. in welcher art und weise kann ich von beobachteten werten
    auf eine theoretisch verteilung schließen

    die rangransformationen die du erwähnst
    liefer keine ränge sonden PROZENTRÄNGE
    dieser entsprechen einer cumulierten verteilungsfunktion

    spearman behandelt rangwerte auf ordinalniveau wie intervalldaten
    also pearson auf ordinalniveau
    wert x(intervall) ----> tranfomation in ränge(ordinal)

    5.6 rang 2
    3.5 rang 1
    7.8 rang 3
    8.9 rang 4

    dieser darf dann aber auch nur ordinal interpretiert werden
    d.h. differenzen machen keinen sinn oder ein r^2 (determination)
    ist nicht zu interpretierten


    ich glau das du so was gar nicht meinst
    sonder verteilungsfunktionen mit einander
    korrelien d.h. auf passung prüfen willst
    als eher so:
    wert x ----> tranfomation in ränge ----> prozent rang z.b. BLOM
    3.5 rang 1 23%
    5.6 rang 2 42%
    7.8 rang 3 56%
    8.9 rang 4 78%
    (geschätzt)
    es werden dann aber nicht die werte oder ränge korreliert
    sondern die prozentränge mit einer angenommen theo. verteilung
    z.B. poisson verteilung mit der Ho : daten poisson verteilt

    prozentränge kann man dann in normränge transformieren
    d.h. 23% entspräche einem z von "soundsoviliel"
    einer normalverteilung, das heißt nicht das die x werte normalverteilt sind
    oder gemacht werden, dies ist nur rein descriptiv zu verstehen.
    was willst du korrelieren und wozu ?

    so nochmal denken
    1)
    du willst zwei oder mehr variablen korrelieren
    mit dem ziel einer schätzgleichung (regression)
    die variablen sind nicht NV
    da nicht NV ist ein signifanzprüfung dieser regression fraglich
    ( NV als vorraussetzung eines F-tests)

    oder
    2)
    du willst eine beobachtet verteilung
    mit einer theortisch verteilung via korrelation auf passung prüfen


    zu 1
    man darf intervall daten nur positiv linear (y=ax+b, z-tranformation)
    transformieren alle anderen tranformationen ( z.B. rang oder y=ln(x) ...)
    würde die innere struktur verändern, sie würden ihr bedeutung
    verlieren ( bedeutsamkeitsproblem der meßtheorie)

    deine frage:

    Warum soll man bei nicht normalverteilten Daten eine Rangtransformation (welche?) durchführen bevor man damit eine Regression rechnet?

    meine antwort

    hä? wer sagt das ? und wozu ?
    ich kenn rangtransformationen nur im sinne von punkt 2
    tut mir leid


    nenn mir doch mal deine hypothesen.

    bis auf weiteres

    hebbel

    P.S.
    wie gehts den sensation seekern?