Hallo!
Vielleicht kann mir jemand folgende Frage beantworten:
Warum soll man bei nicht normalverteilten Daten eine Rangtransformation (welche?) durchführen bevor man damit eine Regression rechnet?
lg, Tangaroa
Hallo!
Vielleicht kann mir jemand folgende Frage beantworten:
Warum soll man bei nicht normalverteilten Daten eine Rangtransformation (welche?) durchführen bevor man damit eine Regression rechnet?
lg, Tangaroa
hallo und gruß nach wien
wenn man eine korrelation intervallskaliertee daten
auf signifikanz prüfen möchte, müssen diese daten normalverteilt sein
oder die stichprobe sollte größer als 100 sein, weil der t-test als assymptotik
eines "zu aufwendigen" randomisierungs-tests dies voraussetzt.
sind die daten also nicht NV und die stichprobe ist klein, bleib
als notbehelf der wechsel in das darunter liegende skalenniveau, also
ordinalniveau , der test wäre dann "prüfen der kendall-summe" auf
signifikanz. vergebe also range, ordnen der nach der größe.
(ich kenn nur eine rangtranformation eben die vergabe
von rängen)
die möglichkeit einer regression, d.h. sätzung der einen variable
durch eine andere bleibt dann aber verschlossen.
ich hoffe ich konnte helfen
gruß
hebbel
Hallo Hebbel!
Auf dich ist Verlass , danke!
Da die Daten nicht normalverteilt sind hab ich für die Korrelationen von Haus aus auf Kendall und Spearman zurück gegriffen.
Wenn ich dich richtig verstehe und ich nach Rängen ordne, dann darf ich Pearson verwenden, aber mit den Rängen kann ich dann keine Regression mehr rechnen?
Kannst du mir vielleicht auch erklären warum das nicht mehr geht? Mir ist nämlich genau dies geraten worden...
Was die Rangtransformation selbst betrifft, so gibt es im SPSS (mit diesem Programm arbeite ich) eine Reihe von verschiedenen Möglichkeiten Ränge bilden zu lassen. Leider werde ich nicht wirklich schlau aus dem, was im SPSS-Handbuch dazu steht. Am plausiblesten ist mir die Methode der "Normalrangwerte" bzw. "normal scores", da hier die z-Werte der Standardnormalverteilung berechnet werden und diese dann die Rangwerte bilden.
Welche Methode hattest du denn im Sinn?
lg, Tangaroa
hallo tangaroa
aha
also:
ich dacht du wolltest korrealationen auf signifikanz prüfen
diesbezüglich ist das skalennieveau der daten relevant
intervallniveau versus ordinalniveau
du hast aber offenbar daten auf intervallniveau vorliegen,
deren verteilung ( nicht NV) unbekannt istund willst die verteilungsfunktion ( F(x) ) schätzen
d.h. in welcher art und weise kann ich von beobachteten werten
auf eine theoretisch verteilung schließen
die rangransformationen die du erwähnst
liefer keine ränge sonden PROZENTRÄNGE
dieser entsprechen einer cumulierten verteilungsfunktion
spearman behandelt rangwerte auf ordinalniveau wie intervalldaten
also pearson auf ordinalniveau
wert x(intervall) ----> tranfomation in ränge(ordinal)
5.6 rang 2
3.5 rang 1
7.8 rang 3
8.9 rang 4
dieser darf dann aber auch nur ordinal interpretiert werden
d.h. differenzen machen keinen sinn oder ein r^2 (determination)
ist nicht zu interpretierten
ich glau das du so was gar nicht meinst
sonder verteilungsfunktionen mit einander
korrelien d.h. auf passung prüfen willst
als eher so:
wert x ----> tranfomation in ränge ----> prozent rang z.b. BLOM
3.5 rang 1 23%
5.6 rang 2 42%
7.8 rang 3 56%
8.9 rang 4 78%
(geschätzt)
es werden dann aber nicht die werte oder ränge korreliert
sondern die prozentränge mit einer angenommen theo. verteilung
z.B. poisson verteilung mit der Ho : daten poisson verteilt
prozentränge kann man dann in normränge transformieren
d.h. 23% entspräche einem z von "soundsoviliel"
einer normalverteilung, das heißt nicht das die x werte normalverteilt sind
oder gemacht werden, dies ist nur rein descriptiv zu verstehen.
was willst du korrelieren und wozu ?
so nochmal denken
1)
du willst zwei oder mehr variablen korrelieren
mit dem ziel einer schätzgleichung (regression)
die variablen sind nicht NV
da nicht NV ist ein signifanzprüfung dieser regression fraglich
( NV als vorraussetzung eines F-tests)
oder
2)
du willst eine beobachtet verteilung
mit einer theortisch verteilung via korrelation auf passung prüfen
zu 1
man darf intervall daten nur positiv linear (y=ax+b, z-tranformation)
transformieren alle anderen tranformationen ( z.B. rang oder y=ln(x) ...)
würde die innere struktur verändern, sie würden ihr bedeutung
verlieren ( bedeutsamkeitsproblem der meßtheorie)
deine frage:
Warum soll man bei nicht normalverteilten Daten eine Rangtransformation (welche?) durchführen bevor man damit eine Regression rechnet?
meine antwort
hä? wer sagt das ? und wozu ?
ich kenn rangtransformationen nur im sinne von punkt 2
tut mir leid
nenn mir doch mal deine hypothesen.
bis auf weiteres
hebbel
P.S.
wie gehts den sensation seekern?