Beiträge von hebbel

    hallo tangaroa

    aha
    also:
    ich dacht du wolltest korrealationen auf signifikanz prüfen
    diesbezüglich ist das skalennieveau der daten relevant
    intervallniveau versus ordinalniveau

    du hast aber offenbar daten auf intervallniveau vorliegen,
    deren verteilung ( nicht NV) unbekannt istund willst die verteilungsfunktion ( F(x) ) schätzen
    d.h. in welcher art und weise kann ich von beobachteten werten
    auf eine theoretisch verteilung schließen

    die rangransformationen die du erwähnst
    liefer keine ränge sonden PROZENTRÄNGE
    dieser entsprechen einer cumulierten verteilungsfunktion

    spearman behandelt rangwerte auf ordinalniveau wie intervalldaten
    also pearson auf ordinalniveau
    wert x(intervall) ----> tranfomation in ränge(ordinal)

    5.6 rang 2
    3.5 rang 1
    7.8 rang 3
    8.9 rang 4

    dieser darf dann aber auch nur ordinal interpretiert werden
    d.h. differenzen machen keinen sinn oder ein r^2 (determination)
    ist nicht zu interpretierten


    ich glau das du so was gar nicht meinst
    sonder verteilungsfunktionen mit einander
    korrelien d.h. auf passung prüfen willst
    als eher so:
    wert x ----> tranfomation in ränge ----> prozent rang z.b. BLOM
    3.5 rang 1 23%
    5.6 rang 2 42%
    7.8 rang 3 56%
    8.9 rang 4 78%
    (geschätzt)
    es werden dann aber nicht die werte oder ränge korreliert
    sondern die prozentränge mit einer angenommen theo. verteilung
    z.B. poisson verteilung mit der Ho : daten poisson verteilt

    prozentränge kann man dann in normränge transformieren
    d.h. 23% entspräche einem z von "soundsoviliel"
    einer normalverteilung, das heißt nicht das die x werte normalverteilt sind
    oder gemacht werden, dies ist nur rein descriptiv zu verstehen.
    was willst du korrelieren und wozu ?

    so nochmal denken
    1)
    du willst zwei oder mehr variablen korrelieren
    mit dem ziel einer schätzgleichung (regression)
    die variablen sind nicht NV
    da nicht NV ist ein signifanzprüfung dieser regression fraglich
    ( NV als vorraussetzung eines F-tests)

    oder
    2)
    du willst eine beobachtet verteilung
    mit einer theortisch verteilung via korrelation auf passung prüfen


    zu 1
    man darf intervall daten nur positiv linear (y=ax+b, z-tranformation)
    transformieren alle anderen tranformationen ( z.B. rang oder y=ln(x) ...)
    würde die innere struktur verändern, sie würden ihr bedeutung
    verlieren ( bedeutsamkeitsproblem der meßtheorie)

    deine frage:

    Warum soll man bei nicht normalverteilten Daten eine Rangtransformation (welche?) durchführen bevor man damit eine Regression rechnet?

    meine antwort

    hä? wer sagt das ? und wozu ?
    ich kenn rangtransformationen nur im sinne von punkt 2
    tut mir leid


    nenn mir doch mal deine hypothesen.

    bis auf weiteres

    hebbel

    P.S.
    wie gehts den sensation seekern?

    hallo und gruß nach wien

    wenn man eine korrelation intervallskaliertee daten
    auf signifikanz prüfen möchte, müssen diese daten normalverteilt sein
    oder die stichprobe sollte größer als 100 sein, weil der t-test als assymptotik
    eines "zu aufwendigen" randomisierungs-tests dies voraussetzt.
    sind die daten also nicht NV und die stichprobe ist klein, bleib
    als notbehelf der wechsel in das darunter liegende skalenniveau, also
    ordinalniveau , der test wäre dann "prüfen der kendall-summe" auf
    signifikanz. vergebe also range, ordnen der nach der größe.
    (ich kenn nur eine rangtranformation eben die vergabe
    von rängen)
    die möglichkeit einer regression, d.h. sätzung der einen variable
    durch eine andere bleibt dann aber verschlossen.

    ich hoffe ich konnte helfen

    gruß
    hebbel

    glückwunsch und gruß an alle
    meine lösung:

    P(alarm / einbruch) = P(a / e) = 0.95
    P(kein alarm / einbruch) = P( ka / e) = 0,05

    P(alarm / kein einbruch) = P(a / ke) = 0,01
    P(kein alarm / kein einbruch) = P(ka / ke) = 0,99

    P(einbruch) = P(e) = 0,005
    P(kein einbruch) = P(ke) = 0,995

    1) P(alarm) = P(alarm und einbruch) + P(alarm und kein einbruch)
    = P(a / e) * P(e) + P(a / ke) * P(ke)
    = 0,95 * 0,005 + 0,01 * 0,995

    = 0,0147

    2) es müßte doch heißen: ausgelöst wurde !!!!
    ansonsten wäre die lösung P( alarm / einbruch) = 0,95
    also gesucht:
    P(einbruch / alarm) = P( a und e) / P(a) = (0,95 * 0,005) / 0,0147 = 0,323 (bayes)

    hebbel

    hallo othmar

    das ergebnis sagt dir:
    je höher das selbsturteil umso größer ist der unterschied zwischen fremd-
    und selbsturteil.

    es ist schwer einen rat zu erteilen,
    wenn man über die probleme die du hast nur mutmaßungen anstellen
    kann .

    mach doch mal folgendes
    nimm die selbsturteile und wiederhole die prozedur
    die du beschrieben hast mit einer konstant als fremdurteil
    zB den mittelwert aus den selbsturteilen
    dann würden hohe selbsturteile unterschätz
    und niedrige überschatzt korreliere und du hast eine hohe negative korrelation
    das bedeutet aber daß ein fremdurteil nicht differenzieren kann
    ein fremdurteil gar nichts bedeutet weil es ja jedem denselben wert
    zuspricht. mach das ganz dann nochmal mit dem betrag der diff.

    die fremdurteile sollten über alle situationen der selbsturteile
    diegleiche verteilung und varianz aufweisen
    im mittel sollten sie sich unterscheiden
    ist fremdurteil überhaupt möglich
    ist selbsturteil überhaupt möglich
    du operierst ohne UV , also nichtexperimentell
    mit zwei variablen die beide nichts bedeuten müssen
    an der SSS V kann man so seine zweifel haben

    eine korrelation alleine sagt nichts
    du hast auf der einen seite ein rater-problem (fremdurteil)
    und auf der anderen seite ein testtheoretisches (selbsturteit)
    was interessiert also
    willst du das selbsturteil am fremdurteil validieren, auf der suche nach dem
    "wahren wert"
    oder unterschiede zwischen selbst und fremdwahrnehmung analysieren.

    ohne kenntnis des backgrounds und des versuchsplans
    kann ich eigentlich gar nichts raten, sondern nur raten.

    viele grüße hebbel

    hallo othmar

    korreliere die differenz nicht mit dem fremd, sondern selbsturteil,
    da die differenz bei niedrigen selbsturteilen auch niedriger ausfällt
    und bei hohen höher, müßte eine positive korrelation entstehen.

    fremd selbst diff
    10 - 7 = 3
    8 - 4 = 4
    5 - 4 = 1
    4 - 3 = 1
    1 - 0 = 0


    wenn die daten der uni gehören, frag ich mich wem die uni gehört?aber sei ruhig mistrauisch, aber bitte auch gegenüber deiner eigenen
    arbeit, da sie hilft den weg zu einem "gläsernen Menschen" zu beschreiten.
    mag sein, daß sie heute noch ein party gag ist, aber die ziele sind sicherlich andere.

    gruß
    hebbel

    hallo mike

    gut ist das buch von

    OPITZ " mathematik , lehrbuch für ökonomen"
    oldenbourg verlag
    es deckt alles ab analysis , lineare optimierung,
    mit guten beispielen, und ohne überflüssige mathe

    gruß
    hebbel

    hallo othmar

    spontan würde ich dir raten mittle die fremdurteile und korreliere sie mit
    den selbst urteilen,
    ich befürchte aber das die sache etwas komplizierter ist.

    bin bei einer kurzen recherche z.B. auf den namen :
    "Atzmueller Michaela, Wien" gestoßen, sagt dir das vielleicht etwas?

    du solltest dir in erster linie ( dies auch ein rat an alle andere !) klar darüber sein
    welcher effekt dich interessiert, hypothesen geleitet.
    diesen dann erstmal rein descriptiv zu erfassen versuchen,
    die dazugehörige inferenzstatistische absicherung ergiebt sich erst in zweiter linie,
    ob mit einen gängigen verfahren , oder einen speziell " ich sag mal gebastelten"


    da die 25 vpn "linear" ausgewählt wurden
    kann ich mir z.B. vorstellen das die übereinstimmung in den extremen bereichen
    höher ist als im mittleren, was eine einfache korrelation nicht entdecken würde

    bilde doch einfach mal die differenz zwischen fremd- und selbsturteil, quasi als art fehler und korreliere diese dilfferenz mit dem selbsturteil.
    ich schau mir mal die zuckerman skala an, und versuch mir dann vorzustellen
    wie du sie umgeschrieben hast.

    man sollte aber nicht eine "neue" skala als meßinstrument einsetzten, und
    gleichzeitig versuchen die reliabilty abzuschätzen, das geht nicht.
    ich würde mir z.B. mal die streuung in den einzelnen fremdurteiler gruppen
    anschauen, diese sollten homogen sein, aber was wenn nicht?
    ist das dann chaos oder ein bestimmter effekt?

    würde mich freuen wenn du mir die daten mailst , würde gern damit etwas
    " rumspielen" , natürlich mit allem respekt.


    viele grüße
    hebbel

    hallo othmar

    ertsmals finde ich es heikel einen fragebogen einfach von selbst auf
    fremdurteil umzubasteln, ob du damit valide und reliable meßwerte erhältst
    ist fraglich.

    außerdem kann man keine statistische aussagen bei nur einer person machen,
    wie will man dies auf andere verallgemeinern, mit einer one-man-show.

    sollten fremd -und selbsturteil übereinstimmen, sagt dies nichts über zukünfige
    vergleiche dieser art aus, sondern gilt nur für diese person.

    solltes du dich aber auch nur für diese person interessieren, würde
    ich einen sog." fisher-pitman-test für eine stichprobe" machen,
    damit testest du ob die fremdurteile, das sind ja mehrere, im mittel mit dem
    selbsturteil übereinstimmen.

    schick doch einfach mal die daten.

    gruß
    hebbel

    hallo

    informiere dich doch mal zum thema "DISKRIMINANZANALYSE"

    oder korreliere die variablen einfach mal,erstmal nur zwei ,dann vielleicht multipel
    d.h. über "REGRESSIONSMODELLE"

    hast du vorab bereits hypothesen über die zusammenhänge
    lösung deines problems über "STRUKTURGLEICHUNGSMODELLE"

    gruß
    hebbel

    eine frage : wie soll hier der lineare korrelationkoeff 1 werden ???????????


    generell
    meßwerte unterscheidet man nach den skalenniveau

    z.B.: nominalniveau, ordinalniveau oder intervallniveau...
    in abhängigkeit davon sind nur ganz bestimmte testverfahren zulassig, bedeutsam

    HIER
    GESCHLECHT ist nominalniveau, da es eine dichotome variable ist, kann sie aufgrund dessen als intervalniveau interpretiert werden, und in die zahlen 1 0 umcodiert werden.

    LANDKREIS ist nominalniveau es liegt nur kategorial vor
    ich würde diese variable um ein kategorie erweitern: landkreis 1
    landkreis 2
    restliche landkreise
    da man sich ja fragen muß was sollen die angaben zum regierungsbez.

    also sind mögliche zu prüfende hypothesen

    Ho sind landkreis und geschlecht voneinander unabhängig
    ---- d.h. chi2 test für kontingenztafeln

    Ho unterscheiden sich die landkreise bzgl. des "mittleren" geschlechts
    ----- d.h. einfaktorielle varianzanalyse für unabhängige stichproben

    Ho unterscheiden sich die mittelwerte der drei landkreiskategorien jeweils paarweise
    ------ d.h. t- test auf mittelwertunterschied ( 3mal)

    Ho ist das geschlecht in allen drei gruppen gleichverteilt
    ----- d.h. binomialtest auf eine trefferwahescheinlichkeit von p=0,5 ( 3mal)

    alle obigen test unter annahme ihrer jeweiligen voraussetzungen

    grüß
    hebbel

    es handelt sich wohl um eine zweifakorielle varianzanalyse mit einer meßwiederholung auf einem faktor.

    ihr müßt unter "analysieren"
    dann "allgemeines lineares model (general inenear model"
    zu " meßwiederholung"

    müßt dann den meßwiederholungsfaktor angeben, z. B "ZEIT"
    mit zwei stufen (vorher-nachher), und "hinzufügen" clicken,dann weiter mit "definieren".

    ihr müßt dann eure variablen zuordnen

    ihr habt drei variablen, eine beschreibt die gruppenzugehörigkeit, die beiden anderen müßten die messung unter den bedingungen"prä" und "post" repräsentieren.
    die gruppenvariable clickt ihr ins feld "zwischensubjektfaktor"(between subject)
    die beiden Zeitvariablen in das feld über dem steht
    "innersubjektfactor"(innersubject), hierfür sind zwei stellen freigehalten mit fragezeichen.
    mit "ok ist dann die eingabe abgeschlossen.

    die vorrausetzungen die tinka erwähnt sind bei diesen stichprobengrößen wie von selbst erfüllt, oder verletzungen dieser werden durch die varianzanalyse automatisch herausgerechnet, so wie bei behrens fisher.
    ihr bekommt vier signifikanzangaben ( Spur, Wilks, usw...)die normalerweise bei effekten alle signifikant werden.

    der vorschlag von tinka eines t-Tests entspricht dann der wechselwirkung
    bei der varianzanalyse.


    Gruß
    Hebbel