Wikipedia:Propozycje do Artykułów na Medal/Współczynnik korelacji rang Spearmana


Wikipedia:Propozycje do Artykułów na Medal/Współczynnik korelacji rang Spearmana w encyklopedii

Z Wikipedii, wolnej encyklopedii < Wikipedia:Propozycje do Artykułów na Medal Przejdź do nawigacji Przejdź do wyszukiwania

Współczynnik korelacji rang Spearmana | edytuj kod

  • Uzasadnienie: Zajmowałem się trochę kwestiami związanymi z tym współczynnikiem, kiedy jeszcze byłem pracownikiem naukawym, i mam do niego sentyment. W prawie każdym polskim podręczniku statystyki są o nim mniej więcej dwie strony z tym samym jednym wzorkiem (7) oraz przykładem... i na tym koniec, choć w literaturze naukowej już w latach pięćdziesiątych temat znacznie się rozbudował. W tej chwili ten artykuł jest prawdopodobnie najobszerniejszym opracowaniem na ten temat po polsku. Olaf @ 08:17, 29 maj 2008 (CEST)
  • Głosy za:
  1. Jestem pod wrażeniem - choć życie było prostsze z tymi dwoma stronami i jednym wzorkiem ;) Aotearoa dyskusja 10:02, 29 maj 2008 (CEST)
  2. Po prostu wyśmienity artykuł. Uważam, że jak stanie się medalowym - to będzie mógł być podawany jako wzór. AndrzejDyskusja▫. 10:20, 29 maj 2008 (CEST)
  3. Kamil Filip Ulryk (dyskusja) 17:49, 29 maj 2008 (CEST) wysmienite!
  4. Nie będę udawał, że coś zrozumiałem - ale od strony technicznej, redakcyjnej, przypisów etc, hasło to może być wzorem dla swojej dziedziny. Pewnie eksperci coś tam znajdą, ale nie winno to rzutować na całości. Masur juhu? 20:02, 29 maj 2008 (CEST) Ech, miałem nadzieję, że chociaż animacja na wstępie coś tłumaczy... Olaf @ 20:21, 29 maj 2008 (CEST)
  5. godne podziwu, choć również mało rozumiem, co właściwie przy odrobinie chęci nie powinno sprawiać problemów; klarowny, przy tym wydaje się być dostatecznie ścisły (dobre wyważenie). konrad mów!
  6. Przeczytałem i (chyba) zrozumiałem. ;) W kilku miejscach może mogłoby być nieco przystępniej, ale zasadniczo nie ma się do czego przyczepić. duch Qblika seansik? 18:06, 30 maj 2008 (CEST)
  7. Stotr (dyskusja) 19:35, 3 cze 2008 (CEST) (ale aż się prosi powtórzyć to co Aotearoa powyżej napisał: życie byłoby prostsze...)
  8. Układ treści logiczny i czytelny, sensowny podział na podpunkty i akapity, czyta się sympatycznie, temat wygląda na wyczerpany, całość solidnie podparta literaturą. Zdecydowanie za Kuszi (dyskusja) 22:11, 4 cze 2008 (CEST).
  9. Mroman (dyskusja) 05:37, 6 cze 2008 (CEST)
  10. Dziuchni DYSKUSJA 23:58, 7 cze 2008 (CEST)
  11. czy trzeba coś dodac? D kuba dyskusja 00:50, 10 cze 2008 (CEST)
  • Głosy przeciw:
  • Dyskusja:

Może to moje naleciałości z angielskiego, ale mam drobną wątpliwość czy współczynnik statystyczny można wynaleźć... duch Qblika seansik? 14:18, 30 maj 2008 (CEST)

  • To chyba pytanie do polonistów, których zapraszam do dyskusji. Według mnie odkrywa się rzeczy, które istniały i wcześniej (jak prawa przyrody), wynajduje się zaś rzeczy, które nie istniały (jak samochód). Z matematyką sprawa jest dyskusyjna i ocieramy się tu chyba o filozofię matematyki. Dla zwolenników realizmu matematycznego rho Spearmana istniało przed Spearmanem, który je tylko odkrył. Dla zwolenników nominalizmu i formalizmu matematycznego Spearman wynalazł nową metodę żonglowania cyferkami, której przed nim nie było, więc nie mógł jej odkryć. Pozdrawiam, Olaf @ 17:19, 30 maj 2008 (CEST)
    • Mi "wynalazł" kojarzy się z wynalazkiem, a póki co to formuł matematycznych, algorytmów itp. nie można patentować. Może "sformułowany" lub "zdefiniowany" byłoby bardziej naturalnie? Swoją drogą, ciekawe hasło, ale nie miałem jeszcze czasu dokończyć czytać. duch Qblika seansik? 17:26, 30 maj 2008 (CEST)
      • Zmieniłem na "wprowadzony". Olaf @ 17:42, 30 maj 2008 (CEST)
  • Chętnie napisałbym, których wzorów używa Statistica, ale na co dzień pracuję w SAS 9.1 (stosuje wzór (2)). SPSS też stosuje wzór (2). Czy ktoś, kto ma dostęp do Statistici mógłby przeliczyć na niej przykład podany w artykule? Wystarczy wynik, wzór odróżni się na jego podstawie. Olaf @ 17:42, 30 maj 2008 (CEST) Zapytalem jeszcze raz tu (chyba większa szansa, że zauważy jakiś użytkownik). A może z opisu statsoftu potrafisz coś wywnioskować? Kuszi (dyskusja) 10:43, 5 cze 2008 (CEST).
  • Jednego nie rozumiem: Czy dobrze wnioskuję, że oryginalny współczynnik zaproponowany przez Spearmana nazywa się obecnie "miarą Spearmana", i że z tego wzoru nie korzysta się powszechnie obecnie ze względu na jego marne własności? I jeżeli to jest prawda, to czy zdanie "W pierwotnej wersji korelacja rang Spearmana została zdefiniowana jako zwykły współczynnik korelacji Pearsona rang zmiennych" jest rzeczywiście prawdziwe? Wydaje mi się, że wzór w sekcji "Miara Spearmana" nie definiuje korelacji w tym sensie (wartości bezwzględne vs. kwadraty), a raczej inną miarę zależność zmiennych losowych. A może pierwotny wzór zaproponowany przez Spearmana nie jest w ogóle podany (wówczas chyba należałoby uzupełnić)? duch Qblika seansik? 18:06, 30 maj 2008 (CEST)
    • OK. Sam zauważyłem, że miara Spearmana to co innego. Ale oryginalnego wzoru Spearmana chyba nie ma? duch Qblika seansik? 18:10, 30 maj 2008 (CEST)
    • W pracy z 1904 roku Spearman zdefiniował dwa nowe współczynniki: korelację Pearsona z rang i tę "miarę Spearmana". Kiedy pojawił się wzór (7), nie wiem, ale na pewno nie ma go w pierwotnej pracy. Zresztą żadnego wzoru na korelację rang tam nie ma, on po prostu opisał słownie właściwości współczynnika korelacji Pearsona liczonego dla rang zmiennych, jak gdyby ta metoda była znana od wieków. Ta praca to było podsumowanie sposobów pomiaru korelacji dla kolegów psychologów. Wcale bym się nie zdziwił, gdyby faktycznie ta metoda była znana wcześniej, tylko nierozpropagowana, ale wszystkie źródła wskazują właśnie tę pracę jako wprowadzającą nowe współczynniki. A potem statystycy się na to rzucili i niektórzy uznali, że korelacja rang ma nawet sens, za to miara Spearmana ma raczej kiepskie właściwości (ostatnio próbuje się ją zrehabilitować, bo okazało się, że do czegoś tam się nadaje). W każdym razie miara Spearmana i korelacja rang Spearmana to zupełnie inne współczynniki i miara Spearmana nie ma nic wspólnego ze współczynnikiem korelacji Pearsona. Zarówno miara Spearmana jak i korelacja rang są jednak miarami korelacji w tym sensie, że mierzą zależność zmiennych losowych. Olaf @ 18:23, 30 maj 2008 (CEST)
      • Bardzo dziękuję Ci za to wyjaśnienie, ale wciąż mam pewne wątpliwości. Żadnego ze wzorów (2), (6) i (7) nie można chyba określić jako "zwykły współczynnik korelacji Pearsona rang zmiennych". Czy definicja "zwykły współczynnik korelacji Pearsona rang zmiennych" jest jednoznaczna? Chyba tak. Wówczas, choćby ze względów historycznych może należałoby ten wzór "zrekonstruować". I wciąż pozostaje wątpliwość, dlaczego ten "zwykły współczynnik korelacji Pearsona rang zmiennych" nie jest używany w praktyce. Domyślam się, że chodzi o jakieś własności statystyczne, ale jakie (jest obciążony, nieefektywny, itp?). A może się mylę, i jeżeli przyjmę, że definicja "zwykły współczynnik korelacji Pearsona rang zmiennych" nie jest jednoznaczna to wówczas po przeczytaniu hasła odniosłem wrażenie, że Spearman nie zaproponował konkretnego estymatora (wzoru), ale raczej metodę estymacji (korelację z rang), a szczegóły i własności dopracowano później (wzory (2), (6) jak i (7))? No i jeszcze mogę się mylić w trzeci sposób, któryś ze wzorów (2), (6) i (7) definiuje "zwykły współczynnik korelacji Pearsona rang zmiennych". W to raczej wątpię, ale jeżeli już to (7) mi najbardziej pasuje, a tam jest wprost napisane, że "Nie jest też wtedy zgodny z pierwotną definicją rho Spearmana jako zwykłego współczynnika korelacji dla rang." Myślę, że hasło lepiej mogłoby rozwiać te wątpliwości, bądź podając wprost "wzór Spearmana" na "zwykły współczynnik korelacji Pearsona rang zmiennych" (jeżeli jest nieużywany, to mógłby być gdzieś na końcu w sekcji "historia" lub w przypisie) albo wprost twierdząc, że Spearman nie zaproponował konkretnego estymatora, lecz raczej metodę estymacji (wykorzystanie rang). Bo z obecnej formy sam nie jestem w stanie tego wywnioskować. A tak w ogóle, to chapeau bas za to hasło. duch Qblika seansik? 22:38, 30 maj 2008 (CEST)
        • Spearman nie proponował żadnego estymatora, czy metody estymacji (chyba w ogóle nie rozumował w tych kategoriach), po prostu chciał ulepszyć korelację Pearsona, żeby działała dla zmiennych porządkowych (bo w psychologii dużo takich), więc wymyślił, żeby stosować ją do rang i opisał, co z tego wychodzi. A przy okazji ucieszył się, że mu odstające obserwacje już nie przeszkadzają. Gdyby chcieć to odtwarzać, to wyszedłby wzór (2), który jest właśnie współczynnikiem korelacji Pearsona zastosowanym do rang zmiennych. O ile wiem, właśnie wersja (2) jest standardowo rozumiana jako korelacja rang Spearmana w pracach naukowych i w pakietach statystycznych (co najmniej SAS jej właśnie używa). Ale wszystkie podręczniki typu "statystyka dla studentów XXX" podają wzór (7), którego jedyną zaletą jest to, że się prosto liczy. Pojęcia nie mam kto go wymyślił i po co. Możliwe zresztą że sam Spearman w późniejszej pracy z 1907, której nigdzie nie mogę znaleźć. Chyba faktycznie powinienem to jakoś opisać, ale sprawa nie jest tak oczywista, więc wolę tego nie robić zanim nie będę pewien. Co innego miara Spearmana, na tą nawet napisał w pracy 1904 wzorek. Miło, że ktoś próbuje wniknąć w artykuł, bo się już bałem że wszyscy to podziwiają niby japońską kaligrafię - wygląda ładnie, i można wierzyć że coś znaczy. ;-) Olaf @ 02:34, 31 maj 2008 (CEST)
          • Dzięki za wyjaśnienie. W zapewne w haśle można to lepiej wyjaśnić, bo dopiero po przeczytaniu Twojego wyjaśnienia hasło jest bardziej klarowne. Na teraz jedyny pomysł jaki mam to zamienić kolejność sekcji "Wzór nieuwzględniający rang wiązanych" i "Wersje uwzględniające rangi wiązane". Zaletą takiego rozwiązania jest, to, że wtedy na początku można napisać, że wzór 2 jest tym co Spearman "miał na myśli" i jak "powinno być". A przed wzorem 7 napisać "a to się często spotyka w podręcznikach bo się łatwiej liczy". Wadą tego jest zapewne wielokrotny wzrost zgłoszeń na "zgłoś błąd", bo wielu czytających zauważy, że podany wzór różni się od tego co mają w skryptach/podręcznikach. Dzięki raz jeszcze. duch Qblika seansik? 22:01, 31 maj 2008 (CEST)
            • Przerobiłem według Twoich sugestii (co wymagało m.in. przenumerowania wzorów także w powyższej dyskusji). Znalazłem pracę Studenta, która opisuje początki badań nad korelacją rangową. Okazuje się, że tak jak sugerowałem wyżej Spearman nie był autorem tego współczynnika! Opisałem wszystko dokładnie w nowej sekcji Historia artykułu. Daj proszę znać, czy teraz to wszystko jest jasne. I dziękuję za zmuszenie mnie do pogrzebania w tym wszystkim, bo uważam, że artykuł dużo na tej zmianie zyskał. Olaf @ 01:11, 1 cze 2008 (CEST)
              • Też uważam, że jest teraz zdecydowanie lepiej. I dziękuję Ci za cierpliwość. duch Qblika seansik? 06:02, 1 cze 2008 (CEST)

W przypisach, w pozycji 17 brakuje tytułu, w pozycji 24 pojawia się słowo czasopismo w potrójnym nawiasie klamrowym (wina szablonu?) Kuszi (dyskusja) 11:10, 2 cze 2008 (CEST).

Przypis 17 odwołuje się do bibliografii (nie wiem czy i jak mam to zaznaczyć), gdzie jest jedna książka tych autorów, przypis 24 poprawiłem. Dzięki za zauważenie. Dodałem w miejscach w których wstawiłeś {{fakt}} odnośniki do pozycji wymienionych w dalszej sekcji i odnośnik do całej sekcji. Tłumaczy ona szczegółowo kto ma jakie poglądy na wzór (7), w tym miejscu miała być tylko zajawka. Dzięki, Kuszi (dyskusja) 22:15, 4 cze 2008 (CEST). Skorygowałem tłumaczenia cytatów Konrada. Wydaje mi się, że "korelowanie wg. charakteru" i "charakter wynikający z hipotezy o rozkładzie normalnym" nie mają sensu merytorycznego, to zbyt dosłowne tłumaczenie bez rozumienia treści, "character" to przecież także "typ", a to zdanie sensu nabiera jeśli przyjmiemy, że Pearson dopuszczał jedynie korelowanie zmiennych o identycznym typie rozkładu, a najlepiej dwóch zmiennych o rozkładzie normalnym. Do dziś niektórzy wyznawcy statystyki parametrycznej tak sądzą (tu wstawiam sobie szablon {{fakt}}), więc założenie, że tak głosił ich prorok, uważam za rozsądne. Podobnie zmieniłem nieco tłumaczenie cytatu z modelami, wydaje mi się, że "constraints" to tutaj "zależności" albo "więzy", a nie "ograniczenia". Jeśli chodzi o komentarz w opisie zmian "mieszane uczucia względem 'variety' (zmienna=variable)", to "variate" oznacza w statystyce zmienną losową, np. w "multivariate analysis" (zob. też słownik ISI). Trochę mi szkoda zdania "ich opis był bardzo mętny", ale może i faktycznie w przypisie pracy naukowej tak obrazowe określenie by się nie znalazło. Pozdrawiam, Olaf @ 03:27, 3 cze 2008 (CEST) to wszystko są propozycje, cieszę się, że jako takie je traktujesz! :) konrad mów! p.s. Dr. Spearman has suggested that rank in a series should be the character correlated rozumiem raczej jako Dr Spearman zasugerował, że rangi w szeregach powinny być (s)korelawane wg typu. (bieżąca postać: Dr Spearman zasugerował, że szeregi rang powinny być typem korelowanym); niech ktoś znający się na rzeczy to skontroluje. konrad mów! Ale co to znaczy "skorelowane według typu"? Nie ma takiego pojęcia, więc na jakiej podstawie sugerujesz takie tłumaczenie? Poza tym wtedy by nie było "the" przed "character". A w mojej wersji to ma sens - po prostu Spearman uznał, że ten typ danych też można korelować. Olaf @ 17:11, 3 cze 2008 (CEST)
Na podstawie artykułu: "Wikipedia:Propozycje do Artykułów na Medal/Współczynnik korelacji rang Spearmana" pochodzącego z Wikipedii
OryginałEdytujHistoria i autorzy