Statystycznie rzecz biorąc

Socjologia mnie ukształtowała, albo może raczej wypaliła na mnie niezatarte piętno. Kocham cyferki. Tabele, wykresy, wszelkie słupki, zestawienia. Sprawdzam, porównuję, przeliczam to co widzę i słyszę z różnych źródeł. Taka była moja początkowa strategia radzenia sobie z pandemią. Liczby przekładałam na procenty i udowadniałam (głównie sobie), że wcale nie jest tak źle, jak się wydaje.

Statystycznie rzecz biorąc, można udowadniać straszne głupoty – niektórym wydaje się, że jeśli wrzucą kilka liczb i podeprą to linkiem do GUS-u, albo jakiejś sondażowni, to będzie mądrze i na temat. Nie koniecznie. Kiedy pracowałam na uczelni, często zadawałam pytanie:

Czego dowodzą te liczby?

Czasem studenci przytaczali jakieś dane tylko po to, aby coś napisać, bez żadnej analizy, czasem bez sensu.  Teraz też czasem trafiam na taki tekst, który stara się być poważny i podpiera się statystykami, które niczego nie wnoszą.  Jednak skoro dane mają adres stat.gov.pl, to ho, ho, pewnie artykuł wartościowy.

93% ofiar gwałtu to kobiety,

a odsetek ten nie spadał od lat poniżej 91%.  Taką informację znalazłam w jakimś tekście na temat zasad bezpieczeństwa dla kobiet. No jest poważnie, prawie 100% ofiar gwałtów to kobiety. Autor nawołuje do zachowania czujności, zgadzam się, to ważne, ale czy dzięki temu odsetek kobiet wśród ofiar gwałtu spadnie? Nie sądzę. W liczbach bezwzględnych owszem, ale nie w procentach.

Kiedy spadnie udział procentowy? Tylko wtedy, jeżeli wśród ofiar gwałtu pojawi się więcej mężczyzn. Czyli, albo kobiety zaczną napadać i gwałcić, albo zwiększy się ilość gwałtów homoseksualnych.  Ciekawa jestem, czy o to chodziło autorowi tekstu namawiającego kobiety do samoobrony? 😛

Covid statystycznie się rozwija kończy

No tu, to już można poszaleć z cyferkami, które nic  nie znaczą. Jak trzeba postraszyć – wykresy wybijają dziury w niebie, jak uspokoić to się wypłaszczają. 5000 albo 25 000 – to nic nie znaczy. Liczba zachorowań to nie liczba przeprowadzonych w danym dniu testów. Wykrywalność na poziomie blisko 50% przeraża, ale… to bzdura. Każdego dnia podaje się liczbę zarejestrowanych poprzedniego dnia wyników pozytywnych. Okazuje się, że wyniki są z: wczoraj, przedwczoraj i z zeszłego tygodnia.  Nikt nie jest w stanie sprawdzić, jak to się statystycznie rozkłada. Dowodem na chaos są sytuacje kiedy ogłasza się więcej zachorowań niż zrobionych danego dnia testów.

Dlatego spokojnie, statystycznie jest dobrze. Czytaj tabelki, oglądaj wykresy i myśl.