Wirus atakuje. Ale panika atakuje jeszcze bardziej.
W takich sytuacjach szczególnie wyraźnie widać, jak ważne są dane i ich analiza.
Przeanalizowaliśmy dane dotyczące epidemii z John Hopkins University i … na samym początku napotkaliśmy rafę. Otóż prawie wszystkie wiarygodne światowe źródła podają liczby skumulowane, z których trzeba dopiero odtworzyć dane dzienne. A ma to bardzo duże znaczenie.
Wrzucając do analizy dane skumulowane dla całego świata dostajemy taki obraz:
Podczas gdy dane dzienne wyglądają tak:
Ma to kolosalne znaczenie dla analizy.
Patrząc na dane dla prowincji Hubei, najbardziej dotkniętej epidemią, dane wyglądają tak:
13 lutego Chińczycy zmienili sposób kwalifikacji zarażonych – stąd skokowy wzrost ich liczby, ale widać wyraźnie, że w pewnym momencie zaczęła stabilizować się liczba nowych przypadków dziennie, a potem – zaczęła spadać. Zaś całkowita liczba zarażonych wzrastała po tzw. krzywej logistycznej – czyli na początku wzrost był wykładniczy, potem zaczął asymptotycznie się wypłaszczać.
Jeśli weźmiemy pod uwagę pozostałe prowincje Chin, dane wyglądają tak:
Reguła się potwierdza – najpierw wykładniczy wzrost, potem stabilizacja liczby przypadków dziennie (dla każdej prowincji na innym poziomie – to ważne!), potem spadek. Okres apogeum epidemii w każdej z pozostałych prowincji Chin trwał około tygodnia.
Jeśli nie do końca ufamy chińskim statystykom, lub chcemy je sprawdzić gdzie indziej, zobaczmy, jak wyglądają dane dla Europy. Tutaj za wcześnie na wnioski, natomiast liczba dziennie notowanych nowych przypadków wygląda następująco:
W poszczególnych krajach Europy sytuacja wygląda tak:
Wiemy wszyscy, że najgorzej jest we Włoszech. Zobaczmy jak wygląda tam sytuacja:
W dniu w którym piszę ten tekst (19.03) liczba nowych przypadków dziennie od 5 dni jest stabilna. Przestała rosnąć wykładniczo. Oczywiście ma na to wpływ wiele innych czynników – jak choćby liczba wykonywanych testów, czy tempo spływania informacji, ale publicznie dostępne dane wyraźnie na to wskazują.
Ciekawa jest też analiza tempa wzrostu od pierwszego przypadku do dziś. W skali globalnej wygląda ona następująco:

Widać na nim że w większości krajów okres „wylęgania się” epidemii zajął około miesiąca. Podobnie było w Chinach, tam z opóźnieniem podano tę informację do publicznej wiadomości. Widać też że tempo wzrostu liczby zarażonych we Włoszech czy Hiszpanii podąża podobną ścieżką – ale też – z czysto matematycznego punktu widzenia – ten trend w ciągu najbliższego tygodnia powinien zacząć się wypłaszczać…
Zobaczmy jeszcze najsmutniejsza statystykę – przyrost liczby ofiar śmiertelnych od dnia stwierdzenia pierwszego przypadku. Wygląda ona następująco:

Wzrost we Włoszech jest znacznie szybszy niż miało to miejsce w Chinach. Prawdopodobnie ma to związek z demografią – średnia wieku we Włoszech to 46 lat, w Chinach 38,6 lat (w Polsce 42 lata).
Ale również ta najsmutniejsza statystyka we Włoszech zaczyna się stabilizować… Dzienna liczba ofiar śmiertelnych również przestała rosnąć wykładniczo. I tego się trzymajmy…

Zobaczmy jeszcze porównanie tempa rozprzestrzeniania się epidemii w krajach europejskich:

Liczba dni jakie upłynęły od stwierdzenia pierwszego przypadku we Włoszech (48) jest MNIEJSZA niż w Niemczech, a liczba zarejestrowanych przypadków – ponad 3-krotnie wyższa. Oczywiście, może to mieć związek z liczbą wykonywanych testów (ale akurat nasi Zachodni Sąsiedzi robią ich bardzo dużo – oddzielne analizy na ten temat wkrótce). Widać jednak wyraźnie że epidemia ma różne tempo w różnych krajach I nie ma tu znaczenia średnia wieku – w Niemczech jest to 45 lat, we Włoszech 46 lat.
Liczba stwierdzonych przypadków zaczyna też rosnąć w grupie krajów, w których wirus pojawił się relatywnie niedawno – zobaczmy uszczegółowienie (Polska jest zaznaczona na granatowo):

Najwięcej nowych przypadków w krajach gdzie epidemia pojawiła się w ciągu ostatnich 30 dni jest tam, gdzie … zrobiono najwięcej testów. Nieprzypadkowo, są to tez najbogatsze kraje Europy (Szwajcaria, Holandia, Norwegia, Austria, Dania…). Cóż…
Tę analizę warto wzbogacić o % populacji poszczególnych krajów, dotkniętych epidemią – zrobimy ją wkrótce. Zobaczmy jeszcze jedno porównanie. Jeśli zestawimy ze sobą liczbę dni od początku epidemii w danym kraju, liczbę ofiar, śmiertelność i liczbę potwierdzonych przypadków, otrzymamy taki rezultat:

Widać wyraźnie 3 kategorie krajów:
1. Tam gdzie epidemia trwa dłużej niż 40 dni i ofiary są liczne (na dziś Włochy ze śmiertelnością ponad 7%, choć szybko rośnie zagrożenie w Hiszpanii). Skądinąd wiemy, że około 85% ofiar we Włoszech to osoby po 70 roku życia…
2. Tam, gdzie epidemia trwa dłużej niż 40 dni, ale ofiar jest do tej pory znacznie mniej (Francja, Niemcy, Hiszpania, UK, Finlandia, Szwecja, Belgia)
3. Tam gdzie epidemia trwa krócej i ofiar do tej pory jest niewiele (reszta).
Analizując każdą z tych grup osobno przy – uwaga – różnej skali liczbowej dla przypadków śmiertelnych z uwagi na ich niewspółmierność w poszczególnych grupach – uzyskujemy taki rezultat:

Widać, że:
1. Hiszpania – co potwierdzały tez wcześniejsze analizy – podąża niestety śladem Włoch i należy spodziewać się stamtąd bardzo złych wieści.
2. Bogate kraje północnej Europy (Francja, Niemcy, UK, Finlandia, Szwecja, Belgia) na razie nie są dotknięte w większej skali – ich systemy zdrowotne wciąż są wydolne.
3. Trudno cokolwiek powiedzieć o pozostałych krajach (w tej grupie jest tez Polska) – tam skala zjawiska nie pozwala na wnioskowanie.
Oczywiście, najlepiej omówić te dane mając przed oczami interaktywną analizę (zrobiliśmy taką, codziennie aktualizujemy i wciąż ją rozbudowujemy). Zapraszam wszystkich na webinar poświęcony analizie bieżących danych – 25.03.2020 godzina 15:00.
Analiza opublikowana jest na Tableau Public zobacz dashboard >, dostępna bezpłatnie dla każdego, kto chciałby ją rozbudować i wzbogacić – potencjalnych Autorów bardzo proszę o kontakt.
Zdrowia życzę!
Witold Kilijański, Partner, NewDataLabs
W takich sytuacjach szczególnie wyraźnie widać, jak ważne są dane i ich analiza.
Przeanalizowaliśmy dane dotyczące epidemii z John Hopkins University i … na samym początku napotkaliśmy rafę. Otóż prawie wszystkie wiarygodne światowe źródła podają liczby skumulowane, z których trzeba dopiero odtworzyć dane dzienne. A ma to bardzo duże znaczenie.
Wrzucając do analizy dane skumulowane dla całego świata dostajemy taki obraz:

Podczas gdy dane dzienne wyglądają tak:

Ma to kolosalne znaczenie dla analizy.
Patrząc na dane dla prowincji Hubei, najbardziej dotkniętej epidemią, dane wyglądają tak:

13 lutego Chińczycy zmienili sposób kwalifikacji zarażonych – stąd skokowy wzrost ich liczby, ale widać wyraźnie, że w pewnym momencie zaczęła stabilizować się liczba nowych przypadków dziennie, a potem – zaczęła spadać. Zaś całkowita liczba zarażonych wzrastała po tzw. krzywej logistycznej – czyli na początku wzrost był wykładniczy, potem zaczął asymptotycznie się wypłaszczać.
Jeśli weźmiemy pod uwagę pozostałe prowincje Chin, dane wyglądają tak:

Reguła się potwierdza – najpierw wykładniczy wzrost, potem stabilizacja liczby przypadków dziennie (dla każdej prowincji na innym poziomie – to ważne!), potem spadek. Okres apogeum epidemii w każdej z pozostałych prowincji Chin trwał około tygodnia.
Jeśli nie do końca ufamy chińskim statystykom, lub chcemy je sprawdzić gdzie indziej, zobaczmy, jak wyglądają dane dla Europy. Tutaj za wcześnie na wnioski, natomiast liczba dziennie notowanych nowych przypadków wygląda następująco:

W poszczególnych krajach Europy sytuacja wygląda tak:

Wiemy wszyscy, że najgorzej jest we Włoszech. Zobaczmy jak wygląda tam sytuacja:

W dniu w którym piszę ten tekst (19.03) liczba nowych przypadków dziennie od 5 dni jest stabilna. Przestała rosnąć wykładniczo. Oczywiście ma na to wpływ wiele innych czynników – jak choćby liczba wykonywanych testów, czy tempo spływania informacji, ale publicznie dostępne dane wyraźnie na to wskazują.
Ciekawa jest też analiza tempa wzrostu od pierwszego przypadku do dziś. W skali globalnej wygląda ona następująco:

Widać na nim że w większości krajów okres „wylęgania się” epidemii zajął około miesiąca. Podobnie było w Chinach, tam z opóźnieniem podano tę informację do publicznej wiadomości. Widać też że tempo wzrostu liczby zarażonych we Włoszech czy Hiszpanii podąża podobną ścieżką – ale też – z czysto matematycznego punktu widzenia – ten trend w ciągu najbliższego tygodnia powinien zacząć się wypłaszczać…
Zobaczmy jeszcze najsmutniejsza statystykę – przyrost liczby ofiar śmiertelnych od dnia stwierdzenia pierwszego przypadku. Wygląda ona następująco:

Wzrost we Włoszech jest znacznie szybszy niż miało to miejsce w Chinach. Prawdopodobnie ma to związek z demografią – średnia wieku we Włoszech to 46 lat, w Chinach 38,6 lat (w Polsce 42 lata).
Ale również ta najsmutniejsza statystyka we Włoszech zaczyna się stabilizować… Dzienna liczba ofiar śmiertelnych również przestała rosnąć wykładniczo. I tego się trzymajmy…

Zobaczmy jeszcze porównanie tempa rozprzestrzeniania się epidemii w krajach europejskich:

Liczba dni jakie upłynęły od stwierdzenia pierwszego przypadku we Włoszech (48) jest MNIEJSZA niż w Niemczech, a liczba zarejestrowanych przypadków – ponad 3-krotnie wyższa. Oczywiście, może to mieć związek z liczbą wykonywanych testów (ale akurat nasi Zachodni Sąsiedzi robią ich bardzo dużo – oddzielne analizy na ten temat wkrótce). Widać jednak wyraźnie że epidemia ma różne tempo w różnych krajach I nie ma tu znaczenia średnia wieku – w Niemczech jest to 45 lat, we Włoszech 46 lat.
Liczba stwierdzonych przypadków zaczyna też rosnąć w grupie krajów, w których wirus pojawił się relatywnie niedawno – zobaczmy uszczegółowienie (Polska jest zaznaczona na granatowo):

Najwięcej nowych przypadków w krajach gdzie epidemia pojawiła się w ciągu ostatnich 30 dni jest tam, gdzie … zrobiono najwięcej testów. Nieprzypadkowo, są to tez najbogatsze kraje Europy (Szwajcaria, Holandia, Norwegia, Austria, Dania…). Cóż…
Tę analizę warto wzbogacić o % populacji poszczególnych krajów, dotkniętych epidemią – zrobimy ją wkrótce. Zobaczmy jeszcze jedno porównanie. Jeśli zestawimy ze sobą liczbę dni od początku epidemii w danym kraju, liczbę ofiar, śmiertelność i liczbę potwierdzonych przypadków, otrzymamy taki rezultat:

Widać wyraźnie 3 kategorie krajów:
1. Tam gdzie epidemia trwa dłużej niż 40 dni i ofiary są liczne (na dziś Włochy ze śmiertelnością ponad 7%, choć szybko rośnie zagrożenie w Hiszpanii). Skądinąd wiemy, że około 85% ofiar we Włoszech to osoby po 70 roku życia…
2. Tam, gdzie epidemia trwa dłużej niż 40 dni, ale ofiar jest do tej pory znacznie mniej (Francja, Niemcy, Hiszpania, UK, Finlandia, Szwecja, Belgia)
3. Tam gdzie epidemia trwa krócej i ofiar do tej pory jest niewiele (reszta).
Analizując każdą z tych grup osobno przy – uwaga – różnej skali liczbowej dla przypadków śmiertelnych z uwagi na ich niewspółmierność w poszczególnych grupach – uzyskujemy taki rezultat:

Widać, że:
1. Hiszpania – co potwierdzały tez wcześniejsze analizy – podąża niestety śladem Włoch i należy spodziewać się stamtąd bardzo złych wieści.
2. Bogate kraje północnej Europy (Francja, Niemcy, UK, Finlandia, Szwecja, Belgia) na razie nie są dotknięte w większej skali – ich systemy zdrowotne wciąż są wydolne.
3. Trudno cokolwiek powiedzieć o pozostałych krajach (w tej grupie jest tez Polska) – tam skala zjawiska nie pozwala na wnioskowanie.
Oczywiście, najlepiej omówić te dane mając przed oczami interaktywną analizę (zrobiliśmy taką, codziennie aktualizujemy i wciąż ją rozbudowujemy). Zapraszam wszystkich na webinar poświęcony analizie bieżących danych – 25.03.2020 godzina 15:00.
Analiza opublikowana jest na Tableau Public zobacz dashboard >, dostępna bezpłatnie dla każdego, kto chciałby ją rozbudować i wzbogacić – potencjalnych Autorów bardzo proszę o kontakt.
Zdrowia życzę!
Witold Kilijański, Partner, NewDataLabs