Projekt Centrum Zastosowań Matematyki został zakończony w 2015 roku
Projekt Centrum Zastosowań Matematyki został zakończony w 2015 roku. W latach 2012-2015 zorganizowaliśmy 5 konferencji, 6 warsztatów tematycznych oraz 3 konkursy...
Porównywanie pomiarów jakościowych:
2. Ocena jakości testu diagnostycznego
3. Czułość, swoistość, PPV i NPV testu diagnostycznego.
4. Prawdopodobieństwo pre i post-test, wskaźnik wiarygodności.
5. Tabele wielodzielcze (2×2) w analizie danych – zadania dla uczestników.
6. Krzywe ROC.
7. Miary efektu: różnica ryzyka, NNT, OR, RR, ryzyko przypisane ekspozycji – zadania dla uczestników.
8. Błędy
Celem warsztatów jest zapoznanie uczestników z metodami statystycznymi stosowanymi we współczesnej epidemiologii, w tym przedstawienie konstrukcji i zastosowania krzywych ROC, tabel wielodzielczych 2, poprawki Yatesa, testu (uwzględnienie zasad stosowania testów Fishera), wyznaczania ilorazu szans i ryzyka względnego oraz ich interpretacja. Ponadto, w ramach warsztatów przedstawione zostaną najczęstsze błędy systematyczne w epidemiologii pojawiające się w trakcie analizy danych.
W statystycznej analizie danych genetycznych stosuje się szereg analiz m.in. do oceny: rozkładu analizowanych danych (HWE), statystyk opisowych (PIC, HET), sprawdzania nierównowagi sprzężeń (LD). Szereg analiz stosowanych jest do oceny grup osób chorych w odniesieniu do zdrowych (CaseControl, TDT) i to w zależności od tego czy są spokrewnione czy nie.
W analizach danych genomicznych, proteomicznych czy metabolomicznych w celu uzyskania wyjaśnienia relacji miedzy dużymi zbiorami danych coraz częściej sięga się po wielowymiarowe techniki statystyczne. W przypadku danych wysoko przepustowych np. z mikromacierzy, ekspresja genów jest reprezentowana przez dziesiątki tysięcy zmiennych (detekcja wielu wariantów transkrypcyjnych) przy równoczesnej niewielkiej liczbie obserwacji (prób wykonanych w określonych warunkach). W takich przypadkach klasyczne metody wielowymiarowe są niewystarczające (brak precyzji interpretacji biologicznej. Dlatego rozwijane są modyfikacje np. regulowanej analizy kanonicznej (rCCA), która umożliwia analizę danych z duża liczbą zmiennych niezależnych przy niewielkiej liczbie obserwacji. Dostępne jest również rozwinięcie techniki regresji metodą najmniejszych kwadratów (tj. sPLS), której celem jest redukcja zmiennych (“odszumienie” zbioru danych), dzięki, czemu w uzasadniony matematycznie sposób (przy określonych założeniach) zawęża się zbiór zmiennych włączanych do modelu. Umiejętne zastosowanie opisanych metod (właściwe spojrzenie na budowanie modelu kanonicznego czy regresyjnego) w analizie danych np. medycznych dostarcza wyników, które mogą mieć duże znaczenie na etapie wyciągania wniosków istotnych z klinicznego punktu widzenia.
Zastosowanie analiz statystycznych w badaniach biomedycznych jest powszechne i ma znaczenie podstawowe. Z uwagi na liczne potencjalne czynniki modyfikujące przebieg choroby lub stan homeostazy w przypadku jednostkowym, analiza statystyczna populacji stanowi często jedyną opcję oceny wpływu określonego czynnika oraz stwarza pole do współpracy specjalistów w naukach przyrodniczych i matematycznych. Bez umiejętnego zastosowania licznych analiz statystycznych nie jest możliwe zbadanie związku między czynnikami genetycznymi lub zmiennymi biochemicznymi, a chorobą, w dużych populacjach.
Wykład będzie dotyczył podstaw analizy SNP (ang. single nucleotide polymorphism, polimorfizm jednonukleotydowy) oraz danych biochemicznych w badaniach populacyjnych w naukach biomedycznych. Przedstawione zostaną statystyki opisowe zmiennych, analiza odstępstwa w rozkładzie genotypów od reguły Hardy’ego-Weinberga, analiza typu rozkładu zmiennych ciągłych, dobór odpowiedniego testu do analiz zależność genotyp-fenotyp biochemiczny, zastosowanie regresji liniowej oraz modeli regresji liniowej w analizach zależności genotyp-fenotyp biochemiczny, a także testów nieparametrycznych, opis sytuacji, która wymaga zastosowania poprawki metodą Bonferroniego dla wielokrotnych powtórzeń. Dla populacji typu przypadki-kontrole przedstawione zostanie użycie ilorazu szans w analizie rozkładu częstości genotypów oraz biochemicznych zmiennych kategoryzowanych w celu określenia udziału czynników genetycznych i biochemicznych w chorobie. Przedstawiona zostanie analiza typu Kaplan-Meier (tzw. krzywa przeżycia) dla oceny czasu przeżycia w odpowiedzi na występowanie zmiennej modyfikującej np. genotypu lub stosowanego leku w chorobie. Przedstawione zostaną podstawowe problemy w analizie danych mikromacierzowych poziomu metylacji DNA uzyskanych przy zastosowaniu platformy Infinium 450K firmy Ulmina.
Przykładom analiz będzie towarzyszyć wyjaśnianie niezbędnych pojęć z zakresu genetyki i biochemii.
Wykład wprowadzi kursantów w podstawowe techniki analizy danych genetycznych i biochemicznych w badaniach biomedycznych.