R to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R znalazł również zwolenników wśród statystyków, inżynierów i naukowców bez umiejętności programowania komputerowego, którzy uważają go za łatwy w użyciu. Jego popularność wynika z rosnącego wykorzystania eksploracji danych do różnych celów, takich jak ustalanie cen reklam, szybsze znajdowanie nowych leków lub dostrajanie modeli finansowych. R posiada szeroką gamę pakietów do eksploracji danych.
I. Wprowadzenie i zagadnienia wstępne
1. Przegląd
- Czynienie R bardziej przyjaznym, R i dostępne GUI
- Rstudio
- Powiązane oprogramowanie i dokumentacja
- R i statystyki
- Interaktywne korzystanie z języka R
- Sesja wprowadzająca
- Uzyskiwanie pomocy dotyczącej funkcji i właściwości
- Polecenia R, wielkość liter itp.
- Przywoływanie i poprawianie poprzednich poleceń
- Wykonywanie poleceń z pliku lub przekierowywanie danych wyjściowych do pliku
- Trwałość danych i usuwanie obiektów
- [Praktyka programowania w R: Samodzielne skrypty, dobra czytelność, np. ustrukturyzowane skrypty, dokumentacja, markdown
- Instalowanie pakietów; CRAN i Bioconductor
2. Odczytywanie danych
- Pliki txt (read.delim)
- Pliki CSV
3. Proste manipulacje; liczby i wektory + tablice
- Wektory i przypisanie
- Arytmetyka wektorowa
- Generowanie sekwencji regularnych
- Wektory logiczne
- Brakujące wartości
- Wektory znaków
- Wektory indeksowe; wybieranie i modyfikowanie podzbiorów zbioru danych
- Tablice
- Indeksowanie tablic. Podsekcje tablicy
- Indeksowanie macierzy
- Funkcja array() + proste operacje na tablicach, np. mnożenie, transpozycja.
- Inne typy obiektów
4. Listy i ramki danych
- Listy
- Konstruowanie i modyfikowanie list
- Łączenie list
- Ramki danych
- Tworzenie ramek danych
- Praca z ramkami danych
- Dołączanie dowolnych list
- Zarządzanie ścieżką wyszukiwania
5. Manipulowanie danymi
- Wybieranie, podzestawianie obserwacji i zmiennych
- Filtrowanie, grupowanie
- Przekodowywanie, transformacje
- Agregacja, łączenie zestawów danych
- Tworzenie macierzy partycjonowanych, cbind() i rbind()
- Funkcja konkatenacji () z tablicami
- Manipulacja znakami, pakiet stringr
- Krótkie wprowadzenie do grep i regexpr
6. Więcej na temat odczytu danych
- Pliki XLS, XLSX
- pakiety readr i readxl
- SPSS, SAS, Stata,... i inne formaty danych
- Eksportowanie danych do txt, csv i innych formatów
6. Grupowanie, pętle i wykonywanie warunkowe
- Grupowanie wyrażeń
- Instrukcje sterujące
- Wykonywanie warunkowe: instrukcje if
- Wykonywanie powtarzalne: pętle for, repeat i while
- Wprowadzenie do apply, lapply, sapply, tapply
7. Funkcje
- Tworzenie funkcji
- Opcjonalne argumenty i wartości domyślne
- Zmienna liczba argumentów
- Zakres i jego konsekwencje
8. Prosta grafika w R
- Tworzenie wykresu
- Wykresy gęstości
- Wykresy punktowe
- Wykresy słupkowe
- Wykresy liniowe
- Wykresy kołowe
- Wykresy pudełkowe
- Wykresy punktowe
- Łączenie wykresów
II. Analiza statystyczna w R
1. Rozkłady prawdopodobieństwa
- R jako zestaw tabel statystycznych
- Badanie rozkładu zbioru danych
2. Testowanie hipotez
- Testy dotyczące średniej populacji
- Test ilorazu wiarygodności
- Testy dla jednej i dwóch prób
- Test Chi-kwadrat Go odness-of-Fit
- Statystyka Kołmogorowa-Smirnowa dla jednej próby
- Test Wilcoxona Signed-Rank
- Test dwóch prób
- Test sumy rang Wilcoxona
- Test Manna-Whitneya
- Test Kołmogorowa-Smirnowa
3. Wielokrotne testowanie hipotez
- Błąd typu I i FDR
- Krzywe ROC i AUC
- Procedury wielokrotnego testowania (BH, Bonferroni itp.)
4. Modele regresji liniowej
- Ogólne funkcje wyodrębniania informacji o modelu
- Aktualizacja dopasowanych modeli
- Uogólnione modele liniowe
- Rodziny
- Funkcja glm()
- Klasyfikacja
- Regresja logistyczna
- Liniowa analiza dyskryminacyjna
- Uczenie się bez nadzoru
- Analiza składowych głównych
- Metody grupowania (k-średnich, hierarchiczne grupowanie, k-medoidy)
5. Analiza przeżywalności (pakiet survival)
- Obiekty przeżycia w r
- Oszacowanie Kaplana-Meiera, test log-rank, regresja parametryczna
- Przedziały ufności
- Analiza danych cenzurowanych (cenzurowanych interwałowo)
- Modele Coxa PH, stałe zmienne towarzyszące
- Modele Coxa PH, zmienne zależne od czasu
- Symulacja: Porównanie modeli (porównanie modeli regresji)
6. Analiza wariancji
- Jednoczynnikowa ANOVA
- Dwukierunkowa klasyfikacja ANOVA
- MANOVA
III. Problemy praktyczne w bioinformatyce
- Krótkie wprowadzenie do pakietu limma
- Przebieg analizy danych z mikromacierzy
- Pobieranie danych z GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Przetwarzanie danych (QC, normalizacja, ekspresja różnicowa)
- Wykres wulkanu
- Przykłady analizy + mapy cieplne
Brasil - Introductory R for Biologists
Canada - Introductory R for Biologists
中国 - Introductory R for Biologists
香港 - Introductory R for Biologists
澳門 - Introductory R for Biologists
台灣 - Introductory R for Biologists
USA - Introductory R for Biologists
Österreich - Introductory R for Biologists
Schweiz - Introductory R for Biologists
Deutschland - Introductory R for Biologists
Czech Republic - Introductory R for Biologists
Denmark - Introductory R for Biologists
Estonia - Introductory R for Biologists
Finland - Introductory R for Biologists
Greece - Introductory R for Biologists
Magyarország - Introductory R for Biologists
Ireland - Introductory R for Biologists
Luxembourg - Introductory R for Biologists
Latvia - Introductory R for Biologists
España - Introducción R para Biólogos
Italia - Introductory R for Biologists
Lithuania - Introductory R for Biologists
Nederland - Introductory R for Biologists
Norway - Introductory R for Biologists
Portugal - Introductory R for Biologists
România - Introductory R for Biologists
Sverige - Introductory R for Biologists
Türkiye - Introductory R for Biologists
Malta - Introductory R for Biologists
Belgique - Introductory R for Biologists
France - Introductory R for Biologists
日本 - Introductory R for Biologists
Australia - Introductory R for Biologists
Malaysia - Introductory R for Biologists
New Zealand - Introductory R for Biologists
Philippines - Introductory R for Biologists
Singapore - Introductory R for Biologists
Thailand - Introductory R for Biologists
Vietnam - Introductory R for Biologists
India - Introductory R for Biologists
Argentina - Introducción R para Biólogos
Chile - Introducción R para Biólogos
Costa Rica - Introducción R para Biólogos
Ecuador - Introducción R para Biólogos
Guatemala - Introducción R para Biólogos
Colombia - Introducción R para Biólogos
México - Introducción R para Biólogos
Panama - Introducción R para Biólogos
Peru - Introducción R para Biólogos
Uruguay - Introducción R para Biólogos
Venezuela - Introducción R para Biólogos
Polska - Introductory R for Biologists
United Kingdom - Introductory R for Biologists
South Korea - Introductory R for Biologists
Pakistan - Introductory R for Biologists
Sri Lanka - Introductory R for Biologists
Bulgaria - Introductory R for Biologists
Bolivia - Introducción R para Biólogos
Indonesia - Introductory R for Biologists
Kazakhstan - Introductory R for Biologists
Moldova - Introductory R for Biologists
Slovakia - Introductory R for Biologists
Slovenia - Introductory R for Biologists
Croatia - Introductory R for Biologists
Serbia - Introductory R for Biologists
Bhutan - Introductory R for Biologists