Course Code:
rlang
Duration:
21 hours
Overview:
R to darmowy język programowania o otwartym kodzie źródłowym do obliczeń statystycznych, analizy danych i grafiki. R jest używany przez rosnącą liczbę menedżerów i analityków danych w korporacjach i środowiskach akademickich. R znalazł również zwolenników wśród statystyków, inżynierów i naukowców bez umiejętności programowania komputerowego, którzy uważają go za łatwy w użyciu. Jego popularność wynika z rosnącego wykorzystania eksploracji danych do różnych celów, takich jak ustalanie cen reklam, szybsze znajdowanie nowych leków lub dostrajanie modeli finansowych. R posiada szeroką gamę pakietów do eksploracji danych.
Course Outline:
Dzień 1
Wprowadzenie i informacje wstępne
- Uczynienie R bardziej przyjaznym, R i dostępne GUI
- Rstudio
- Powiązane oprogramowanie i dokumentacja R
- R i statystyki
- Interaktywne korzystanie z R
- Sesja wprowadzająca
- Uzyskiwanie pomocy dotyczącej funkcji i właściwości
- Polecenia R, rozróżnianie wielkości liter itp.
- Wywoływanie i poprawianie poprzednich poleceń R
- Wykonywanie poleceń z pliku lub przekierowywanie danych wyjściowych do pliku
- Trwałość danych i usuwanie obiektów
Proste manipulacje; liczby i wektory
- Wektory i przypisanie
- Arytmetyka wektorowa
- Generowanie sekwencji regularnych
- Wektory logiczne
- Brakujące wartości
- Wektory znaków
- Wektory indeksów; wybieranie i modyfikowanie podzbiorów zbioru danych
- Inne typy obiektów
Obiekty, ich tryby i atrybuty
- Atrybuty wewnętrzne: tryb i długość
- Zmiana długości obiektu
- Pobieranie i ustawianie atrybutów
- Klasa obiektu
Czynniki uporządkowane i nieuporządkowane
- Konkretny przykład
- Funkcja tapply() i tablice nieuporządkowane
- Czynniki uporządkowane
Tablice i macierze
- Tablice
- Indeksowanie tablic. Podsekcje tablicy
- Indeksowanie macierzy
- Funkcja array()
- Mieszana arytmetyka wektorowa i tablicowa. Reguła recyklingu
- Iloczyn zewnętrzny dwóch tablic
- Uogólniona transpozycja tablicy
- Obiekty Matrix
- Mnożenie Matrix
- Równania liniowe i inwersja
- Wartości własne i wektory własne
- Dekompozycja wartości pojedynczej i wyznaczniki
- Dopasowanie metodą najmniejszych kwadratów i rozkład QR
- Tworzenie macierzy partycjonowanych, cbind() i rbind()
- Funkcja konkatenacji () z tablicami
- Tablice częstości z czynników
Dzień 2
Listy i ramki danych
- Listy
- Konstruowanie i modyfikowanie list
- Łączenie list
- Ramki danych
- Tworzenie ramek danych
- Dołączanie() i odłączanie()
- Praca z ramkami danych
- Dołączanie dowolnych list
- Zarządzanie ścieżką wyszukiwania
Manipulowanie danymi
- Wybieranie, podzestawianie obserwacji i zmiennych
- Filtrowanie, grupowanie
- Kodowanie, transformacje R
- Agregacja, łączenie zestawów danych
- Manipulacja znakami, pakiet stringr
[Wczytywanie danych
- Pliki txt
- Pliki CSV
- Pliki XLS, XLSX
- SPSS, SAS, Stata,... i inne formaty danych
- Eksportowanie danych do plików txt, csv i innych formatów
- Access pobieranie danych z baz danych przy użyciu języka SQL
Rozkłady prawdopodobieństwa
- R jako zestaw tabel statystycznych
- Badanie rozkładu zestawu danych
- Testy jedno- i dwupróbkowe
Grupowanie, pętle i wykonywanie warunkowe
- Grupowanie wyrażeń
- Instrukcje sterujące
- Wykonanie warunkowe: instrukcje if
- [Wykonanie warunkowe: pętle for, repeat i while
Dzień 3
Pisanie własnych funkcji
- Proste przykłady
- Definiowanie nowych operatorów binarnych
- Nazwane argumenty i wartości domyślne
- Argument "...
- Przypisania wewnątrz funkcji
- Bardziej zaawansowane przykłady
- Czynniki wydajności w projektach blokowych
- Usuwanie wszystkich nazw z drukowanej tablicy
- REkursywne całkowanie numeryczne
- Zakres
- Dostosowywanie środowiska
- Klasy, funkcje ogólne i orientacja obiektowa
Analiza statystyczna w R
- Modele regresji liniowej
- Funkcje ogólne do wyodrębniania informacji o modelu
- Aktualizacja dopasowanych modeli
- Uogólnione modele liniowe
- Rodziny
- Funkcja glm()
- Klasyfikacja
- Ekspresja logistyczna R
- Liniowa analiza dyskryminacyjna
- Uczenie bez nadzoru
- Analiza składowych głównych
- Metody grupowania (k-średnich, hierarchiczne grupowanie, k-medoidy)
- Analiza przeżycia
- Obiekty przeżycia w r
- Oszacowanie Kaplana-Meiera
- Przedziały ufności
- Modele Coxa PH, stałe zmienne towarzyszące
- Modele Coxa PH, zmienne zależne od czasu
Procedury graficzne
- Polecenia wykresów wysokiego poziomu
- Funkcja plot()
- Wyświetlanie danych wielowymiarowych
- Wyświetlanie grafiki
- Argumenty wysokopoziomowych funkcji kreślenia
- Podstawowe wykresy wizualizacji
- Zależności wielowymiarowe z siatką i pakietem ggplot
- Korzystanie z parametrów graficznych
- Lista parametrów graficznych
Automatyczne i interaktywne raportowanie
- Łączenie danych wyjściowych z R z tekstem
Tworzenie dokumentów html, pdf
Sites Published: