God förståelse för statistik.
R är en öppen källkod fri programmeringsspråk för statistisk databehandling, dataanalys och grafik. Forskning används av ett växande antal chefer och dataanalytiker inom företag och akademier. R har också hittat följare bland statistiker, ingenjörer och forskare utan datorprogrammeringsförmåga som tycker att det är lätt att använda. Dess popularitet beror på den ökande användningen av data mining för olika ändamål som att sätta reklampriser, hitta nya läkemedel snabbare eller fina ekonomiska modeller. R har ett brett utbud av paket för data mining.
Kursen täcker manipulationen av objekt i R inklusive läsdata, tillgång till R-paket, skriv R-funktioner och göra informativa diagram. Det inkluderar analys av data med hjälp av vanliga statistiska modeller. Kursen lär hur man använder R-programvaran (https://www.r-project.org) både på en kommandolinje och i ett grafiskt användargränssnitt (GUI).
Inledning och förberedelser
- Göra R mer användarvänligt, R och tillgängliga grafiska användargränssnitt
- R-miljön
- Relaterad programvara och dokumentation
- R och statistik
- Använda R interaktivt
- En introduktionssession
- Få hjälp med funktioner och egenskaper
- R-kommandon, skiftlägeskänslighet osv.
- Återkallning och korrigering av tidigare kommandon
- Köra kommandon från eller omdirigera utdata till en fil
- Databeständighet och borttagning av objekt
Enkla manipulationer; Tal och vektorer
- Vektorer och tilldelning
- Vektor aritmetik
- Generera regelbundna sekvenser
- Logiska vektorer
- Saknade värden
- Tecken vektorer
- Index vektorer; Markera och ändra delmängder av en datauppsättning
- Andra typer av objekt
Objekt, deras lägen och attribut
- Inneboende attribut: läge och längd
- Ändra längden på ett objekt
- Hämta och ställa in attribut
- Klassen för ett objekt
Sorterade och osorterade faktorer
- Ett konkret exempel
- Funktionen tapply() och ojämna arrayer
- Sorterade faktorer
Matriser och matriser
- Matriser
- Indexering av matriser. Underavsnitt av en matris
- Indexmatriser
- Funktionen array()
- Blandad vektor- och arrayaritmetik. Regeln om återvinning
- Den yttre produkten av två matriser
- Generaliserad transponering av en array
- Matrix Faciliteter
- Matrix multiplikation
- Linjära ekvationer och inversion
- Egenvärden och egenvektorer
- Singulära värdens uppdelning och determinanter
- Minsta kvadratpassning och QR-nedbrytning
- Bildar partitionerade matriser, cbind() och rbind()
- Sammanfogningsfunktionen, (), med matriser
- Frekvenstabeller från faktorer
Listor och dataramar
- Listor
- Skapa och ändra listor
- Sammanfoga listor
- Ramar för data
- Skapa dataramar
- attach() och detach()
- Arbeta med dataramar
- Bifoga godtyckliga listor
- Hantera sökvägen
Läsa data från filer
- Funktionen read.table()
- Funktionen scan()
- Accessing inbyggda datamängder
- Läsa in data från andra R-paket
- Redigera data
Sannolikhetsfördelningar
- R som en uppsättning statistiska tabeller
- Undersöka fördelningen av en uppsättning data
- En- och tvåprovstester
Gruppering, loopar och villkorlig exekvering
- Grupperade uttryck
- Kontrollsatser
- Villkorlig körning: if-satser
- Upprepad exekvering: för loopar, repeat och while
Skriva dina egna funktioner
- Enkla exempel
- Definiera nya binära operatorer
- Namngivna argument och standardvärden
- Operatorn "..." argument
- Uppdrag inom funktioner
- Mer avancerade exempel
- Effektivitetsfaktorer i blockkonstruktioner
- Ta bort alla namn i en utskriven matris
- Rekursiv numerisk integration
- Omfattning
- Anpassa miljön
- Klasser, generiska funktioner och objektorientering
Statistiska modeller i R
- Definition av statistiska modeller; Formler
- Kontraster
- Linjära modeller
- Generiska funktioner för att extrahera modellinformation
- Variansanalys och modelljämförelse
- ANOVA-tabeller
- Uppdatering av monterade modeller
- Generaliserade linjära modeller
- Familjer
- Funktionen glm()
- Icke-linjära minstakvadratmodeller och maximum likelihood-modeller
- Minsta kvadrat
- Maximal sannolikhet
- Vissa icke-standardiserade modeller
Grafiska procedurer
- Plottningskommandon på hög nivå
- Funktionen plot()
- Visa multivariata data
- Visa grafik
- Argument till plottningsfunktioner på hög nivå
- Plottningskommandon på låg nivå
- Mathematical anteckning
- Hershey vektor teckensnitt
- Interagera med grafik
- Använda grafikparametrar
- Permanenta ändringar: Funktionen par()
- Temporära ändringar: Argument till grafikfunktioner
- Lista över grafikparametrar
- Grafiska element
- Axlar och skalstreck
- Figur marginaler
- Miljö med flera figurer
- Drivrutiner
- PostScript-diagram för typsatta dokument
- Flera grafikenheter
- Dynamisk grafik
Paket
- Standard-paket
- Bidragna paket och CRAN
- Namnrymder
United Arab Emirates - Introduction to R
Saudi Arabia - Introduction to R
South Africa - Introduction to R
Czech Republic - Introduction to R
Magyarország - Introduction to R
Luxembourg - Introduction to R
New Zealand - Introduction to R
Philippines - Introduction to R
United Kingdom - Introduction to R
South Korea - Introduction to R