Kurs biostatistike – advanced
Centar za Istraživanja
Trenutno su otvorene prijave za:
R
Vreme je da se konačno susretnete sa R-om, koji je ne samo, kako ga stigma prati, tek još jedan programski jezik drag okorelim statističarima. On je moćno okruženje za statističku komputaciju i vizualizaciju, objedinjujući pri tom veliki broj mogućnosti koje dozvoljvaju izuzetno versatilnu funkcionalnost. R je takođe open source jezik, što znači da su svi specifični paketi za pojedine analize koje kontinuirano dodaju i doprinose članovi ove zaista brojne, raznovrsne i blagonaklone zajednice besplatni. I najčešće imaju svog ‘domara’, tj. osobu koja je odgovorna za paket, njegovo održavanje i Vaša eventualna pitanja.
Prednosti R okruženja su:
- Elegantno baratanje onim sto se kolokvijalno zove ‘big data’, dakle zaista ogromne kolicine podataka
- Kolekcija integrisanih alatki
- Izuzetne graficke mogucnosti
- Jednostavan i elegantan programski jezik
Zasto R? R je moćno, proširivo okruženje. Ima široki spektar sposobnosti iz domena statistike, analize podataka i vizualizacije. U njegovom okviru jednostavna je manipulacija, transformacija i skladištenje podataka. Jednostavno ga je instalirati na svakoj platformi (i besplatan je!)
Minimalno znanje R-a je neophodno za preostale module.
OK, a sta je RStudio? RStudio je takodje besplatan otvorenog koda integrisano razvojno okruženje (IDE). Zaista je dobra alternativa radu iz terminala. On ima grafički korisnicki interfejs, ne samo komandnu liniju. Odlična je alatka za učenje. Besplatan je za akademsku upotrebu. Agnostičan je što se tiče platforme. Opet, otvorenog koda.
Ako pak zelite zapanjujucu grafiku, informativnu i publikacionog kvaliteta, sve sto je potrebno je da prodrete u suptilnosti gramatike ggplot2 paketa, autora Hadley-a Wickham-a. Naročito je inovativno ovde imperativ razmišljanja u slojevima, tako da jako puno relacija postoji medju varijablama možete smestiti na jedan čitki grafik. I da, ono što ste možda već i sami zaključili, kada se susretnete sa novim podacima prvo Ih vizualizujte, makar to bio i obican scatterplot.
Shiny (i ShinyMobile) su paketi koji vasim analizama daju interaktivnost, prvi web, drugi mozete koristiti sa svog mobilnog telefona. Koristeci R, kreira se korisnicki interfejs i server, a Shiny komplajlira kod u HTML, CSS i JavaSkript neophodan za prikazivanje aplikacije na internetu. Ono sto cini Shiny aplikaciju toliko mocnom je cinjenica da moze da izvrsava kod na bekendu , tako da vasa aplikacija moze da izvede koju god R kalkulaciju koju mozete da izvedete na svom racunaru.
Preživljavanje
Mnoga klinička ispitivanja uključuju dugotrajno praćenje predefinisanog stanja pacijenata.
Dogadjaj od interesa koji ‘cekamo’ moze biti smrt (odakle naziv ove grupe analiza “analize prezivljavanja”), ali takodje moze biti i recidiv npr. leukemije, alkoholizma, i naravno brojni dogadjaji nevezani direktno za medicinu, kao sto je nasilje u porodici, saobracajne nesrece, neslaganje racuna u kasi, vreme do kog neko neodoljiv konacno okrene nas broj). Vazno je ovde reci da je podatak koji belezimo dvodimenzionalan: dakle vreme i ima li u toj konkretnoj vremenskoj tacci dogadjaja od interesa).
Vreme praćenja studije može da varira od nekoliko nedelja do mnogo godina.
Klinička ispitivanja se primerice mogu sprovoditi da bi se procenila efikasnost novih režima lečenja. Glavni događaji koje doživljavaju ispitanici su smrt, razvoj neželjene reakcije, povratak iz remisije i razvoj novog entiteta bolesti.[1] Medicinski članci koji se bave analizom preživljavanja često koriste Koksov model regresije proporcionalnih opasnosti. Ovi statistički modeli uzimaju u obzir vreme do pojave događaja od interesa i upoređuju kumulativnu verovatnoću događaja tokom vremena za dve ili više kohorti, dok prilagođavaju druge uticajne kovarijable.
Kurs: biostatistika advanced
R studio dozvoljava korisniku da koristi R u malo prijatnijem okruzenju, jer nismo svi bas svikli na komandnu liniju. Konkretnije ce pomoci da sto bezbolnije napravimo uvod u R, mocan opensource programerski alat sa veoma zivom zajednicom sa kojom se mogu deliti muke I nevolje.
Naucicemo bazicne operacije nad osnovnim tipovima podataka, proci najosnovnije algoritme programerske, uz pomoc ggplot2 kreirati zapanjujuce grafike, dotaci se i masinskog ucenja, narocito na polju obrade slike i sve to krunisati sopstvenom mobilnom aplikacijom (npr. brojac kalorijskog unosa, ili sta Vam je vec po volji, Shiny I ShinyMobile)
Curriculum:
- Uvod u R/R Studio, familijarizacija sa okruzenjem, manipulisanje fajlovima i podacima (https://hbctraining.github.io/Training-modules/IntroR/lessons/01_Intro-to-R.html)
- Vizualizacija (ggplot2); ucicemo osnove gramatike ggplot2, polaznici se ohrabruju da ponesu svoje data setove da bi smo ih zajedno analizirali.
(http://r-statistics.co/ggplot2-Tutorial-With-R.html)
*Shiny bazicna web aplikacija, ShinyMobile mobilna aplikacija
Cesto u medicini i lekara i njegovog pacijenta interesuje , hajdemo to reci bez uvijanja, koliko ce pacijent preziveti, obzirom na dijagnozu i njene nijanse. Zloglasna su oboljenja, npr. Mikrocelularni karcinom pluca ili karcinom glave pankreasa gde je indikovana tek palijativna nega, i jedno kratko vreme za oprost sa najblizima.
Cox regresija ima takodje nezaobilaznu primenu u longitudinalnim klinickim studijama, posebno kada postoji ozbiljna bojazan od nezeljenih efekata),buduci da jedina uzima u obzir na elegantan nacin cenzurisane observacije te izvlaci maksimum iz raspolozive informacije. Cox analiza takodje dozvoljava kovarijable, koje cak mogu I varirati u vremenu, pruzajuci istrazivacu potpuni konfor u modelovanju.
Ako nas interesuje pouzdanost testa (novog, u odnosu na stari), I tradicionalna ROC kriva moze biti prilagodjena podacima o prezivljavanju. Takodje, ne dajte da Vas zavara kolokvijalni termin “prezivljavanje”, tu u pitanju mogu biti vremena do bilo kog znacajnog dogadjaja, npr. vreme od unosa hrane sa glutenom u osetljive osobe do burne episode dijareje koja moze biti satima kasnije. Sve u svemu, pravilno primenjena, Cox regresija moze biti pouzdan alat svakom lekaru, u smislu podrske odlucivanju.
Ovde, kada smo kod podrske odlucivanju i narocito dijagnostici, ne mozemo dovoljno naglasiti imperativnost Bajesijanskog pristupa, iz koga npr. sledi da je verovatnoca da pacijent ima datu bolest, uprkos pozitivnom testu, jako u fukciji ucestalosti date bolesti u populaciji (kao I naravno senzitivnosti I specificnosti testa) Mozda nije visak reci da je u r-u moguce kombinovati Bajesijanski pristup I COX analizu , ukoliko na primer zelimo da ispitamo uticaj pojednih specificnih alela SNP-ova (single nucleotide polymorphism) na neke kompleksne fenotipe (Ajlchajmer, brzina procesiraja informacija).
Curriculum:
* Funkcija prezivljavanja/tabela zivota
* Kaplan-Majerova analiza
*Koks regresioni model
*Weibull-ov parametrijski model
*Bajesijanska analiza prezivljavanja
Cene kurseva se formiraju na osnovu toga da li su kursevi namenjeni za pravna ili fizicka lica, za grupu ili individualno, offline ili online, u vasim ili nasim prostorijama. Molimo Vas, da nas kontaktirate za ponudu.
Trenutno su otvorene prijave za:
“Ove fotografije su preuzete sa platforme Unsplash i koriste se u skladu sa uslovima korišćenja Unsplash-a. Autori ovih fotografija nisu navedeni pojedinačno, ali sve fotografije su dostupne na Unsplash-u i možete ih pronaći putem pretrage na njihovoj platformi.”
Često postavljena pitanja u vezi kursa
Ovde možete pronaći odgovore na često postavljena pitanja u vezi kursa “Statistička analiza podataka u SPSS-u“.
Kurs „Uvod u statistiku u R “ se održava u prostorijama Centra za istraživanja odnosno Centra za ljudske resurse sem ako nije drugačije naglašeno. Svakako ćete pre početka kursa dobiti detalje o lokaciji.
Da. Centar za istraživanja ne obezbeđuje instalacioni paket za R. R program je besplatan, možete ga preuzeti besplatno.
Da, nakon kursa ćete dobiti sertifika o pohađanju kursa „ Biostatistika Advanced kurs“ sa brojem sati koje ste pohađali.
Ako pohađate individualni kurs „Uvod u statistiku u R “ možete da koristite Vaše podatke. Ako pohađate grupni kurs, podatke za kurs će obezbediti predavač.
Da, imate pravo na besplatne konsultacije mesec dana nakon kursa u trajanju od 45 minuta.
Da, materijal za kurs „Uvod u statistiku u R “ dobijate u štampanom obliku, ukoliko kurs pohađate uživo.
Da, na kraju kursa se radi procena stečenog znanja kroz samostalno rešavanje zadataka.
Da, dobro bi bilo da ponesete sopstveni laptop. Ako to nije moguće, Centar za ljudske resurse odnosno njegova izdvojena jedinica Centar za istraživanja će Vam obezbediti laptop koji ćete koristiti tokom kursa.
Da, broj polaznika je ograničen na 10.
Nakon slanja prijave na naš kurs, dobićete formu koju je potrebno da popunite i da nam je prosledite nazad radi definisanja cene kursa. Cena zavisi od Vašeg predznanja, modula koje želite da pohađate i cilja koji želite da postignete na kursu. Nakon popunjavanja forme ili razgovora sa našim zaposlenima putem emaila ćete dobiti ponudu. Okvirna cena kursa ''Statistička analiza podataka u SPSS-u'' iznosi 126.000 dinara
Da, definisana cena kursa ostaje ista nezavisno od lokacije.
Da, cena individualnog kursa se razlikuje za fizička i pravna lica. U zavisnosti od profesije, predznanja i željenog cilja, formira se i različita cena.
Naravno. Ukoliko pohađate individualni online kurs ili u našim prostorijama, postoji mogućnost dogovora oko satnice i dana održavanja kursa.
Kurs "Uvod u statistiku u R " traje h.
Statistička analiza daje smisao besmislenim brojevima
Nema sumnje da se poslovanje, obrazovanje i sva naučna područja dosta oslanjaju na računare. Ta je zavisnost postala toliko velika da više nije moguće razumeti društvena i naučna istraživanja bez znanja iz statistike i bez bar određenog poznavanja nekog statističkog softvera.
Broj i vrsta statističkih softverskih paketa koji su dostupni rastu svake godine. SPSS je veoma popularan u akademskim i poslovnim krugovima, što ga čini najčešće korišćenim paketom ovog tipa. SPSS softver koristi se za analizu podataka i kao kompletan statistički paket koji se zasniva na interfejsu „point and click“. Ovaj softver istraživači koriste za analizu podataka od njegovog razvoja šezdesetih godina od strane Normana H. Nie-a, u saradnji sa C. Hadlai Hull-om i Dale Bent-om, do danas.
SPSS (Statistički paket za društvene nauke) je skup softverskih programa kombinovanih zajedno u jednom paketu.
Osnovna primena ovog programa je analiza naučnih podataka u društvenim naukama. Ovi podaci se mogu koristiti za istraživanje tržišta, data mining, itd. Na primer, pomoću dobijenih statističkih informacija, istraživači mogu lako razumeti potražnju proizvoda na tržištu i u skladu s tim mogu promeniti i uskladiti svoju strategiju. SPSS prvo skladišti i organizuje priložene podatke, zatim sastavlja skup podataka da bi se proizveo odgovarajući rezultat.
Rad sa podacima je složen i dugotrajan proces, ali pomoću ovog softvera se lako rukuje i upravlja podacima uz pomoć različitih tehnika. Ove tehnike se koriste za analizu, transformisanje i dobijanje karakterističnog obrasca između različitih podataka i promenljivih. Pored toga, rezultati podatka se mogu i grafički prikazati, tako da korisnik može lako da razume rezultat. Statističke tehnike poput krostabulacija, t-testa, Hi-kvadrat testa, itd. dostupne su u meniju „analiza“.
SPSS je posebno koristan za studente i istraživače u oblasti psihologije, sociologije, psihijatrije i drugih nauka o ponašanju, jer sadrži širok spektar univarijantnih i multivarijantnih postupaka koji se koriste u ovim disciplinama.
Transformacija podataka
Transformacija podataka je jedan od najkorisnijih alata u SPSS-u, a koristi se za pretvaranje tipa podataka (npr. kvantitativne varijable pretvaramo u kategorijske. U okviru ankete smo prikupili podatke o godinama ispitanika (18, 25, 29, 30, 31, …), ali za poređenje određenih starosnih grupa potrebno je da ovako dobijene podatke transformišemo u grupe (18-25, 25-30, 30-35, …)). Nakon promene tipa podataka, SPSS integriše istu vrstu podataka na jednom mestu i lako ih je koristiti.
Takođe postoji opcija pod nazivom „split file“ koja je data u meniju „data“. Ova opcija je veoma korisna za istraživače koji izvode komparativne studije. Pretpostavimo da istraživači žele da znaju stopu nezaposlenosti tri regiona. U ovom slučaju, opcija za podeljenu datoteku (“split file”) pomoći će im da dobiju rezultate za tri regiona odvojeno, tako da mogu da protumače i uporede stopu nezaposlenosti iz tri regiona.
SPSS softver ima opciju koja se zove “nedostajuće vrednosti” (“missing values”), a ona pomaže u donošenju boljih odluka o podacima. Ova tehnika omogućava korisniku da popuni nedostajuće praznine kako bi stvorio bolje modele za procenu podataka. Opcija pruža korisniku procedure za upravljanje i pripremu podataka. SPSS uključuje neke sofisticirane inferencijalne i multivarijantne statističke postupke kao što su faktorska analiza, analiza varijanse, itd.
SPSS softversko rešenje nudi napredne alate za statističku analizu podataka, veliku biblioteku algoritama mašinskog učenja, analize teksta, proširivost otvorenog koda, integraciju sa velikim podacima, itd.
Jednostavnost upotrebe i fleksibilnost čine SPSS dostupnim korisnicima svih nivoa veština. Štaviše, pogodan je za projekte svih veličina i nivoa složenosti, a može pomoći u pronalaženju novih mogućnosti, poboljšanju efikasnost i minimiziranju rizika.
Analiza podataka
Analiza podataka je proces čišćenja, transformacije i modeliranja podataka radi otkrivanja korisnih informacija za donošenje prvenstveno poslovnih odluka. Svrha analize podataka je izvlačenje korisnih informacija iz podataka i donošenje odluke na osnovu te analize.
Kada donosimo bilo kakvu odluku u svakodnevnom životu prvenstveno razmišljamo o onome što se dogodilo prošli put ili šta će se desiti ako donesemo tu konkretnu odluku. Ovo nije ništa drugo nego analiza naše prošlosti ili budućnosti i donošenje odluka na osnovu nje. Zbog toga sakupljamo uspomene na našu prošlost ili snove o našoj budućnosti. Dakle, to nije ništa drugo nego analiza podataka. Isti proces sprovodi i analitičar u poslovne svrhe i naziva ga analiza podataka.
Da biste razvili posao ili da biste poboljšali Vaš život, ponekad je sve što trebate da uradite – da analizirate.
Ako Vaše preduzeće ne raste, onda se morate osvrnuti i priznati svoje greške i ponovo napraviti plan bez ponavljanja tih grešaka. Čak i ako Vaše preduzeće raste, onda morate naći način da posao više raste. Sve što treba da uradite je da analizirate poslovne podatke i poslovne procese. U tome Vam mogu moći različiti alati za analizu i obradu podataka, a jedan od njih je i SPSS. Alati za analizu podataka korisnicima olakšavaju obradu i manipulaciju podacima, analiziraju odnose i korelacije između skupova podataka, a takođe pomažu u prepoznavanju obrazaca i trendova za interpretaciju.
Statistička analiza pokazuje “Šta se dešava?” koristeći prošle podatke, a uključuje prikupljanje, analizu, interpretaciju, predstavljanje i modeliranje podataka. Analizira skup podataka ili uzorak podataka. Postoje dve kategorije statističke analize:
- Deskriptivna analiza i
- Inferencijalna analiza.
Deskriptivna analiza analizira kompletne podatke ili uzorak sažetih numeričkih podataka. Prikazuje srednju vrednost i odstupanje za kvantitativne podatke, a procenat i frekvencije za kategorijske podatke.
Inferencijalna analiza analizira uzorak iz kompletnih podataka. U ovoj vrsti analize možete pronaći različite zaključke iz istih podataka odabirom različitih uzoraka.
Proces analize podataka je prikupljanje informacija pomoću odgovarajuće aplikacije ili alata koji vam omogućava da istražite podatke i pronađete obrazac u njima. Na osnovu toga možete donositi odluke ili možete donositi konačne zaključke.
Analiza podataka sastoji se od sledećih faza:
- Svrha prikupljanja podataka
- Prikupljanje podataka
- Čišćenje podataka
- Analiza podataka
- Interpretacija
- Vizualizacija podataka
Svrha prikupljanja podataka
Pre svega, mora da razmislite zašto želite da uradite određenu analizu podataka?
Mora da odlučite koju vrstu analize podataka želite da uradite. U ovoj fazi mora da odlučite šta ćete analizirati i kako ćete to izmeriti, mora da razumete zašto istražujete i koje mere mora da koristit da biste sproveli određenu analizu.
Prikupljanje podataka
Nakon utvrđivanja svrhe prikupljanja podataka, dobićete jasnu predstavu o tome šta treba da merite i šta treba da bude Vaš rezultat. Tada je vreme za prikupljanje podataka. Jednom kada prikupite podatke, ne zaboravite da prikupljeni podaci moraju biti obrađeni ili organizovani za analizu.
Dok prikupljate podatke iz različitih izvora, mora da vodite evidenciju sa datumom prikupljanja i izvorom podataka, jer će to biti neophodno za prikazivanje rezultata istraživanja.
Čišćenje podataka
Bez obzira na to koji podaci su prikupljeni i da li su irelevantni za cilj analize, treba da se očiste (data cleaning). Podaci koji se prikupljaju mogu da sadrže duplikate, praznine ili greške.
Pre analize podaci mora da se očiste i da budu bez grešaka, jer će na osnovu čišćenja podataka rezultat analize biti bliži očekivanom ishodu i validniji.
Analiza podataka
Jednom kada se podaci prikupe, očiste i obrade, spremni su za analizu. Dok manipulišete podacima, možda ćete pronaći tačne informacije koje su vam potrebne, ali ponekad ćete možda morati da prikupite više podataka. Tokom ove faze možete koristiti alate i softver za analizu podataka koji će vam pomoći da razumete, tumačite i izvlačite zaključke.
Interpretacija
Nakon analize podataka, konačno je vreme da protumačite dobijene rezultate. Možete da odaberete način interpretacije podataka: reči, tabele, ili grafici. Zatim koristite rezultate analize podataka da biste doneli najbolje odluke i preporuke.
Vizuelizacija podataka
Vizuelizacija podataka je vrlo česta u svakodnevnom životu; često se pojavljuju u obliku grafikona. Drugim rečima, podaci su prikazani grafički tako da ljudski mozak lakše razume i obradi podatke.
Vizuelizacija podataka često se koristi za otkrivanje nepoznatih činjenica i trendova. Posmatrajući odnose i upoređujući skupove podataka, možete pronaći način da dobijete smislene informacije.
Izvori:
- https://medium.com/@johnnoels/what-is-spss-and-its-importance-in-research-data-analysis-5f109ab90da1
- https://www.statisticssolutions.com/spss-statistics-help/
- http://www.fao.org/tempref/AG/Reserved/PPLPF/ftpOUT/Gianluca/stats/Statistics%20-%20A%20Handbook%20of%20Statistical%20Analyses%20using%20SPSS%20-%20Excellent%20!!!.pdf
- https://www.ibm.com/in-en/analytics/spss-statistics-software
- https://www.guru99.com/what-is-data-analysis.html
- https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3227332/