ITF301416 Store datamengder: prosessering og analyse (Høst 2016)
Fakta om emnet
- Studiepoeng:
- 10
- Ansvarlig avdeling:
- Avdeling for informasjonsteknologi
- Studiested:
- Halden
- Emneansvarlig:
- Edgar Bostrøm
- Undervisningsspråk:
- Se pkt. Organisering og læringsformer
- Varighet:
- ½ år
Emnet er tilknyttet følgende studieprogram
Obligatorisk emne for
- bachelorstudiet i informatikk - design og utvikling av IT - systemer (kull 2014)
- bachelorstudiet i informasjonssystemer: IT-ledelse (kull 2014)
- bachelorstudiet i informasjonssystemer: Webutvikling (kull 2014)
Valgfritt emne for øvrige.
Forkunnskapskrav utover opptakskrav
Emnet bygger på kunnskaper tilsvarende emnene "Databaser" og "Innføring i programmering".
Studentens læringsutbytte etter bestått emne
KUNNSKAP:
Studenten har
- dypere kunnskap om relasjonsmodellen, relasjonsdatabasesystemer, samt alternativer til relasjonsdatabaser
- kunnskap om hvorledes store datamengder behandles effektivt på relasjonell form
- kunnskap om datavarehus/business intelligence og "Big Data"
- kunnskap om hvordan man kan finne mønster i store datamengder, og hvordan dette kan brukes f.eks. i forretningsstrategi, markedsføring, i samfunnsvitenskap, naturvitenskap og andre fagområder
FERDIGHETER:
Studenten kan
- behandle store datamengder, strukturert på ulike måter og på ulike plattformer (LAN, WAN, skyen)
- sette opp og drifte et databasesystem
- lage utsagn i relasjonsalgebra og se sammenhengen mellom dette og optimalisering
- lage enkle lagrede prosedyrer og triggere
- designe et datavarehus
- analysere store datamengder ved ulike teknikker
- jobbe med ulike databasesystemer
GENERELL KOMPETANSE:
Studenten
- har god kunnskap om hvorledes store datamengder kan struktureres, prosesseres, analyseres og presenteres, på ulike plattformer
- har mer kompetanse i å søke etter kunnskap i og kunne sette seg inn i nye IT-systemer
Innhold
Relasjonsdatabaser og store datamengder:
Relasjonsalgebra og spørreoptimalisering, andre former for optimalisering, distribuerte databaser og replikering, triggere og lagrede prosedyrer. Ulike former for tilkobling mellom klient og tjener. Alternativer til relasjonsdatabaser.
Datavarehus / business intelligens:
Ulike måter å bygge opp et datavarehus på, transformasjonsprosessen, datagruvedrift.
"Big data":
Massive datamengder, fangst, lagring, prosessering, visualisering. Juridiske og etiske aspekter ved big data.
Undervisnings- og læringsformer
Emnet vil i stor grad bygge på en kombinasjon av forelesninger og prosjektarbeid. Enkelte temaer som inngår i prosjektene vil ikke bli forelest, men er opp til studentene å sette seg inn i på egenhånd.
Dersom studenter fra internasjonale samarbeidspartnere deltar i undervisningen, vil den bli gjennomført på engelsk.
Arbeidsomfang
4 timer forelesning + øvinger per uke.
Arbeidskrav - vilkår for å avlegge eksamen
Innlevering av 4 prosjektoppgaver (individuelle og i gruppe).
Arbeidskrav må være godkjent før studenten kan fremstille seg til eksamen.
Eksamen
Skriftlig eksamen
4 timers individuell skriftlig eksamen. Ingen tillatte hjelpemidler.
Det benyttes karakterskala A-F.
Evaluering av emnet
Dette emnet evalueres på følgende måte:
- Midtsemesterevaluering (frivillig)
- Sluttevaluering (obligatorisk)
Den emneansvarlige lager en emnerapport på bakgrunn av studentenes tilbakemeldinger og sine egne erfaringer med emnet. Emnerapporten behandles av studiekvalitetsutvalget ved avdeling for informasjonsteknologi.
Litteratur
Litteraturlisten er sist oppdatert 16. juni 2016
Thomas M. Connolly and Carolyn E. Begg. Database Systems: A Practical Approach to Design, Implementation and Management - 6th Edition.
«Booz Allen Field Guide to Data Science»,
https://www.boozallen.com/content/dam/boozallen/documents/2015/12/2015-FIeld-Guide-To-Data-Science.pdf
Utdelt materiale og nettressurser - legges ut på Fronter.