ITF301416 Store datamengder: prosessering og analyse (Høst 2016)

Fakta om emnet

Studiepoeng:
10
Ansvarlig avdeling:
Avdeling for informasjonsteknologi
Studiested:
Halden
Emneansvarlig:
Edgar Bostrøm
Undervisningsspråk:
Se pkt. Organisering og læringsformer
Varighet:
½ år

Emnet er tilknyttet følgende studieprogram

Obligatorisk emne for

  • bachelorstudiet i informatikk - design og utvikling av IT - systemer (kull 2014)
  • bachelorstudiet i informasjonssystemer: IT-ledelse (kull 2014)
  • bachelorstudiet i informasjonssystemer: Webutvikling (kull 2014)

Valgfritt emne for øvrige.

Forkunnskapskrav utover opptakskrav

Emnet bygger på kunnskaper tilsvarende emnene "Databaser" og "Innføring i programmering".

Studentens læringsutbytte etter bestått emne

KUNNSKAP:
 
Studenten har

  • dypere kunnskap om relasjonsmodellen, relasjonsdatabasesystemer, samt alternativer til relasjonsdatabaser
  • kunnskap om hvorledes store datamengder behandles effektivt på relasjonell form
  • kunnskap om datavarehus/business intelligence og "Big Data"
  • kunnskap om hvordan man kan finne mønster i store datamengder, og hvordan dette kan brukes f.eks. i forretningsstrategi, markedsføring, i samfunnsvitenskap, naturvitenskap og andre fagområder


FERDIGHETER: 
 
Studenten kan

  • behandle store datamengder, strukturert på ulike måter og på ulike plattformer (LAN, WAN, skyen)
  • sette opp og drifte et databasesystem
  • lage utsagn i relasjonsalgebra og se sammenhengen mellom dette og optimalisering
  • lage enkle lagrede prosedyrer og triggere
  • designe et datavarehus
  • analysere store datamengder ved ulike teknikker
  • jobbe med ulike databasesystemer

GENERELL KOMPETANSE:
 
Studenten

  • har god kunnskap om hvorledes store datamengder kan struktureres, prosesseres, analyseres og presenteres, på ulike plattformer
  • har mer kompetanse i å søke etter kunnskap i og kunne sette seg inn i nye IT-systemer

Innhold

Relasjonsdatabaser og store datamengder:
Relasjonsalgebra og spørreoptimalisering, andre former for optimalisering, distribuerte databaser og replikering, triggere og lagrede prosedyrer. Ulike former for tilkobling mellom klient og tjener. Alternativer til relasjonsdatabaser.

Datavarehus / business intelligens:
Ulike måter å bygge opp et datavarehus på, transformasjonsprosessen, datagruvedrift. 

"Big data":
Massive datamengder, fangst, lagring, prosessering, visualisering. Juridiske og etiske aspekter ved big data.

Undervisnings- og læringsformer

Emnet vil i stor grad bygge på en kombinasjon av forelesninger og prosjektarbeid. Enkelte temaer som inngår i prosjektene vil ikke bli forelest, men er opp til studentene å sette seg inn i på egenhånd.

Dersom studenter fra internasjonale samarbeidspartnere deltar i undervisningen, vil den bli gjennomført på engelsk.

Arbeidsomfang

4 timer forelesning + øvinger per uke.

Arbeidskrav - vilkår for å avlegge eksamen

Innlevering av 4 prosjektoppgaver (individuelle og i gruppe).

Arbeidskrav må være godkjent før studenten kan fremstille seg til eksamen.

Eksamen

Skriftlig eksamen

4 timers individuell skriftlig eksamen. Ingen tillatte hjelpemidler.

Det benyttes karakterskala A-F.

Evaluering av emnet

Dette emnet evalueres på følgende måte:

  • Midtsemesterevaluering (frivillig)
  • Sluttevaluering (obligatorisk)

Den emneansvarlige lager en emnerapport på bakgrunn av studentenes tilbakemeldinger og sine egne erfaringer med emnet. Emnerapporten behandles av studiekvalitetsutvalget ved avdeling for informasjonsteknologi.

Litteratur

Litteraturlisten er sist oppdatert 16. juni 2016

Thomas M. Connolly and Carolyn E. Begg. Database Systems: A Practical Approach to Design, Implementation and Management - 6th Edition.

«Booz Allen Field Guide to Data Science»,
https://www.boozallen.com/content/dam/boozallen/documents/2015/12/2015-FIeld-Guide-To-Data-Science.pdf

Utdelt materiale og nettressurser - legges ut på Fronter.

Sist hentet fra Felles Studentsystem (FS) 18. juli 2024 02:45:15