ITF301416 Store datamengder: prosessering og analyse (Høst 2018)

Fakta om emnet

Studiepoeng:
10
Ansvarlig avdeling:
Avdeling for informasjonsteknologi
Studiested:
Halden
Emneansvarlige:
  • Cathrine Linnes
  • Edgar Bostrøm
Undervisningsspråk:
Se pkt. Undervisnings- og læringsformer
Varighet:
½ år

Emnet er tilknyttet følgende studieprogram

Obligatorisk emne for

  • bachelorstudiet i informasjonssystemer
  • bachelorstudiet i informatikk: design og utvikling av IT-systemer

Valgfritt emne for øvrige.

Anbefalte forkunnskaper

Kunnskaper tilsvarende emnene Databaser og Innføring i programmering.

Undervisningssemester

5. semester (høst).

Studentens læringsutbytte etter bestått emne

KUNNSKAP:
 
Studenten har

  • dypere kunnskap om relasjonsmodellen, relasjonsdatabasesystemer, samt alternativer til relasjonsdatabaser
  • kunnskap om hvorledes store datamengder behandles effektivt på relasjonell form
  • kunnskap om datavarehus/business intelligence og "Big Data"
  • kunnskap om hvordan man kan finne mønster i store datamengder, og hvordan dette kan brukes f.eks. i forretningsstrategi, markedsføring, i samfunnsvitenskap, naturvitenskap og andre fagområder


FERDIGHETER: 
 
Studenten kan

  • behandle store datamengder, strukturert på ulike måter og på ulike plattformer (LAN, WAN, skyen)
  • lage utsagn i relasjonsalgebra og se sammenhengen mellom dette og optimalisering
  • lage enkle lagrede prosedyrer og triggere
  • designe et datavarehus
  • analysere store datamengder ved ulike teknikker
  • jobbe med ulike databasesystemer

GENERELL KOMPETANSE:
 
Studenten

  • har god kunnskap om hvorledes store datamengder kan struktureres, prosesseres, analyseres og presenteres, på ulike plattformer
  • har mer kompetanse i å søke etter kunnskap i og kunne sette seg inn i nye IT-systemer

Innhold

Relasjonsdatabaser og store datamengder:
Relasjonsalgebra og spørreoptimalisering, andre former for optimalisering, distribuerte databaser og replikering, triggere og lagrede prosedyrer. Alternativer til relasjonsdatabaser.

Datavarehus / business intelligens:
Ulike måter å bygge opp et datavarehus på, transformasjonsprosessen, datagruvedrift. 

"Big data":
Massive datamengder, fangst, lagring, prosessering, visualisering. Juridiske og etiske aspekter ved big data.

Undervisnings- og læringsformer

Emnet vil i stor grad bygge på en kombinasjon av forelesninger og prosjektarbeid. Enkelte temaer som inngår i prosjektene vil ikke bli forelest, men er opp til studentene å sette seg inn i på egenhånd.

Dersom studenter fra internasjonale samarbeidspartnere deltar i undervisningen, vil den bli gjennomført på engelsk.

Arbeidsomfang

Ca 240 timer.

4 timer forelesning + øvinger per uke.

Arbeidskrav - vilkår for å avlegge eksamen

Innlevering av 4 prosjektoppgaver (individuelle og i gruppe).

Arbeidskrav må være godkjent før studenten kan fremstille seg til eksamen.

Eksamen

Skriftlig eksamen

4 timers individuell skriftlig eksamen. Ingen tillatte hjelpemidler.

Det benyttes karakterskala A-F.

Sensorordning

Emneansvarlig sensurerer sammen med ekstern eller intern sensor.

Evaluering av emnet

Dette emnet evalueres på følgende måte:

  • Midtsemesterevaluering (obligatorisk)

Den emneansvarlige lager en oppsummering på bakgrunn av studentenes tilbakemeldinger og sine egne erfaringer med emnet. Oppsummeringen behandles av studiekvalitetsutvalget ved avdeling for informasjonsteknologi.

Litteratur

Litteraturlisten er sist oppdatert 8. februar 2018.

Thomas M. Connolly and Carolyn E. Begg. Database Systems: A Practical Approach to Design, Implementation and Management - 6th Edition, 2015.

Nyttig bakgrunnslitteratur:

«Booz Allen Field Guide to Data Science»,
https://www.boozallen.com/content/dam/boozallen/documents/2015/12/2015-FIeld-Guide-To-Data-Science.pdf

Utdelt materiale og nettressurser - legges ut på høgskolen læringsplattform.

Sist hentet fra Felles Studentsystem (FS) 17. juli 2024 02:44:19