Veileder for teksting av video i høyere utdanning
3. Hvordan vurdere og prioritere på egen institusjon
For å gjøre prioriteringer med teksting av video som treffer behovene på egen institusjon, er det nødvendig å kartlegge status lokalt.
Det vil være variasjoner i formål, grad av omfang og bruk av video, samt tilgang på teknologi mellom institusjonene. Disse faktorene påvirker prioriteringer for teksting av ulike typer av video.
3.1 Formål og typer av video
Video blir brukt til mange ulike formål. Formålet viser til hensikten med videoen eller hva videoen skal brukes til.
Noen hovedtyper av video er:
- opptak fra forelesninger
- opptak av strømmet innhold, som for eksempel webinarer og konferanser
- undervisningsvideo til pedagogisk bruk i undervisning, eller som oppsummering av innhold i et fag eller emne
- video som er en del av vurdering eller eksamen
- informasjonsvideoer brukt i markedsføring, på arrangement eller i forbindelse med rekruttering
Et vesentlig skille er mellom innhold hvor formålet er produksjon av video, og innhold hvor video er opptak av et annet format.
- En videoproduksjon er video som aldri er noe annet enn en video. For disse videoene foreligger det gjerne et manus i forkant, som det er mulig å bruke som utgangspunkt for teksting. Slike videoer trenger ikke bare være produsert i studio, men kan også være spilt inn for eksempel av foreleser på egen datamaskin.
- Video som er et opptak, er for eksempel et automatisert forelesningsopptak eller publisert opptak av et seminar. Disse videoene er opptak av innhold som i utgangspunktet ble presentert i et annet format.
HK-dir anbefaler institusjonene å prioritere teksting av videoproduksjoner foran teksting av opptak.
Formål - Aktivitet for institusjonen
- Er formålet med video produksjon eller opptak?
- Hvilke videotyper finnes?
- Hvilke videotyper forekommer mest på institusjonen?
3.2 Omfang
Omfanget av videoer som blir produsert og tatt opp ved universiteter og høyskoler er generelt stort og stadig økende. Erfaringer fra Universitetet i Oslo viser at de publiserer flere tusen timer med forelesningsopptak hvert år. Fra høsten 2020 til november 2023 produserte UiO i overkant 47 000 timer opptak av forelesninger.
Omfanget av video omfatter
- andelen videoer som blir publisert på institusjonen
- mengden innenfor de ulike videotypene
- antallet potensielle seere
- hvor lenge video skal være publisert
- hvorvidt video gjenbrukes
HK-dir mener at det i dag ikke er god nok teknologi og tilstrekkelig med ressurser til å tekste det totale omfanget av video i høyere utdanning. Dette gjelder særlig det store omfanget av automatiserte forelesningsopptak som produseres i sektoren.
Institusjonene må selv vurdere om omfanget av ulike typer av video er så stort at det blir uforholdsmessig å tekste. Vær oppmerksom på at denne vurderingen må sees i sammenheng med formålet med video, den faktiske bruken og tilgang på teknologi.
Omfang - Aktivitet for institusjonen
Vurder omfanget av ulike typer av video
- Er det noen videotyper der omfanget er spesielt stort?
- Hvor mange er i målgruppen for video?
3.3 Bruk
Bruk av videoene er en vesentlig vurdering når man skal prioritere teksting av video. Dette handler om videoene faktisk blir sett, eller gjenbrukt i flere sammenhenger eller over flere år.
Der omfang handler om antallet videoer og den potensielle størrelsen på publikumet, handler bruk om den faktiske størrelsen på publikumet og om video blir sett.
Erfaringer fra sektoren viser at videoens varighet og fagområde har betydning.
- Eksempelvis er det usikkert i hvilken grad lange videoer, slik som forelesningsopptak, faktisk blir brukt av studentene. Det er større sjanse for at studentene ser korte videoer, enn at de ser lange videoer.
- Funn fra BI (PDF) viser at studenter typisk enten ser så godt som hele, eller så godt som ingenting av en video, og at denne enten-eller-responsen i stor grad ser ut til å betinges av videoens lengde. Jo kortere video, desto høyere andel av studentene klikker seg inn på videoen, begynner å se på den, fullfører hele og motsatt.
- Det kan også være store forskjeller ut fra det faglige innholdet i videoen. Erfaringer fra Læringsstøttesenteret ved NTNU viser at videoopptak fra forelesninger i realfag og tekniske fag kan bli mer sett enn andre fagretninger.
Bruk kan også bli påvirket av tema, om videoen inngår i en obligatorisk læringsaktivitet, eller om videoen har til formål å gi en oppsummering av innholdet i et emne. Formidlingsevne og pedagogisk innhold kan også påvirke bruken av video.
HK-dir anbefaler at institusjonen undersøker bruken av video. Dette er viktig for å kunne prioritere hvilke videoer som skal tekstes og hvilken kvalitet tekstingen skal ha.
Bruk - Aktivitet for institusjonen
- Blir videoer sett, og er det noen videotyper som skiller seg ut, for eksempel med tanke på lengde på video eller type fagområde?
- Trekk ut statistikk og prioriter manuell teksting på de videoene som har et stort publikum.
3.4 Teknologi og innhold
Teknologi og verktøy lærestedet har, påvirker prioriteringen av teksting av video. Med slike verktøy må man uansett forvente en viss grad av manuell bearbeiding av tekstingen og opplasting til videoløsning.
Stadig forbedring av teknologi for automatisk teksting, fører til at det sannsynligvis blir mindre behov for manuell bearbeiding. Verktøy med kunstig intelligens (KI) er med på å flytte grensene for hva som lett lar seg tekste automatisk.
Det finnes flere verktøy for automatisk teksting som er utbredt i sektoren i dag:
- Panopto, som er en felles videotjeneste fra Sikt (Kunnskapssektorens tjenesteleverandør), har mulighet for automatisert teksting og manuell feilretting.
- Universitetet i Oslo har utviklet og tilbyr løsningen Autotekst, som bruker forbedret talegjenkjenning med kunstig intelligens. Autotekst kan også integreres med Panopto.
- Språkbanken og Nasjonalbiblioteket målte kvaliteten på løsninger for norsk talegjengjenning (PDF) høsten 2023. Testingen viser at de beste systemene fungerer godt på bokmål og nynorsk og at Nasjonalbibliotekets løsning, NB Whisper, produserer de beste transkripsjonene.
Når innholdet er på engelsk, fungerer automatisk teksting veldig godt og trenger sjelden manuell bearbeiding.
HK-dir erfarer likevel at automatisk teksting alene kan være utilstrekkelig og unøyaktig med dagens teknologi, særlig i forbindelse med:
- Komplekst innhold: Hvis videoen inneholder komplekse elementer, som avanserte matematiske formler, tekniske beregninger og spesielle faguttrykk, kan det være utfordrende å få tekstet korrekt ved bruk av automatisk teksting, fordi stemmegjenkjenningen ikke oppfatter hva som blir sagt eller gjengir innholdet feil.
- Dårlig lydkvalitet: Dersom videoen har dårlig lyd er det nødvendig å tekste for at seere skal få med seg innholdet. Også her kan det være vanskelig for stemmegjenkjenningen å oppfatte hva som blir sagt og gjengi innholdet riktig.
Automatisk teksting er i all hovedsak et godt og tidsbesparende verktøy. For å sikre rett kvalitet og nøyaktighet på tekstingen, kan det være nødvendig med ulike grader av manuell bearbeiding av teksten.
Teknologi - Aktivitet for institusjonen
- Hvilke verktøy har institusjonen tilgjengelig for teksting av video?
- Test automatisk teksting og ta stikkprøver for å vurdere om automatisk teksting er tilstrekkelig, eller om tekstingen må bearbeides manuelt.
3.5 Kvalitet på tekstingen
Hensikten med å tekste video er å gjøre utilgjengelig innhold tilgjengelig, det vil si å gå fra 0 prosent til "godt nok". Det er ikke et mål i seg selv å ta noe som er godt nok og gjøre det perfekt.
Hva som er god nok kvalitet på tekstingen kommer an på innholdet i videoen og hvilken sammenheng videoen er brukt.
- I mange tilfeller kan tekstingen være god nok, selv om det finnes noen unøyaktigheter. For eksempel kan grammatiske feil være irriterende, men ikke av avgjørende betydning for å forstå hovedinnholdet.
- I andre tilfeller kan teksting som er 95 prosent korrekt være problematisk, hvis 5 prosent av feilene gjelder vesentlige fagbegrep.
Ved hjelp av faktorene formål, omfang, bruk og teknologi, kan institusjonen gjøre en vurdering av hva som er god nok kvalitet på tekstingen for ulike typer av video.
Vi har definert fire nivå for tilnærming til teksting av video.
Nivåene gir ulik kvalitet på tekstingen. Høyere nivå på tekstingen er mer ressurskrevende, men gir også bedre kvalitet.
Et tekstalternativ er en tekst som gjengir lydinnholdet i videoen, og er en måte å oppfylle kravet på.
- Det trenger ikke å være en eksakt gjengivelse av lydinnholdet, men vesentlig innhold skal presenteres i rett rekkefølge.
- Det kan for eksempel være en lenke til et referat eller en presentasjon med notater.
- Kun notater i stikkordsform er ofte ikke nok for å kunne formidle samme innhold.
Hvis videoen allerede har et utfyllende tekstalternativ, trenger den ikke teksting i tillegg.
Tekstalternativet kan ligge på samme nettside som videoen, eller via en lenke til en annen side. Tekstalternativet skal være lett for brukeren å finne.
Det er mulig å bruke verktøy for å tekste video automatisk, uten å bearbeide tekstingen manuelt før den blir lagt ut.
Ubearbeidet automatisk teksting kan føre til at det finnes feil og unøyaktigheter i tekstingen, på grunn av dårlig lydkvalitet, komplekst innhold og språk.
Lett bearbeidet automatisk teksting bruker verktøy for talegjenkjenning for å tekste video, med begrenset grad av manuell bearbeiding av tekstingen for å rette opp større feil.
Bearbeidingen kan rette opp i for eksempel være feilstavinger, feil i sentrale faguttrykk og unødvendige gjentakelser. Slik kvalitetssikring kan være noe arbeidskrevende, avhengig av hvor godt talegjenkjenningen fungerer.
Omfattende bearbeidet automatisk teksting bruker verktøy for talegjenkjenning for å tekste video, med mye manuell bearbeiding av tekstingen før den blir lagt ut.
Dette er mest aktuelt for eksempel i fag med mange tekniske detaljer eller i tilfeller hvor det er viktig at alt er rett. Tekstingen blir omfattende bearbeidet for å rette opp eventuelle feil og forbedre formuleringer og setningsoppbygging. Dette er arbeidskrevende, avhengig av hvor godt talegjenkjenningen fungerer.
Manuell teksting tar gjerne utgangspunkt i et eksisterende manus når tekstingen legges til i videoen.