Jakten på god automatisk teksting
UiOs tekstingsverktøy Autotekst har kommet i ny versjon, med mye bedre teksting som krever mindre etterarbeid. – For to år siden utviklet vi tjenesten for å gjøre det enklere tekste video. Det er et krav at alle forelesningsvideoer på uio.no skal være tekstet, og siden kravet trådte i kraft, har vi jobbet hardt for å komme fram til en teknisk løsning for god automatisk teksting, forteller leder for webutvikling på UiO, Dagfinn Bergsager. – Teksting er svært tidkrevende, så det har vært viktig å finne en løsning som krever minst mulig manuell teksting. Og nå har vi det! Det fungerer svært godt på norsk tale, til og med når den som snakker har dialekt!
Se en kort video om Autotekst og hvordan du kan ta den i bruk.
Videoen er kun på 1 minutt og 54 sekunder, så dette har du tid til :)
Slik kan du bruke autotekst til å tekste video fra forelesninger som ligger på uio.no
- Last ned lydfila fra uio.no for videoen du skal transkribere
- Last lydfila opp i autotekst.uio.no og start transkribering
- Last opp .vtt-fila som autotekst lager sammen med videofila på uio.no
- Velg å redigere ediger video-fila og vel den opplastede .vtt-fila som undertekst
Se en kursvideo som gjør de stegene som er beskrevet over.
Autotekst var tidlig ute, og nå er verktøyet fornyet og forbedret
Autotekst, da den ble lansert, tok imot lyddata, sendte dem til Googles tjeneste Speech-to-Text og returnerte tekst. Problemet var at kvalitet på transkribering av norsk tale var veldig lav, og krevde mye etterarbeid. – Vi beregnet kostnaden til å renskrive teksting til alle forelesningsvideoer som publiseres på uio.no til 20 millioner kroner i året! I tillegg hadde vi personvernutfordringer med å sende data ut av Norge hver gang vi skulle transkribere, fortsetter Bergsager.
Men nå har Autotekst kommet i ny versjon, med ny, og mye bedre teknologi som driver tekstingen. Tjenesten som er lansert nå, krever vesentlig mindre etterarbeid og i mange tilfeller kan teksting legges ut uten å bli renskrevet i ettertid. Slik kan alle som må tekste video eller transkribere lyd, spare mye tid og ressurser.
OpenAI reddet oss
På slutten av høsten 2022, like før ChatGPT ble årets snakkis, lanserte OpenAi tjenesten . Dette er programvare som er basert på AI-modeller som kan kjøre på lokale servere. Utfordringen er at tjenesten krever veldig mye datakraft. Heldigvis har IT-avdelingen på UiO akkurat det – altså mye datakraft – så nå går verktøyet Whisper på vår egen infrastruktur uten at noe data forlater campus og UiOs servere.
HÃ¥ndplukket spesialteam

Før nyttår ble det satt sammen et tverrfaglig team av utviklere og interaksjonsdesignere som skulle endre tjenesten autotekst.uio.no, som vi allerde hadde, til å bruke Whisper til transkribering. I tillegg skulle de gjøre hele tjenesten mer brukervennlig og å ta i bruk flere nye funksjoner, blant annet automatisk oversetting til engelsk.
I løpet av uke 1 i 2023 ble hele prosjektet gjennomført på rekordtid og tjenesten ble skrevet om. IT-avdelingen lanserte en ferdigtestet fullversjon 1.februar 2023!
Vi har allerede fått mange tilbakemeldinger om hvor utrolig bra autotekst.uio.no nå klarer å gjøre om norsk tale med forskjellige dialekter til tekst.

Neste steg: Integrasjon med mobilappen Nettskjema-diktafon
Allerede nå er det mulig å transkribere lydopptak tatt med mobilappen nettskjema-diktafon, men da må du første laste ned opptaket og laste det opp i autotekst.uio.no. I løpet av våren 2023 kommer alle lydopptak som lagres Nettskjema med diktafonappen, til å bli transkribert automatisk ved bruk av de samme serverne.
Mer om Autotekst
- Les mer om tjenesten i UiOs IT-tjenestekatalog.
- Bruk av tjenesten er fritt tilgjengelig for alle UiO-brukere og kan bestilles av alle FEIDE-institusjoner.
- Om du skal transkribere sensitive data, kan du også installere Whisper i ditt TSD-prosjekt.