Denne vejledning henvender sig primært til forskere, der har brug for at transskribere lydoptagelser eller video. De fleste af værktøjerne kan også bruges af øvrige medarbejdere og studerende. I vejledningen finder du først en gennemgang af de værktøjer til transskribering, du har mulighed for at bruge. Herunder anbefalinger for, hvilke transskriberingsbehov de enkelte værktøjer passer bedst til. Nederst finder du fold-ud bokse, der giver nærmere instrukser om, hvordan du kommer i gang med at bruge værktøjet.
Transskriberingssoftware
Når man taler om at transskribere, er det vigtigt at skelne mellem på den ene side automatiseret transskribering, hvor computeren ved hjælp af kunstig intelligens genkender talte ord i en lydfil og laver en afskrift at det sagte. Dette kræver særlig software, der kan både lytte og skrive, og man skal også gerne kunne redigere teksten bagefter. På den anden side er der manuelle værktøjer, der ikke foretager nogen automatiseret transformation, men hvor et menneske kan afspille lyd og skrive tekst simultant. Indtil for nylig havde vi kun adgang til den sidste type værktøjer i VIA. Men nu har vi mindst fire værktøjer til automatiseret transskribering.
I resten af denne vejledning henviser termen 'transskribering' altid til automatiseret transskribering. De værktøjer, vi pt. har adgang til, fremgår af nedenstående tabel:
Navn | Beskrivelse |
---|---|
Amberscript | Rent transskriberingsprogram, hvor tale i en lyd- eller videofil kan omdannes til tekst, der herefter kan efterbehandles under afspilning af lyden. Adgang til at bruge Amberscript gives pt. kun til forskningsprojekter, og der er en fast pris pr. transskriberet time lydfil. |
Word | Tekstbehandlingsprogram, der har et indbygget transskriberingsværktøj. Transskriberingsværktøjet giver mulighed for at inkludere både tidsstempler og talere i teksten. |
Teams | Samarbejdsplatform med indbygget værktøj til online-møder. Man kan optage et møde med eller uden transskribering. Vælger man transskribering vil det være angivet, hvem der sagde hvad. Dog vil Teams pt. ikke kunne skelne stemmer men blot angive, hvilken deltagerprofil, det sagte kom fra. Deltager to personer fra samme computer, vil deres replikker blive tilskrevet den bruger, de er logget på med. |
Videoportalen (Kaltura) | Program til optagelse og let redigering af video. Programmet kan transskribere på den måde, at der kan laves automatisk genererede undertekster. Disse kan redigeres og eksporteres, men programmet skelner ikke mellem talere. |
Det er forholdsvist let at vælge mellem de fire værktøjer. Videoportalen er absolut bedst egnet til at undertekste videoer. Amberscript er bedst til forskningsprojekter med relativt stort behov for at transskribere. Word er et udmærket valg i stort set alle andre sammenhænge, og kommer et forskningsprojekt ikke over kvoten på 5 timers transskribering pr. måned pr. VIA-medarbejder i projektet, kan man også fint bruge Word til dette. Teams er bedst til transskribering af online-møder.
Brug ikke automatisk transskribering i andre programmer, og særligt ikke onlinetjenester, uden at rådføre dig med IT og digitalisering først. Automatisk transskribering sker nemlig ikke lokalt på din computer men igennem en onlineforbindelse til en kraftigere maskine hos udbyderen. Dermed kan datasikkerheden kompromitteres på flere planer.
Step-by-step guides til værktøjerne
Automatisk transskribering kan kun håndtere ét sprog ad gangen, Hvis din optagelse skifter mellem flere sprog, kan du blive nød til at dele optagelsen op og transskribere delene hver for sig, eller du kan transskribere optagelsen en gang for hvert sprog og så plukke replikkerne ud.
Du skal være tilknyttet et forskningsprojekt og oprettes som bruger i Amberscript, før du kan bruge dette værktøj. Læs om oprettelse og afregning vedr. Amberscript-tjenesten på medarbejderportalen (kræver VIA-login).
Denne vejledning starter der, hvor du er oprettet som bruger og skal logge ind på tjenesten første gang.
Gå til Amberscripts hjemmeside. Vælg Login i øverste højre hjørne. Vælg Login with SSO.
Skriv VIA i søgefeltet og vælg VIA University College. Vælg blot den øverste, hvis der er mere end en.
Log ind med dit VIAlogin og vælg OK.
Herefter kommer WAYF-loginsiden, hvor du igen vælger OK.
På din forside My files vil du kunne se dine uploadede filer og status på dem. Ved første login vil du kun have demo_english_final.wav her. Vælg nu Upload file i øverste højre hjørne. Du kan nu trække en fil ind i feltet omgivet af en stiplet linje, eller du kan vælge My Device, der åbner Stifinder (PC) eller Finder (Mac).
I øverste højre hjørne ved siden af din mailadresse står din saldo (Balance). Den vil starte på 10 minutter, eftersom alle nye brugere har 10 minutters gratis transskribering. Herefter falder saldoen, og når den går i minus vil der skulle afregnes for det transskriberede antal timer. Se mere om dette på Medarbejderportalen.
Du kan nu tilføje endnu en fil, eller du kan gå videre til Upload [antal] file.
Nu kan du vælge det sprog, der tales i optagelsen (1), og du kan indstille, hvor mange forskellige talere der er (2). Vælg Transcription (3) og tjek, at der i Summary til højre kommer til at stå Covered by balance eller en lignende tekst under Subtotal og Total. Hvis du bliver mødt med krav om at oplyse betalingsmetode, er din konto ikke korrekt oprettet, og du skal henvende dig til din kontaktperson for Amberscript. Når de 10 gratis minutter er brugt, vil du muligvis skulle vælge Cost Center. Her skal du vælge de Cost Center, der starter med dit centers stedkode og slutter med dit projekts nummer.
Hvis du scroller ned til bunden af siden, har du mulighed for at bruge en ordbog (Use dictionary). Her kan du tilføje egennavne, du forventer der vil optræde i optagelsen, og du kan tilføje særlige ord og udtryk, som vil blive brugt, men som ikke hører med til normal dansk sprogbrug. Det kunne f.eks. være 'Itslearning' eller særlige fagtermer fra dit fag. Laver du en ordbog, kan den senere vælges som en af dine Collections i dette felt.
Afslut ved at vælge Checkout under Summary i højre side. Nu kommer du tilbage til din forside. Vent til status på din fil skifter fra In progress til Complete. Du får en e-mail, når den er færdig. Det kan godt tage lidt tid med lange optagelser. Holder du nu musen hen over filens række på din forside, kan du vælge Open in editor.
Du bliver tilbudt en kort rundvisning i Amberscript. Det anbefales at gennemgå denne, når du skal bruge Amberscript første gang, eller hvis det er længe siden, du har brugt det. Læg især mærke til tastaturgenvejene, hvis du skal arbejde meget med Amberscript. Din transskriberede tekst fremgår af hovedvinduet, og du kan frit redigere i den, mens du lytter til optagelsen. Den tid, du bruger på dette koster ikke andet end arbejdstid. Det er længde på den uploadede fil, der afregnes for.
Både medarbejdere og studerende kan transskribere op til 300 minutters optagelse hver måned i programmet Word. Det er en del af VIAs Microsoft licens og skal derfor ikke afregnes, men der kan ikke tilkøbes ekstra tid. Du kan transskribere både lydfiler og videofiler. Word kan håndtere de fleste formater, men kniber det, kan du bruge Videoportalen til at konvertere til formatet .mp4. Se her, hvordan du kan konvertere en video til .mp4.
Du kan transskribere i både skrivebordsapp'en og onlineversionen af Word. Åbn et tomt dokument i Word og find værktøjet 'Dikter'. Klik på den lille pil under ikonet og vælg 'Transskriber'.
Der åbner sig nu et vindue i højre side.
Du kan vælge imellem at uploade en lydfil eller starte optagelse. Optagelse er ikke helt det samme som diktering, fordi Word ved transskribering både skelner mellem forskellige stemmer og registrerer, hvornår hver replik begynder. Man kan dermed få vist, hvem der taler, og hvornår i optagelsen de siger det. Har du allerede en optagelse klar, så vælg Upload lyd. Det tager et stykke tid, men du kan følge fremskridtet, og du kan arbejde videre med andre ting imens.
Den uploadede fil gemmes i en særlig mappe på dit VIA-OneDrive. Det er sikkert nok uanset klassifikationen af data i din optagelse, men hvis OneDrive ikke er den placering, som filen skal have permanent, bør du slette den igen der fra, når du er færdig med at bearbejde transskriptionen. Den originale lydfil skal selvfølgelig fortsat ligge på den korrekte placering, f.eks. på et forskningsdrev eller et Teams-site. Læs evt. mere om godkendte placeringer i VIAs retningslinje for dataplacering.
Når transskriberingen er færdig, dukker teksten først op i vinduet i højre side. Her har du mulighed for at omdøbe de talere, som Word har identificeret.
Hold musen over 'Taler 1'. Der dukker nu et lille redigeringssymbol op. Vælg dette.
Ret navnet til det, det skal være. (Eller behold Taler1, hvis transskriptionen skal være anonymiseret.) Sæt flueben ved 'Skift alle Taler 1' for at rette til for hele transskriptionen. Afslut ved at vælge fluebenet nederst til højre. Gentage for 'Taler 2' og evt. flere.
Når du er færdig med at omdøbe talerne, kan du afslutte ved at vælge 'Føj til dokument' nederst i vinduet. Du kan nu vælge, om du vil have talere, tidsstempler eller begge med ind i dokumentet, eller om du vil have ren tekst. Vælg den sammensætning, du ønsker.
Nedenfor ses et eksempel, hvor både talere og tidsstempler er ført med over i dokumentet. Gem dokumentet som sædvanlig. Husk, at en automatiseret transskription kan være behæftet med fejl, så den skal læses igennem og rettes til.
Hvis kvoten på 300 minutters transskribering af optagelse ikke slår til, har du forskellige muligheder.
- Løbende transskribering. Transskriber dine optagelser løbende. Du kan sætte en transskribering i gang og så blot gemme teksten og tage det lidt mere tidskrævende redigeringsarbejde til senere. Det er selve den automatiserede transformeringen af lydsporet til tekst, der er kvote på. Ikke den efterfølgende bearbejdning af teksten.
- Træk på flere kvoter. Hvis I er flere, der arbejder sammen om et projekt, kan I dele den automatiserede transskribering ud på flere medarbejderes kvoter (så længe de er medarbejdere i VIA).
- Brug også andre redskaber. Der er andre redskaber end Word til rådighed, så brug evt. flere forskellige redskaber. Sørg f.eks. for at transskribere alle interviews, der foregår online i Teams under møderne, og gem Word-kvoten til fysiske interviews. Har I et meget stort behov, kan I tilkøbe kapacitet i Amberscript, der fungerer meget ligesom Word.
Når du har startet et møde, kan du vælge at optage og/eller transskribere mødet. Vælg de tre prikker over 'Mere' (1), hold musen over Optag og transskriber (2), og vælg herefter Start optagelse (3), hvis du både vil have en video af mødet og transskribering. Der vil nu i højre side åbne et felt, hvor du kan følge med i transskriberingen.
Hvis du kun vil have en transskription, kan du vælge dette, men du vil i så fald ikke have en optagelse, som kan bruges som grundlag for at rette fejl i transskriptionen.
Husk altid at informere deltagerne om, at mødet optages!
Når du vil afslutte optagelsen, vælger du igen de tre prikker (1), holder musen over Optag og transskriber (2), og vælg så Stop optagelse (3). Her kan du også skjule transskriptionen (4), hvis du synes, den er distraherende for dit møde.
Din optagelse og transskription dukker op i mødets chat, når du har afsluttet det. Hvis du har optaget et møde, der er startet fra en kanal, vil optagelsen dukke op som et link i et indlæg i kanalen. Du skal huske at downloade både optagelse og transskription umiddelbart efter optagelsen, da begge dele slettes efter 60 dage.
Transskribering af mediefiler i Kaltura er beskrevet i afsnittet om webtilgængelighed. Gå direkte til afsnittet om transskribering ved at følge dette link.
Når du bruger Videoportalen til at transskribere, får du rigtig mange tidsstempler med. Værktøjet er udviklet til at generere undertekster, så teksten deles op i bidder, der passer til dette formål, og der sættes tidsstempler for hver lille bid. Du får måske en .srt-fil i stedet for en .txt-fil, når du downloader transskriptionen. -srt er standardformat for undertekster. Men den kan ligesom .txt åbnes i de fleste tekstredigeringsprogrammer inkl. Word.