Samtaler i korpusformat: Repræsentation af talesprog i LANCHARTs korpus-infrastruktur
Publikation: Bidrag til tidsskrift › Tidsskriftartikel › Forskning › fagfællebedømt
Dokumenter
- Fulltext
Forlagets udgivne version, 2,6 MB, PDF-dokument
LANCHART-korpusset udgøres dels af optagelser indsamlet i forbindelse med dialektologiske og sociolingvistiske projekter i 1960’erne, 1970'erne og 1980'erne, dels af optagelser af samtaler indsamlet af Sprogforandringscentret på Københavns Universitet mellem 2005 og 2015. Geografisk dækker korpusset en række lokaliteter bredt fordelt i Danmark samt danske udvandrersamfund i Argentina, Canada og USA. Korpusset er i TextGrid-format, hvilket muliggør en direkte kobling mellem transskriptionerne og lydoptagelserne samt fleksibel annotation af ord og længere tekstpassager. Korpusset er for nylig blevet relanceret i en ny søgeinfrastruktur baseret på Corpus Workbench (CWB) og den brugervenlige søgegrænseflade Korp, som udover hurtige og fleksible søgninger udmærker sig ved at være open source software der frit kan udvides med ny funktionalitet. Indlæsning af korpusdata i konkordansværktøjer som Korp kræver data i lineært format, hvilket medfører særlige problemstillinger i forhold til samtaledata, hvor der ofte forekommer overlap mellem talerne. I artiklen diskuterer vi disse problemstillinger og præsenterer vores løsning i form af en ny partiturvisning, der viser taledataene med lydsporet synkroniseret til transskriptionen.
Originalsprog | Dansk |
---|---|
Bogserie | Nordlyd |
Vol/bind | 47 |
Udgave nummer | 2 |
Sider (fra-til) | 77–89 |
ISSN | 0332-7531 |
DOI | |
Status | Udgivet - 2023 |
Begivenhed | Nordisk Dialektologkonference: Struktur, ideologi og mangfald - UiT Campus Alta, Alta, Norge Varighed: 15 aug. 2022 → 17 aug. 2022 Konferencens nummer: 12 https://uit.no/tavla/artikkel/730114/tolvte_nordiske_dialektologkonferansen |
Konference
Konference | Nordisk Dialektologkonference |
---|---|
Nummer | 12 |
Lokation | UiT Campus Alta |
Land | Norge |
By | Alta |
Periode | 15/08/2022 → 17/08/2022 |
Internetadresse |
- Det Humanistiske Fakultet - Korpuslingvistik, talesprogskorpus, samtaledata, LANCHART, annotation
Forskningsområder
Antal downloads er baseret på statistik fra Google Scholar og www.ku.dk
Ingen data tilgængelig
ID: 346244263