Aarhus Universitets segl

Program 20. MUDS

Fredag | Richard Mortensen-stuen | Ordstyrer: Jan Heegård Petersen


9:00 - 9.30

Ulf Dalvad Berthelsen og Ea Lindhardt Overgaard, Aarhus Universitet:
40 år med MUDS!

MUDS-konferencen har jubilæum, da vi i år kan deltage ved den 20. af slagsen! I den anledning har vi med et kvantitativt blik på MUDS-rapporterne foretaget en eksplorativ undersøgelse af de mange konferencerapporter gennem tiden. For hvad har vi egentlig diskuteret og skrevet om gennem de mange årtier?  

Vi har med undersøgelsen søgt af afdække de dominerende emner og tendenser i konferencerapporterne, og har ved hjælp af digitale tekstanalytiske værktøjer identificeret de mest fremtrædende temaer, der er blevet skrevet om i konferencerapporterne. Ved at arbejde på denne kvantitative måde kan vi både se særegne træk ved de enkelte år, men også se gennemgående tendenser på tværs af de forskellige rapporter. Vi får herigennem et indblik i, hvordan forskningsfokus og faglige interesserer, har udviklet og flyttet sig frem til, hvor vi står i dag.  


9:30 -10.00

Morten Tannert, Kristine Kabel & Sanne Floor Bendixen, Aarhus Universitet & VIA University College:
Elevers metasproglige repertoire og skrivning i grundskolens danskfag: Empiriske eksempler og fagdidaktiske overvejelser

Udviklingen af skriftsproglige færdigheder i grundskolen er en vigtig del af elevernes faglige udvikling og en forudsætning for faglig deltagelse i alle fag. Flere studier har peget på en væsentlig sammenhæng mellem elevers metasproglige repertoire og udviklingen af skrivefærdigheder. I oplægget præsenterer vi eksempler på, hvordan elevers metasprog kommer til udtryk i talk-around-text-interviews med elever fra 5. og 8. klassetrin, hvor eleverne bliver bedt om at fremhæve og begrunde steder i deres tekster, som de er særligt glade for. Vi præsenterer eksempler på, hvordan elevers metasprog kommer til udtryk i disse interviews både som genkendeligt, formelt metasprog om genre og grammatik, men også som mere uformelt metasprog knyttet til forskellige sproglige niveauer. I forlængelse heraf vil vi med udgangspunkt i eksempler fra vores empiriske materiale diskutere betydningen af elevers udvikling af metasprogligt repertoire i en tid, hvor skrivepraksisser i skolen i stigende grad er præget af generativ AI. 


10:00 -10.30

Michael Nguyen og Marianne Rathje, Dansk Sprognævn:
En pissegod røv! En diakron undersøgelse af forstærkere i tv-programmerne Big Brother og Ex on the beach

I dansk kan adjektiver bl.a. forstærkes af (i) præfikser som pisse-, mega-, smadder- og af (ii) ord som fucking og sygt, fx pissegod og fucking bange. Sådanne forstærkere forstærker typisk ikke kun graden af noget, men er også ekspressive og markerer talerens holdning. 

Et vigtigt træk ved forstærkere er at de ofte udskiftes – i modsætning til andre sproglige elementer. Indenfor kort tid kommer der nye forstærkere til som udskifter ’gamle’ forstærkere (se fx Fjeld 2020). 

I dette foredrag undersøger vi brugen af forstærkere i to reality-tv-programmer med unge deltagere, som er sendt med knap 20 års mellemrum, nemlig Big Brother (fra 2001) og Ex on the beach (fra 2018-2019). Hovedformålene med undersøgelsen er (i) at finde ud af hvilke forstærkere der er forsvundet, og hvilke der kommet til, og (ii) at tidsfæste hvornår hvilke forstærkere har været populære. Hvad tidsfæstningen angår, kan opslagsværker som fx ordbøger ganske vist oplyse om hvornår en given form først er belagt, men ikke om denne form var hyppig på et givet tidspunkt. Vi vil desuden komme ind på vanskelighederne ved at definere forstærkere som sprogligt fænomen (jf. også Becker-Christensen & Basbøll 2023). 

Referencer 

Becker-Christensen, Christian & Hans Basbøll (2023): det her røvsyge møgvejr: Ekspressive orddannelser i dansk med særligt henblik på konventionaliseret emfatisk tryk i adjektivkomposita. Danske Studier 62–103. doi:10.7146/danskestudier.vi2023.146736. 

Fjeld, Ruth Vatvedt (2020): Helt sjukt å være så jævlig god. Bruk av adjektivforsterkere i moderne norsk. Bauta: Janne Bondi Johannessen in memoriam, Oslo Studies in Language 11(2). 113–133. doi:10.5617/osla.8493. 

Fredag | Mogens Zieler-stuen | Ordstyrer: Anne Mette Nyvad


9:00 - 9:30

9:30 -10.00

Mikołaj Sobkowiak, Adam Mickiewicz Universitetet i Poznań:
Genbrug eller kreativitet? Om nominalfrasens kompleksitet og opgaveprompternes indflydelse derpå i dansk som fremmedsprog

Resultater fra undersøgelser med fokus på nominalfrasens udvikling i L2-skrivning tyder på, at den kan være en god indikator for lørnernes progression og deres placering inden for CEFR-skalaen (Bulté & Housen 2014 og 2018, Gujord 2021, Nilsen 2022). En lørnerteksts kompleksitet kan ikke blot være forbundet med skribentens sproglige kompetenceniveau (Moe 2012, Gujord 2021), men også med opgavens emne og type (Sobkowiak 2019). Ifølge Crossley (2020) kan skrivepromptens kompleksitet påvirke opgavebesvarelsen, og derfor kan besvarelsen potentielt afspejle promptens kompleksitet frem for skribentens sproglige kompetencer. I mit oplæg diskuterer jeg nominalfrasens kompleksitet i polske danskstuderendes skriftlige opgaver skrevet i slutningen af bachelorstudiets tredje år. Jeg   analyserer, hvorvidt der i teksterne er tale om genbrug af nominalfraser fra opgaveprompts og sammenligner kompleksiteten i besvarelser på opgaver med prompts, hvor nominalfraser er simple (n=11) og mere komplekse (n=25). Jeg undersøger bl.a. nominalfrasernes gennemsnitlige længde og deres diversitet ved at se nærmere på bestemmelsernes typer og frekvens. 

Litteraturhenvisninger 

Bulté, B., & Housen, A. (2014). Conceptualizing and measuring short-term changes in L2 writing complexity. Journal of Second Language Writing, 26, 42–65. doi.org/10.1016/j.jslw.2014.09.005 

Bulté, B., & Housen, A. (2018). Syntactic complexity in L2 writing: Individual pathways and emerging group trends. International Journal of Applied Linguistics, 28(1), 147–164. doi.org/10.1111/ijal.12196 

Crossley, S. A. (2020). Linguistic features in writing quality and development: An overview. Journal of Writing Research, 11(3), Article 3. doi.org/10.17239/jowr-2020.11.03.01 

Gujord, A.-K. H. (2021). Syntaktisk kompleksitet på tvers av rammeverksnivå. Norsk Lingvistisk Tidsskrift, 39(1), Article 1. 

Moe, E. (2012). Syntaktisk kompleksitet og rammeverksnivå. I C. Carlsen (Red.), Norsk profil—Det felles europeiske rammeverket spesifisert for norsk: Et første steg (s. 137–158). Novus. 

Nilsen, G. K. (2022). Substantivfrasens kompleksitetsutvikling i innlærerspråk: En konstruksjonsgrammatisk analyse av skriftlig produksjon fra A1- til B2-nivå [PhD-afhandling, University of Stavanger, Norway]. uis.brage.unit.no/uis-xmlui/handle/11250/2984162 

Sobkowiak, M. (2019). Hvordan skriver polske førsteårsstuderende? En korpusundersøgelse af syntaktisk kompleksitet i dansk som fremmedsprog. Skandinavskaya Filologiya, 17(1), 36–54. doi.org/10.21638/11701/spbu21.2019.103 


10:00 -10.30

Randi Benedikte Brodersen, Universitetet i Bergen:
Findes der leksikalske udfordringer og paralingvistiske løsninger i transskribering af norsk tale til dansk skrift?

I mit indlæg har jeg fokus på hvorvidt visse leksikalske forskelle mellem norsk og dansk giver forståelsesmæssige udfordringer i transskriberingen af norsk tale til dansk skrift. Desuden er jeg optaget af at afklare om visse paralingvistiske træk kan bidrage til forståelsesopklaring. Formålet er at belyse om leksikalske forståelsesudfordringer kan ryddes af vejen med paralingvistisk hjælp. 

Jeg har gennemført en sociolingvistisk undersøgelse af vejledningserfaringer, sprogbrug og kropssprog. Undersøgelsens informanter er otte erfarne norske universitetsvejledere. Informanternes norske tale transskriberer jeg på dansk, fra lydoptagelser. I transskriberingen hæfter jeg mig ved leksikalske forskelle og om der er forståelsesmæssige udfordringer knyttet til dem. Jeg hæfter mig også ved hørbare paralingvistiske træk – fx talehastighed og stemmerelaterede udtryk og kvaliteter, fordi jeg fornemmer at disse træk ofte rummer svar på leksikalske forståelsesudfordringer. 

Mange problematikker knyttet til transskribering af talesprogsdata er godt belyst, men der findes mig bekendt ingen studier som belyser en lignende problematik som den jeg sætter under lup i mit indlæg. 

10:30 -11:00 Kaffepause ude foran stuerne

Fredag | Richard Mortensen-stuen | Ordstyrer: Karen Schriver


11:00 -11:30

Ken Ramshøj Christensen, Katrine Rosendal Ehlers og Anne Mette Nyvad:
Når vi taler om øer…

Selvom adverbielle ledsætninger traditionelt er blevet anset for universelle syntaktiske øer, har det dog vist at det er muligt, i varierende grad, at ekstrahere fra dem i de fastlandssskandinaviske sprog, såvel som i engelsk. Acceptabiliteten af en sådan ekstraktion afhænger af en række forskellige faktorer, herunder typen af adverbiel sætning, typen af ekstraktion og kontekst. Baseret på resultater fra tidligere studier af dansk og engelsk, hvor stimuli har været på skrift, udførte vi en acceptabilitetsundersøgelse (7-punkts Likert-skala) af ekstraktion fra tre forskellige adverbielle sætningstyper med talt stimuli: betingelsessætninger indledt med hvis, tidsadverbialer med når og årsagssætninger med fordi. Vi ville undersøge om acceptabiliteten afhænger af modaliteten (talt vs. skriftligt). Vi brugte AI til at generere vores stimuli baseret på vores tidligere studier. Vores hypotese var at sådanne ekstraktioner ville være mere acceptable i talesprog end i skriftsprog. Resultaterne både bekræfter og udfordrer vores tidligere forsøg. 


11:30 -12:00

Julie Maria Rohde, Afdeling for Engelsk, Aarhus Universitet:
Mobile adverbialer– fup eller fakta?

Sætningsadverbialer antages normalvis kun at kunne modificere ét led, og eftersom de både kan placeres i hovedsætninger og ledsætninger, kan det samme adverbial føre til to forskellige tolkninger, afhængigt af hvor i sætningen det står, fx: 

  1. Hun sagde ikke, hun elskede ham. 

  1. Hun sagde, hun ikke elskede ham. 

Normalvis anses fænomenet Neg Raising, hvor en sætningsnegation i matrixsætningen forstås i den indlejrede sætning, som den eneste undtagelse til denne regel. Nyere forskning tyder dog på, at en lignende proces kan være tilgængelig for andre sætningsadverbialer, selvom der endnu hersker uenighed om de specifikke omstændigheder, der tillader dette. Sætninger som: 

Vi håber hverken der er nogen der vil genere Ole eller Peter (Hansen 2000, 77) 

Bliver fremsat som tilfælde af et fænomen bl.a. kendt som Adverb Raising (AR), hvor et adverbial i hovedsætningen bliver forstået som beskrivende ledsætningen. 

Jeg har undersøgt AR vha. KorpusDK, for at klarlægge ikke bare om adverbialer kan være mobile, men også under hvilke forhold. Heraf forekommer det, at ikke alle adverbialer har friheden til at være mobile, og at begrænsningen af dem er betinget af både syntaks, semantik og processering. 

Referencer 

Hansen, Erik. 2000. ‘Anteponeret adverbial’. Ny forskning i grammatik, nr. 7 (Oktober). https://doi.org/10.7146/nfg.v8i7.23954. 


12:00 -12:30

Jan Heegård Petersen, NorS, Københavns Universitet:
Det emneskiftende smask og andre diskursgrammatiske kendetegn ved DR TV’s Vores Vejr

I dette foredrag undersøger jeg hvad man kalde Vores Vejrs diskursgrammatik.  

Udsendelsesrækken Vores Vejr er en del af DR TV’s vigtige aftenprogramflade idet det efterfølger DR’s tv-avis, DR TVA, kl. 18.30 og forudgår Aftenshowet. En typisk Vores Vejr-udsendelse er struktureret omkring tre indholdselementer: en afrapportering af hvordan vejret i Danmark har været, ’døgnets vejr’, en pædagogisk tilrettelagt redegørelse for et aktuelt meteorologisk fænomen og en forudsigelse af vejret, femdøgnsprognosen. Dette formidles af en ’vejrvært’ i studiet. Herudover kan der være to journalistiske indslag, som oftest i form af vejr- eller klimarelaterede danske og internationale nyheder eller historier, og der bringes tillige udvalgte seerfotos af vejrfænomener.  

Indholdet i den studiebaserede del af udsendelsen formidles gennem den talesproglige kanal og visuelt vha. grafik, fx vejrkort, og vejrværtens fysiske fremtoning. Det skriftsproglige element er ret begrænset. Talesproget i Vores Vejr er uden tvivl planlagt, fx er det nøje koordineret med den detaljeprægede grafik, og det er udpræget monologisk og emnemæssigt sagligt og bundet (jf. Jensen 2014). Det er indlysende at sproget indholdsmæssigt er forberedt, men den faktiske sproglige udformning herunder den syntaktiske udformning forekommer mere spontan, eller naturlig, om man vil. Oplæst (fra en prompter) er det i hvert fald ikke, ifølge en af vejrværterne: https://www.dr.dk/nyheder/vejret/kom-med-bag-skaermen-ved-dr-vejret

I min diskursgrammatiske tilgang (jf. Renkema & Schubert 2018 og Johnstone 2019) ser jeg på den sproglige udformning af de tre typiske indholdselementer som de udfolder sig i otte udsendelser med fire forskellige vejrværter. Jeg ser i foredraget nærmere på de syntaktiske særpræg og kodningen af informationsstrukturen, og jeg viser eksempler på de prosodiske og paralingvistiske signaler vejrværterne anvender, bl.a. et genkommende ’smask’ der synes at indikere emneskift, pausering og emfatisk tryk. Jeg vil i min diskussion af resultaterne komme ind på hvilke træk der kan siges at være genredefinerende og dermed genkendelige i andre former for vejrudsigter, og hvilke træk der snarere kan relateres til den særlige mundtlighedsbåret formidlingsopgave vejrværterne i Vores Vejr har.  

Litteratur 

Jensen, Eva Skafte. 2014. Tale er tale; skrift er skrift. Nys, Nydanske sprogstudier 46, 11–38. https://doi.org/10.7146/nys.v46i46.17523

Johnstone, Barbara. 2019. Discourse analysis (3. udg.). Wiley-Blackwell. 

Renkema, Jan & Christoph Schubert. 2018. Introduction to discourse studies. John Benjamins. 

Fredag | Mogens Zieler-stuen | Ordstyrer: Margrethe Heidemann Andersen


11:00 -11:30

Irene Simonsen:
Fraselån – hvorfor rider de (måske) højt på bølgen?

I en OL-artikel i Politiken citeredes Lind i juni i år for at glæde sig over ”ikke bare [at] vinde, men faktisk komfortabelt, virkelig tørre gulv med modstanderen” (Politiken, 30.6.2024). Hos Sørensen (1995: 128) beskrives dette oversatte idiom eller oversættelseslån med et eksempel fra 1979, faktisk som hørende til de ”rigtig brutale” under kategorien ”Mest fjender”. I 1979 ’tørrede’ man godt nok ikke gulv med modstanderen, men ’vaskede’ det. En sådan tillempning kan også iagttages ved ’sidde på hegnet’, som i 1985 var et ’gærde’ (Sørensen 1995: 127); jf. dog også eksempel fra 1991 (jf. også dsn.dk/ordbog/noid/sidde_paa_hegnet/). Førstnævnte vending blev optaget i DDO i 2014, den anden i sidste opdatering i juni i år. Ved siden af oversættelseslånene eksisterer der om ikke semantisk fuldækvivalente pendanter, så dog nærsynonyme vendinger, som ’feje/slå af banen’ og ’være i syv sind’. Alligevel har de to fraselån altså overvundet døgnfluestadiet. Oversættelseslån er et velbeskrevet emne på dansk (jf. bl.a. litteratur nedenfor), men Andersen (2020: 19) peger med reference til Gottlieb (2012) på, at ”[man ser] en stigning i antallet af oversatte fraser”. På den baggrund har undersøgelsen til formål at vinde mere indsigt i, hvilke faktorer der motiverer fraselån. Metodisk kombineres en korpusundersøgelse af 7 evt. kun potentielle, nyere lån i pressetekster (Infomedia 1990-2024) med en mindre spørgeskemaundersøgelse.   

Andersen, Margrethe Heidemann (2020): Engelske lån i dansk: Nice to have eller need to have? Nydanske Sprogstudier NyS 58, 9-37. 

Gottlieb, Henrik (2012): Phraseology in flux: Danish Anglicisms beneath the surface. C. Furiassi, V. Pulcini & F. Rodriguez Gonzáles (red.), The Anglicization of European Lexis, 169-198. Amsterdam: John Benjamin Publishing Company.  

Gottlieb, Henrik (2020): Echoes of English: Anglicisms in Minor Speech Communities - with Special Focus on Danish and Afrikaans. Berlin: Peter Lang.  

Sørensen, Knud (1995): Engelsk i dansk – er det et ’must’? Munksgaards Sprogserie. København: Munksgaard.  


11:30 -12:00

Astrid Mus Rasmussen & Noah Rørbæk, Aarhus Universitet:
Når dansk bliver til – en læringsressource til dansk som andetsprog

I dette oplæg vil vi præsentere forskningsprojektet Når dansk bliver til, som er finansieret af Velux Fonden. Det overordnede formål med projektet er at udvikle en online læringsressource, der skal understøtte udviklingen af interkulturel kommunikativ kompetence i undervisningen i dansk som andetsprog for voksne migranter. Ressourcen indeholder på den ene side beskrivelser af centrale kulturelle nøglebegreber og kommunikationsnormer i et helt simpelt og let-oversætteligt sprog, som vi kalder minimaldansk. På den anden side indeholder den læringsaktiviteter, som er relateret til disse beskrivelser. På den måde ønsker vi at gøre komplicerede, kulturspecifikke og svært oversættelige ord og kommunikationsnormer tilgængelige for kursisterne allerede på et relativt tidligt stadie af deres danskundervisning. En af de centrale antagelser for projektet er, at beskrivelserne af ord og kommunikationsnormer kan åbne et vindue ind i de kulturelle logikker, tankegange og værdier, som man kan støde på og undres over, hvis man er ny i Danmark. Det er også et forsøg på at synliggøre den ”usynlige kultur”, så underforståede og taget-for-givne praksisser bliver mere gennemsigtige. 
I oplægget vil vi fortælle om projektets metoder, give eksempler på de ovenfornævnte beskrivelser af kulturelle nøgleord og kommunikationsnormer, og præsentere en mere overordnet status på projektets udvikling samt de næste skridt.  


12:00 -12:30

Katrine Kehlet Bechsgaard:
Hvilket sprog bruger vi om befolkningsgrupper, der adskiller sig fra flertallet?

Når en gruppe mennesker i samfundet er fælles om en afvigelse fra ”normalen”, kategoriseres de ofte under en overordnet betegnelse. Men betegnelserne, som bruges om forskellige minoritetstilstande og -identiteter, ændrer sig over tid. Engang kunne man eksempelvis være DAMP-barn, homofil, hysterisk eller kejthåndet. I dag er den slags betegnelser forældede, og nye er kommet til. 

 Samtidig varierer de konnotationer, der er knyttet til forskellige betegnelser, alt efter hvornår, hvor og af hvilke mennesker betegnelserne bruges. For eksempel var bøsse for få årtier siden et nedsættende ord, mens det i dag snarere er neutralt. Ligesom selve betegnelserne og konnotationerne ændrer sig, gør måder at anskue forskellighed på det samme. Tilstande, der i én periode og ét samfund sygeliggøres, opfattes som ”normale” i en anden periode og et andet samfund. 

 Denne præsentation tager udgangspunkt i det igangværende forskningsprojekt “The power of labels: The meaning and use of names for identities and conditions”, som er støttet af Carlsbergfondet. Præsentationen inddrager medieeksempler og eksempler fra kvalitative interviews og tager fat på spørgsmål som: Hvordan udvikler disse betegnelser sig over tid? Og hvilke sammenhænge er der mellem dem og den generelle samfundsudvikling? 

12:30 -13:15 Frokost i Stakladen

Fredag | Richard Mortensen-stuen | Ordstyrer: Ken Ramshøj Christensen


13:15 - 13:45

Ole Togeby:
Baggrund, meddelelse og fokus

Den samlede mening med en tekst(ytring) opfattes af adressaterne ved uddragning af forskellige typer af information af de materielle former i den retoriske situation: information om handlingens legitimitet, information om budskabets relevans, information om udsagnets sandhed og information om den omtalte situations sammenhæng.  

Budskabets relevans opfattes på grundlag af kompositionenen af sætninerne i teksten med konneksioner mellem dem (i dens begyndelse, midte og slutning), og af arrangementet af informationer i hver enkelt sætning. Informationer i en sætning kan være om den retoriske situation (handlingdeklareringen eller afsenderens parentetiske apropos’er) eller om den omtalte situation. Informationerne om den omtalte situation kan have status som enten nævnt baggrund, fremsat meddelelse eller relevant fokus. I foredraget vil begreberne ‘baggrund’, ‘meddelelse’ og ‘fokus’ blive defineret og eksemplificeret. Fx er der forskel på informationsstrukturen i Han tabte; hun vandt. og i Han tabte, og hun vandt. og i Han tabte, men hun vandt. 


13:45 -14:15

Ole Ravnholt:
Flertydighed, entydiggørelse, reference

Tekster involverer flertydigheder på mange niveauer: leksikalsk, syntaktisk, semantisk og pragmatisk. Jeg vil argumentere for at entydiggørelse primært opnås ved situering. Det vil sige ved at modtageren forstår ytringer ved reference til genstande og handlemuligheder i talesituationen og den omtalte situation. 

I verballøse kortformer som dem der er i fokus her, er der ikke noget valensbærende led og ingen entydig topologi. Derfor er ytringen oftest syntaktisk, semantisk og pragmatisk flertydig. Der er ingen entydig markering af syntaktiske afhængigheder og semantiske roller og heller ikke af ytringens illokutionære kraft. 

Pragmatisk entydiggørelse drejer sig især om tilskrivning af reference og illokutionær kraft ved situering, men også kohæsion, kohærens og implikatur, og den har betydning for entydíggørelse på de lavere niveauer.  

Semantisk og syntaktisk drejer det især om tilskrivning af semantiske roller til de tilstedeværende led og om at forstå de syntaktiske afhængigheder mellem dem. Leksikalsk om valg mellem forskellige betydninger af homonymier og polysemiske udtryk. 


14:15 - 14:45

Andrzej Szubert:
Kvasiendocentriske komposita – er der plads for en ny type?

Komposition er den simpleste og mest gængse orddannelsesproces i dansk og de andre germanske sprog. Der forskes meget inden for området og der findes forskellige klassifikationer af komposita. De fleste af dem bygger på semantiske kriterier. Dog forekommer der eksempler på komposita, der ikke lader sig klassificere under kategorier, som indtil videre er blevet beskrevet. De udgør en type, der ligger på grænsen, og kan derfor hverken betragtes som eksocentriske eller endocentriske. På grund af deres egenskaber burde de placeres mellem de ekso- og endocentriske komposita og jeg vil foreslå at kalde dem kvasiendocentriske. I mit oplæg skal jeg præsentere mere og mindre kendte klassifikationer af komposita og vise eksempler på komposita, der ikke lader sig indordne i de hidtidige klassifikationer. Derefter vil jeg argumentere for behovet for en ny kategori og mit forslag for navnet på den.  

Fredag | Mogens Zieler-stuen | Ordstyrer: Winnie Collin


13:15 -13:45

Philip Diderichsen & Torben Juel Jensen:
Digitalt medieret interaktion i korpusformat – hvorfor og hvordan?

Vi vil i vores oplæg præsentere planerne for etableringen af det Carlsberg-støttede Corpus of Danish Digitally Mediated Interaction. Formålet med korpusset er tilvejebringe et stort, bredt sammensat og tilgængeligt datamateriale til undersøgelser af interaktion på danske sociale medier. Korpusset sammensættes af data fra platformene Hestenettet, Twitter, Facebook, Reddit og Messenger, og fra en periode på flere årtier. Vi vil i oplægget fokusere på metodologiske udfordringer ved dataindsamling og -behandling, og vi vil præsentere og diskutere det XML-format der er valgt til at strukturere vores data. Formatet følger Text Encoding Initiative (TEI)-standarden, som for ganske nylig er blevet opdateret med et modul til håndtering af computermedieret kommunikation (CMC). Endelig vil vi præsentere vores overvejelser i forhold til søgning/visning og tilgængeliggørelse af korpusset. Korpusset vil åbne en række nye forskningsmuligheder, herunder systematiske sammenligninger på tværs af forskellige digitale platforme og datadrevne undersøgelser af blandt andet karakteristiske grammatiske strukturer, fx construction mining. 


13:45 -14:15

Eckhard Bick, Syddansk Universitet:
CorpusEye: Et brugervenligt korpusværktøj til forskning og undervisning

Dette bidrag til MUDS præsenterer CorpusEye (https://corp.visl.dk), et komplekst grafisk brugergrænsesnit til grammatisk-lingvistisk opmærkede korpora, og viser, hvordan korpuslingvistiske metoder kan bruges til fx identifikation af kulturelle, etniske, religiøse og kønsbaserede stereotyper, virksomhedsprofilering og hate speech-forskning, i sociolingvistikken, eller til distant reading i litterære studier. Systemet understøtter bl.a. grammatisk-semantisk-baserede konkordanser og statistikker, relative og standardiserede frekvenstal, metadata-baserede søjlediagrammer til sammenligning af forfattere, værker eller perioder, samt fleksible 2-dimensionelle scatter plots baseret på word embedding, for at sammenligne og “opmåle” beslægtede begreber, som fx ordene flygtning, indvandrer, udlænding. Der benyttes et nyt litteraturkorpus af frit tilgængelige klassiske værker samt et sociolingvistisk korpus med data fra Twitter og Facebook. Opmærkningen dækker foruden morfosyntaks også semantiske kategorier for substantiver (en ontologi af semantiske prototyper) og verber (Framenet).


14:15 - 14:45

Thomas Widmann, Dansk Sprognævn:
ChatGPT som leksikograf: Ordbogens fremtid?

Store sprogmodeller (LLM’er) som fx ChatGPT kan ud fra et simpelt prompt producere ordbogsartikler af rimelig kvalitet, som demonstreret af bl.a. de Schryver & Joffe i 2023. 

Jeg vil her se på hvordan man kan forbedre kvaliteten af de genererede ordbogsartikler ved at starte med en korpuskonkordans og dernæst lede AI'en gennem den normale leksikografiske arbejdsproces ved hjælp af en automatiseret proces som gør brug af ChatGPT-API’et. 

Hvis man kan producere ordbøger af god kvalitet automatisk, har det store perspektiver. Ikke alene vil det gøre ordbogsproduktion hurtigere og billigere; det vil bl.a. gøre det muligt at producereordbøger til meget specifikke behov, lige fra tosprogede ordbøger for nichesprogpar til ordbøger over en forfatters ordforråd. Man kan også forestille sig ordbøger som er tilpasset den enkelte elevs niveau, eller automatiske glosseringer i litteratur. 

Til perspektivering til jeg komme ind på fremtidens ordbog og ordbogens fremtid: Hvordan skal ordbøger se ud hvis stort set al tekst om nogle år skrives af AI'er? Vil behovet for ordbøger forsvinde? 

Fredag | Mogens Zieler-stuen


14:45 -15:00

Afslutning