UP | HOME
Notat til syntaks og datalingvistikk

Notat til syntaks og datalingvistikk

«Syntax, my lad. It has been restored to the highest place in the republic.»
–John Steinbeck

(tilbake)

Innhald

1 LING111, Analyzing syntax

Kroeger, Paul. Analyzing Syntax. Cambridge: Cambridge University Press, 2004.

1.1 Typologi

Kor like er språk? Kan me finne felles skjema? Språkleg variasjon blir ofte sett langs ulike dimensjonar.

1.1.1 Nominativ vs Ergativ

Nominativ-akkusative språk (t.d. tysk):

NominativAkkusativ
V-Transitivsubjektobjekt
V-Intransitivsubjekt

Ergativ-absolutive språk (t.d. chichewa):

Absolutiv/objektivErgativ
V-Transitivsubjektobjekt
V-Intransitivsubjekt

Lachota har ein slags mellomstilling her:

Absolutiv/objektivErgativ
V-Transitivsubjektobjekt
V-Intransitivagentivt subjektikkje-agentivt subjekt

Skillet i lachota er altså reint semantisk, mellom det agentive og det ikkje-agentive (ved transitive verb blir jo det «ikkje-agentive» objektet ergativt).

(Eigentleg er skiljet mykje meir komplekst, sidan ein kan ha ergativ-absolutiv i visse tilfelle, nominativ-akkusativ i andre, dvs. «split ergativity».)

1.1.1.1 Ein hypotese om genus og diakroni

Animatum har i visse språk delt seg i masculinum og femininum, medan inanumatum blei nøytrum.

Bøyingsmønstra i språk med masc/fem/nøytr er ofte i dette mønsteret, med nøytrumsformene like på tvers av kasus:

MFN
Nom-a-b-c
Obj-d-e-c

Hypotese: «urspråket» var som Lachota. Inanimate ville aldri opptre som agentivt subjekt, difor er det ingen endingsforskjell for denne kasusen (her: Nom) – medan animate kan opptre som båe agens og patiens, så dei har ulike bøyingar.

1.1.2 Uttrykk av grammatiske relasjonar (leksosentrisitet og endosentrisitet)

Otto Jespersen: Endosentriske frasar har kjernen inni frasen, og kjernen kan byttast ut for heile frasen, versus eksosentriske frasar som S.

(Nordlinger 1998b, sitert i Bresnan 2001: 113)

← meir ikkje-konfigurasjoneltmeir konfigurasjonelt, endosentrisk →
↑ meir hovudmarkeringMohawk, MayaliNavaho, Chicheŵa
(AGR, samsvar)
LeksosentrisitetsgradWambaya, WarlpiriFinsk?
(CASE, kasus)
↓ meir dependentmarkeringJiwarli, DyirbalIslandsk, Martuthunira

1.1.3 Bøyingsgrad

«Fri leddfølgje» tyder at leddfølgja uttrykkjer informasjonsstruktur (pragmatikk).

1.1.3.1 Isolerande språk

T.d. kinesisk. «Ingen» bøying meir kontekst-ømfintleg? Ein er gjerne meir hintande, underforstått). Leddfølgje gir syntaktisk informasjon.

1.1.3.2 Analytiske språk

T.d. engelsk. Leddfølgje gir syntaktisk informasjon.

1.1.3.3 Syntetiske språk

T.d. gresk og latin. Bøying gir syntaktisk informasjon.

  • Flekterande
    Eitt morfem uttrykk fleire trekk
  • Agglutinerande
    Ein sett saman morfem som kvar uttrykk eitt trekk
1.1.3.4 Polysyntetiske språk

T.d. grønlandsk, bantuspråk. Heile setningar kan uttrykkast i eitt ord.

1.1.4 Subjektprominente språk vs Topic-prominente språk

Li, Charles & Sandra Thompson (1976): Subject and Topic: A New Typology of Languages (meir info om TP vs SP)

Språk er enten topic-prominente eller subjektprominente.

Eigenskapar ved topic og subjekt:

  • Båe har vid logisk rekkjefølgje:
    1. Alle studentane tek to eksamenar i første semester
      • ∀ x ∃2y (Sx ∧ Ey ∧ Txy)
    2. To eksamenar tek alle studentane i første semester
      • 2y ∀ x (Sx ∧ Ey ∧ Txy)
  • Topic må vere semantisk bestemt; subjekt treng ikkje (men kan)
  • Topic treng aldri seleksjonsrelasjonar (som «animat» el.); subjekt får desse frå verbet (i kraft av å vere argument), verbet determinerer subjektrolla
  • Topic har ei rolle på tvers av setningar: å innskrenke domenet til predikatet (t.d. «sist søndag_ regna det»); subjektet si funksjonelle rolle er definert av verbet
  • Topic er vanlegvis først i setninga; subjekt har ingen slik skranke
  • Subjektet speler ei prominent rolle i grammatiske prosessar, t.d. passivisering, refleksivisering, Equi «NP-deletion» (subjektet er ofte definert som det som kan kontrollerast utanfrå i infinitivskonstruksjonar, men sjå tough-movement), serielle verbkonstruksjonar, imperativisering, osb.

(Sjå au subjekt-identifikasjon, og kapittel 6 i Kroeger om topic/fokus.)

Topic-prominente språk vil overflatekode topic, men ikkje subjekt. Dei har ofte ikkje passivisering (eller berre passivtypar som viser «til gagns for/ulempe for»); ingen «dummy-subjekt»; kan ha dobbelt subjektkonstruksjonar. Topic-comment er den basale og uderiverte konstruksjonen i desse språka, som gjerne er verbfinale i tillegg.

1.2 kap.1

1.3 kap.2: Identifikasjon av konstituentar og kategoriar (testar!)

1.3.1 Testar for identifikasjon av ei syntaktisk eining (frase, konstituent)    PUGGE DEFINISJON

Teori-intern definisjon av frase, typisk berre gyldig for konfigurasjonelle språk:

Frase =DEF døtre til ei node i trestrukturen.

LFG opererer med SUBJ og OBJ som primitivar, ikkje definert av deira plass i treet / trekonfigurasjonar. Frasar / konstituentar treng ei empirisk fortolking.

Frasar, empirisk tolka:

  1. Kan bytta ut/byttast ut av enkeltord (t.d. pronomen)
  2. står for èin semantisk eining (forsiktig med denne!)
  3. kan fungere som antesedent for pronomen
  4. kan finnast ulike stader i ei setning
  5. finst i posisjonar som må vere unike
  6. kan flyttast rundt som ei eining (sjå pied piping)
  7. kan byttast ut med spørjeord
  8. kan vere svar på innhaldsspørsmål (t.d. kv-spørsmål)

Om du ikkje kan koordinere X, så er nok X ingen frase (men, dette er eit negativt kriterium; at du kan kordinere X tydar ikkje at X må vere ei frase)

1.3.2 Korleis identifisere syntaktiske ledd og funksjonar?

Nominale ledd får rolle frå verbet, der adverbiale definerer rolla si sjølve.

Universelt vs Språkspesifikt:

  1. Kva er subjekt objekt, adverbial osb. generelt/universelt?
  2. Korleis veit me kva som er subjekt objekt osb. i kvar enkeltsetning?

1.3.3 Morfologisk markering

1.3.3.1 Kjernemarkering («head-marking»)

Typisk på verbet, og nytta til å markere hovudsakleg subjekt, og kanskje objekt osv.

«The sheep eat(s) the man» – V bøygd av subjekt.

1.3.3.2 Dependentmarkering

Typisk på sjølve argumenta, og då først og framst på oblike, sist på subjekt.

«canis mordet serpentem» vs «canem mordet serpens»

1.3.4 Syntaktisk markering (vha. leddfølgje)

Ei frase, ein konstituent, kan typisk erstattast av eitt ord, og har felles permutasjon.

1.3.5 Subjekt (SUBJ)

(Sjå au subjektprominens vs topic-prominens, og subjekttesting på islandsk.)

Subjekt er gjerne kjenneteikna ved vid logisk rekkjevidde:

  1. Ein ørn (ruger alltid på utilgjengelege stader)
  2. Det ruger alltid (ein ørn på utilgjengelege stader)

Subjektet har privilegiet å (oftast) uttrykkje den potensielle handlaren.

Subjektet er eit nominalt ledd, så ingen PP, t.d.

Koreansk: Subjekt «honorification» – verbet kan få suffikset -si for å vise at talar respekterer subjektet. (k.8, s.212)

Refleksivar må på malayalam ha eit grammatisk subjekt som antesedent, men dei er ikkje leddbundne. (Sjå au krava til norske refleksivar.)

1.3.6 Primært objekt (OBJ) vs. sekundært objekt (OBJ_2)

(frå k.8, s.196)

Ordfølge: primært objekt må i mange språk vere rett ved verbet. T.d. i Swahili vil ein helst ha det rett etter V.

Samsvar: i Swahili må objektmarkøren samsvare med genus til primært objekt.

Passiv: Visse språk (Engelsk, Swahili) lar berre primært objekt promoveras til subjekt ved passivregelen. NB: dette gjeld ikkje norsk!

1.4 kap.3: Passiv, applikativ og «dativ-skifte»

Norsk og engelsk har perifrastisk passiv, medan japansk passiv er morfologisk (eit infiks i verbet er alt som skal til). Skiftet mellom aktiv og passiv er blant alle verdsspråka det vanlegaste diatesesystemet («voice», verbgenus)1.

Passivisering endrar ikkje på koplinga mellom verbrollar og referentar, men mellom verbrollar og syntaktisk funksjon. Ved passiv blir typisk patient promotert frå objekt til subjekt, og om agens er uttrykt, så er det som oblik. Ved upersonleg passiv blir ikkje ei gong patiens promotert, og det grammatiske subjektet er ikkje uttrykt. Upersonleg passiv gjer det mogleg å passivisere intransitive verb (t.d. «there was much rejoicing»). Den demoterte agensfrasa er ofte ikkje-obligatorisk, og nokon gonger umogleg å ha med.

Passiv blir typisk forma av aktivitetsverb med agens og patiens, og på visse språk kan det vere vanskeleg å passivisere andre typar verb, som ikkje-volisjonelle opplevarverb eller andre stative verb (verb utan varigheit eller spesifikt sluttpunkt).

Visse språk har ein passiv som berre blir nytta for uheldige eller utrivelege hendingar, kalt adversativ passiv. På japansk skiller denne passiven seg frå vanleg passiv ved at ei ny rolle blir introdusert, denne er negativt påverka av hendinga, i tillegg til at agens no vere uttrykt (som oblik). Den nye rolla får subjekt, og viss verbet er transitivt blir ikkje patiens promotert frå objekt.

1.4.1 Lenking

Eit verb i passiv har altså ulik morfologisk form og ulik subkategoriseringsramme i forhold til det same verbet i aktiv form.

Lenkingsreglar vil kunne tilordne grammatiske relasjonar til kvar semantisk rolle, som kan fjerne redundant leksikoninformasjon om dei verba som kan passiviserast.

Men det er mange unntak frå slike lenkingsreglar. Der opplevar-verb (og andre ikkje-agentive / stative verb) kan passiviserast er ofte situasjonen mykje meir kompleks, t.d. er stimulus subjekt for engelsk «please» («it pleases me»), medan opplevar er subjekt for «like» -- men i gamalengelsk var stimulus subjekt for like, t.d. «It liketh me not» (for: «eg liker det ikkje»).

Syntaktisk ergative språk har i tillegg veldig ulike reglar for transitive verb enn nominativ-akkusativ-språk som tysk, norsk og engelsk. Lenking er eit stort og vanskeleg tema, og det enklaste er sjølvsagt å nytte eit «fullformsleksikon» der kvart ord fullt ut spesifiserer lenkinga mellom rollene og funksjonane.

1.4.2 Konfigurasjonell vs relasjonell passiv-analyse

Konfigurasjonell analyse av passiv (frå transformasjonsgrammatikken): A-movement («argument-flytting»): :«Rapporten skrives av sekretæren»

    XP
   /  \
 NP    VP
/'\   /  \
 |   V   NP <--gap som blir flytta til «filler»-posisjonen
 |_______|

vs

Relasjonell analyse av passiv: avbildingsendring, det er verbet som kodar passivforskjellene, ikkje konstituentflytting: :R< x , y > <=> R< x , y >

  |   |            |   | 
  S   O          (OBL) S

Denne analysen gjer det mykje enklare å forklare t.d. passiv i Malayalam, som ikkje har flytting, men verbet får passiv-form og agens får kasus INSTR (tidlegare NOM), medan patiens får kasus NOM (tidlegare ACC).

Engelsk leksikal redundansregel for passiv: :OBJ => SUBJ :{ SUBJ => OBLag :| SUBJ => Ø }

1.4.3 s-passiv og bli-passiv – fjerning av argument    NORGLISH

S-passiv er litt modalt, gjentakande:

  1. Rapporten vil bli sendt til Bergen i morgon
  2. Rapporten vil sendast til Bergen i morgon

Norsk (bokmål) s-passiv er spesielt vanskeleg i preteritum der verbet endar i konsonant (*«I går kastets eplet mot ruten»).

Passiv er typisk for agentive verb, det understreker at noko blir gjort:

  1. Det trommar på taket – kanskje er det regnet?
  2. Det blir tromma på taket – nokon gjer det! 2

Passiv undertrykker subjektet, og fjerner dimed eit argument.

1.4.4 Pseudo-passiv – nye argument

  1. Aktiv: Han skar kjøt med kniven
  2. Vanleg passiv: Kjøt blei skore (med kniven)
  3. Upersonleg/presentativ passiv: Det blei skore kjøt med kniven
  4. Topikalisering: Kniven blei det skore kjøt med
  5. Pseudo-passiv: Kniven blei skore kjøt med

«Kniven» har i pseudo-passiven blitt forfremma til subjekt frå (ein del av) adverbialet, me har altså fått eit nytt argument. Dette er ikkje det same som topikaliseringen i 4 (frå 3), kor «det» fortsatt er subjekt.

Både i pseudo-passiven og i upersonleg/presentativ må objektet («kjøt») vere i ubestemt form. Så det ser ut som om båe desse konstruksjonane, som fjernar subjektet og let objektet bli ståande, treng eit subjekt og difor enten nyttar det semantisk tomme «det», eller forfremmar eit passande ord frå eit adverbialt ledd.

  1. Aktiv ditransitiv: Per gav Kari blomar/blomane
  2. Passiv frå d.t.: Kari blei gitt blomar/blomane
  3. Aktiv transitiv: Per gav blomar/blomane til Kari
  4. Pseudo-passiv: Kari blei gitt blomar/*blomane til

I 3 er Kari ein del av eit adverbial, som i 4 blir forfremma til subjekt. Her kan det resterande objektet som vist ikkje vere i bestemt form3.

  1. Engelsk pseudo-passiv: The house had been lived in
  2. Visstnok OK på norsk?: Hun hatet å bli holdt døren åpen for

Den engelske pseudo-passiven (eller «preposisjonspassiv») er berre grammatisk under visse komplekse semantiske vilkår.

1.4.4.1 Medial / «medio-passiv» på engelsk
  1. The book reads well

Dette er ingen passiv, det er ein aktiv form, syntaktisk sett. «well» må vere med her for å kunne seie dette. «the book», subjektet, synest å vere ganske agensaktig.

1.4.5 Kompleks passiv    SPML

Komplekse passivar på norsk kan ha passive transitive, eller uakkusative verb (altså dei med ei patiensliknande rolle).

  1. Mannen ble trodd rapportert antatt anbefalt forsøkt myrdet
  2. Mannen ble trodd rapportert antatt (*anbefalt) (*forsøkt) forsvunnet
  3. Mannen ble myrdet
  4. * Mannen ble forsvunnet

«forsvunnet» i 2 er eit uakkusativt verb, rolla er patiensliknande, men anbefale og forsøke treng agentive verb [i tillegg til at dei tek XCOMP der dei andre tek COMP???].

På grunn av dei mange innføyde leddsetningane, vil eit av-adverbial bli tvitydig.

1.4.6 Applikativ

I applikativ blir tematisk perifere argument / adjunkt koda til kjerneargument. T.d. i Chichewa:

OBL => OBJ
OBJ => OBJ2

  • verbmarkør '-ir-, -er-'

Applikativ endrar, som passiv, på argumentrelasjonar, men er ikkje eit skifte i diatese, sidan det same argumentet er subjekt. Det er typisk for bantuspråk (swahili, chichewa), au brukt i tigrinya.

Applikativobjektet kan ha ulike semantiske roller, og nokre gonger er applikativen einaste måte å markere ei rolle (t.d. benefaktiv i chichewa).

Bantuspråket kinyarwanda har ein applikativ som kan uttrykkjer benefaktiv og grunn/mål; ein som berre kan uttrykje grunn/mål; ein annan for instrument; ein for måte eller sekundære verktøy som i tillegg kan nyttast for instrument; og ein som kan nyttast om animate deltakarar som følgjer med agens, i tillegg til å kunne nyttast om måte. Semantikken til applikativar kan altså vere ganske kompleks.

Applikativ kan likne engelsk dativskifte, men engelsk har ingen morfologisk verbmarkering.

1.4.6.1 Primærobjekttesting
  1. Ordfølgje: OBJ1 er oftast nært verbet, men om samsvar er markert v/affiks gjeld ikkje lenger denne syntaktiske testen
  2. Samsvar: Hovudsamsvar (forutan SUBJ) er med primærobjektet. (I chichewa må verbet enten vere ved OBJ1, eller samsvare med det – verbet «gi» kan ikkje samsvare med gåva, men må samsvare med mottakar (om mottakar ikkje er ved verbet).)
  3. Passiv: Tema for «gi», gåva, kan i Chichewa ikkje bli SUBJ, berre mottakar kan få den rolla.
1.4.6.2 Chichewa

Applikativregel:
[V X] => [V X-ir]
OBL => OBJ
OBJ => OBJ2

  perek <agens, tema, mottakar>
         SUBJ    OBJ   OBL_rec

:perek-er <agens, tema, mottakar>

         SUBJ   OBJ_2   OBJ

Argument: Primærobjektet til «perek-er» viser same eigeskapar som OBJ i monotransitive verb.

Når eit verb er i båe passiv og applikativ, vil applikativregelen nyttast først, for å vere grammatisk. Eit teikn på dette er at applikativsuffikset er kopla nærare på rota («rot-er-edw», ikkje «rot-edw-er»). Dette følgjer av eit prinsipp formulert av Baker (1985), her litt omformulert av Kroeger (2004):

Speilprinsippet :
Affikseringsrekkjefølgja (frå insida og ut) reflekterer rekkjefølgja til avleiinga. Dvs., viss ein avleiingsprosess må nyttast før ein annan, så vil affikset frå den første prosessen ikkje vere lengre frå rota enn affikset som markerer den andre prosessen.

(Dette gjeld altså morfologisk avleiing/«derivation», og ikkje bøyiing/«inflection».)

1.4.6.3 Tigrinya

Tigrinya er eit abyssinsk semittisk språk, med SOV-følgje, obligatorisk subjektsamsvar, og objektsamsvar berre obligatorisk for bestemte objekt. Bestemte (definitte) objekt er «heva til subjektnivå», samtaletema, og ordfølgje er friare for bestemte objekt. Mottakarobjekt har samsvarsmarkør, så relativ følgje for indirekte/direkte objekt er fri.

Applikativ (i Tigrinya) lager OBJ av adjunktar som ikkje på forhand er subkategorisert av verbet. Applikativmarkøren -la blir nytta for argument som er «oppkonstruerte» for tilfellet, perifere, medan samsvarsmarkøren -wa for inherente/påkrevde argument.

  1. John died [ADJ for Saba] => John Saba-OBJ died
  2. Saba died [ADJ to John] => John-OBJ Saba died

Dei to ulike markeringane tildeler ulike semantiske roller (benefaktiv i 1, John gjorde det for ho, malefaktiv i 2, Saba er så godt som daud for John). Ein kan modifisere verbet slik at det krev fleire argument med spesifikke roller, legge til mål, opplevar; det er ulike markørar for nokon som er påverka/upåverka, medverkande/observerande og andre aktørar).

Argument for leksikal analyse: ofte ser me aldri det oblike (adverbiale) argumentet, som i ein transformasjonell analyse måtte vore der originalt.

1.4.7 Dativskifte

Dativskifte er eit subkategoriseringsmønster som visse engelske agens-tema-mottakar-verb tillet, kor mottakar-argumentet («dativargumentet») alternerer i markering:

  1. King John gave a beautiful palace to his daughter
  2. King John gave his daughter a beautiful palace

Tema kan berre passiviserast frå mønster 1, ikkje frå 2:

  1. A beautiful palace was given to the princess
  2. The princess was given a beautiful palace
  3. * A beautiful palace was given the princess

(Så tema kan berre passiviserast når mottakar er uttrykt adverbialt, på engelsk – på norsk går det derimot heilt greit å seie «Eit slott blei gitt prinsessa» / «Et slott ble gitt prinsessa» – vel, ganske greit iallfall.)

1.4.7.1 Benefaktiv-skifte og «possessor-effekten»

1.5 kap.4: Refleksivar (og anafori)    SPML

Visse pronomen er deiktiske, t.d. første- og andrepersonspronomen, tydinga deira avheng av ytringskonteksten. Andre er anaforiske, og får tydinga frå ein antesedent i diskursen. Tredjepersonspronomen kan nyttast båe anaforisk og deiktisk.

Pronomen:

Regulære (nokre kan nyttast anaforisk)Anaforiske (kan ikkje nyttast deiktisk)
EngelskI, you, he, she, it, we, theyhimself, herself, itself, each other
possessive ->his, hers, its, their, my, mineØ
Norskeg, du, han, ho, den, me, deiseg sjølv, deg sjølv, meg sjølv, kvarandre
possessive ->hans, hennar, deira, dykkarsin

Alle pronomena over (utanom 1. og 2.person???) kan ha ein antesedent, men dei anaforiske ha ein, ofte innan same ledd eller predikat (på norsk og engelsk må anaforiske antesedentar vere argument til same verb som pronomenet). Regulære pronomen derimot kan ha unemnde referentar. (Sjå Bresnan om uavhengige pronomen vs topic-anaforiske.)

Refleksivar er bundne anaforar. Dei har visse vilkår på antesedentane som vanlege pronomen ikkje har, om samsvar, domene og prominens.

På engelsk må refleksivar samsvare i person, genus og tal, i tillegg til at antesedenten må vere innanfor same minimale ledd (domene), og vere eit argument av høgare rang innanfor det leddet.

1.5.1 Bindingsprinsipp for norsk    SPML

  1. [Peri likte hamj ] (j ≠ i)
  2. [Peri sa [at Nilsj ikkje likte hamk ]] (j ≠ k, men kanskje i = k, dvs. [|ham|] kan vere Per, eller nokon andre, men ikkje Nils)

Faktorar for binding av pronomen og refleksivar på norsk:

  • Følgje/presedens: kjem antesedenten først?
  • c-kommando: er antesedenten «over» i frasehierarkiet?
  1. [Då Per kom,] fant han det (følgje)
  2. [Då han kom,] fant Per det (c-kommando)
  3. Per fant det [då han kom] (følgje og c-kommando)
  4. Han fant det [då Per kom] (ingen av delane, så [|han|] ≠ Per, ingen koreferanse)

Ein av faktorane må vere oppfylt på norsk; anten må antesedenten vere før, eller c-kommandere refleksiven, eller båe.4

Ein siste faktor på norsk er prominens til argumentet:

  1. Hunden til Per liker hanP\X (X ≠ H)
  2. Hunden til Per liker segH

I setning 1. kan Per vere antesedenten til «han», Per er ikkje argument til predikatet / i det minimale leddet, men possessor til eit argument. Per kan derimot ikkje vere antesedent til refleksiven i 2, av same grunn (jf. prominensprinsippet nedanfor). Same verknad får me med objekt til preposisjonar, desse er au «ikkje-argument» (sjå k.10 i Bresnan, og f-presedens/rangeringsskrankar for utdyping; ho har eit prominensprinsipp som er agnostisk i forhold til følgje (f-presedens) og syntaktisk rang – det er opp til det enkelte språk kva som er viktigast).

1.5.2 Bindingsprinsipp for engelsk (s.94)

Det relasjonelle hierarkiet:

mest prominentminst prominent
subjekt> objekt> oblike argument> ikkje-argument

Bindingsskrankar for refleksivar:

  1. Samsvar: Refleksive pronomen må samsvare med antesedenten i person, tal og kjønn
  2. Domeneskranke: Eit refleksivt pronomen må finne ein antesedent som er eit argument i sitt minimale ledd (til same predikat), dei er leddbundne
  3. Prominensskranke: Antesedenten må utrangere refleksiven på det relasjonelle hierarkiet (og må altså vere eit argument i leddet)

For vanlege pronomen er prominens viktig au, i tillegg til ordfølgje og diskursvirkningar / pragmatiske virkningar; men dei kan ikkje ta ein antesedent i same minimale ledd.

Refleksivar og ikkje-refleksive pronomen ser ut til å vere i komplementær distribusjon i forhold til kva som er grammatisk kor. Sjølv om dette ikkje gjeld overalt, er det ein ganske universell tverrspråkleg tendens.

1.5.3 Refleksive verb

  1. Per hygga seg
  2. Per vaska seg
  3. Per vaska seg sjølv
  4. * Per hygga seg sjølv

I 1 og 2 er «seg» er eit syntaktisk objekt utan referanse. hygge har ein PRED som ser slik ut: 'hygge<(^ SUBJ)>(^ OBJ)'. I 3 er «seg sjølv» refererande, og eit objektargument til vaske.

1.5.4 seg, sin og sjølv: subjektskrav og minimale ledd    SPML

  1. Per bad Kari om [å hjelpe hanP\X / segP\K / seg sjølvK / hoX ]
  2. Per fortalte Kari om hanX / *seg / seg sjølvP / hoX\K? / ?ho sjølvK

I 1 er Kari subjekt for XCOMP-leddet (via «be» si kontrollikning), medan 2 berre har eitt ledd, kor Per er subjekt.5

+ SUBJ- SUBJ
antesedent i minimalt leddseg sjølv, sin eigensjølv
antesedent ikkje i minimalt leddseg, sinhan/ho sjølv (???)

«seg» treng subjekt, men det treng ikkje vere i det minimale leddet.

«sjølv» treng ein antesedent i det minimale leddet.6 7

På islandsk kan «seg» referere til eit subjekt i hovudleddet, så lenge alle að-ledda er i konjunktiv – ved indikativ let ein ikkje langdistanseavhengnaden gå vidare. Jo meir referensielle uttrykk, jo vanskelegare er det med anaforar.

Fleire språk har langdistanserefleksivar, som altså kan ha antesedenten utanfor sitt minimale ledd. Det er ein tverrspråkleg tendens til at desse antesedentane må vere grammatiske subjekt (men koreanske 3.personsrefleksivar er eit motdøme her).

Rangering ved argumentstruktur: Tagalog-refleksiven er leddbunden, som den engelske, men i motsetning til dei andre språka her er den grammatiske relasjonen til antesedenten irrelevant, og dei kan seie «Seg sjølv er klandra av Maria» (for «Maria klandrar seg sjølv»). Prominensskranka deira går på semantiske roller i staden; Aktøren (det logiske subjektet, agens, opplevar) er alltid ein mogleg antesedent, uavhengig av grammatisk relasjon. Ein kan altså alltid passivisera ein refleksiv til subjekt, medan refleksiven sjølv aldri kan vere Aktør (og dermed sin eigen antesedent). Ikkje-Aktørar kan au vere antesedentar, i fleirtydige setningar. For filippinske språk gjeld altså ikkje prominens ved det relasjonelle hierarkiet, men ved rollehierarkiet:

mest prominentminst prominent
Aktør> alle andre argument> ikkje-argument

1.5.5 Emfatiske pronomen og apposisjon

Refleksivar har ein semantisk rolle og grammatisk relasjon som er uavhengig av antesedenten, medan emfatiske pronomen står i apposisjon til antesedenten, og deler rolle og relasjon med denne.

  1. The Governor himself will appoint the new police chief.

(På engelsk er tilfeldigvis emfatiske og refleksive pronomenar formelt like.)

1.5.6 Krysskopling av anaforar

  1. Dette er ulykkai som Kari spurte kvenj Nils sa at _j forårsaka _i
  2. ? Dette er manneni som Kari spurte kva for ulykkej Nils sa at _i forårsaka _j
  3. Lingvistari er det mykjej Petter ikkje kan snakke omj medi
  4. ? Lingvistari er det mykjej Petter ikkje kan snakke medi omj

I 1 og 3 er det første ordet kopla til det siste, og dei midtre med kvarandre, medan i 2 og 4 er koplingane kryssa, og dei blir difor vanskelegare å prosessere (dei var vel eigentleg vanskelege nok i utgangspunktet).

1.6 kap.5: Kontroll (equi vs raising, anafor vs funksjonell)

1.6.1 Leksikalsk vs syntaktisk determinert kontroll

  1. [Etter å ha blitt vist eit bilete av seg sjølvP ], fortalte Per Kari alt

Denne setninga har syntaktisk determinert kontroll, hovudleddsverbet er her uviktig. Det kontrollerte leddet er eit XADJ-ledd.

Leksikalsk determinert kontroll:

  1. Per nekta meg [å framheve meg sjølv / * seg sjølv]
  2. Eg nekta Per [å framheve * meg sjølv / seg sjølv]

Kvifor seier me ikkje berre at infinitivskonstruksjonen inkluderer meg/Per som subjekt? («Eg nekta [Per å framheve seg sjølv]») Då ville me ha måtte forklart korleis eit subjekt (i 1) kunne ha ein oblik kasus på norsk, og korleis «seg» kan vere subjekt i «Per nekta seg å gjere det» (i tillegg til at passiv gjer det endå rarare: «Per blei nekta å gjere det»). I staden seier me at objektet til nekte er lik subjektet i infinitivskonstruksjonen, XCOMP-leddet.

  1. I forced him to be kind
  2. I believed him to be kind

I 1 er «him» og «to be kind» to ulike argument til force, medan i 2 er «him to be kind» eitt argument til believe. P&P (transformasjonsgrammatikk) analyserer dette som at to ulike «dype» c-strukturar vha. transformasjonar gav opphav til omtrent same overflatestruktur, men det blir litt søkt sidan passivisering på 1 og 2 gir same form («He was forced/believed to be kind»). I LFG har verba denne a-strukturen:

  1. 'force<(^ SUBJ)(^ OBJ)(^ XCOMP)>'
  2. 'believe<(^ SUBJ)(^ XCOMP)>(^ OBJ)'

som viser at for believe er objektet ikkje ein del av argumenta til predikatet, men ei kontrollikning (fått frå det leksikale oppslaget til verbet) gjer at objektet blir subjekt i infinitivskonstruksjonen. Elles er c-strukturen lik, som passar saman med at passivisering gir lik c-struktur.

1.6.2 Anaforkontroll vs funksjonell kontroll    SPML

Anaforkontroll er t.d. det me finn i engelske gerunds:

  1. _ Praising himself got John into trouble
  2. His praising himself got John into trouble

Ved anaforkontroll er den kontrollerte eit NULL-pronomen som kan byttast ut med eit overt pronomen (difor er leddet COMP/ADJ heller enn XCOMP/XADJ ???). Anaforkontrollkonstruksjonar kan klare seg utan kontrollør, den kontrollerte får då vilkårleg referanse.

Kontrolløren i anaforkontroll kan vere subjekt, objekt, possessor; og kan vere i høgare ledd/setningar (sidan den kontrollerte er eit (NULL)pronomen). Den kontrollerte kan vere ein annan term (direkte argument) enn subjekt.

Funksjonell kontroll er t.d. det me finn i engelske partisippar:

  1. _ Praising himself, John got out of trouble
  2. * His praising himself, John got out of trouble

Ved funksjonell kontroll er kontrollør og kontrollert funksjonelt identifisert, som i (↑ XCOMP SUBJ) = (↑ SUBJ). Sidan funksjonell kontroll ikkje har eige subjekt, er underleddet ope (XADJ eller XCOMP).

Kontrolløren i funksjonell kontroll må vere eit argument av det nærverande matriseleddet. Den kontrollerte må vere hovudleddssubjekt (er dette rett???).

1.6.3 Komplement og adjunkt

(Sjå og denne PDF-en om dei ulike funksjonane i f-strukturar.)

1.6.3.1 XCOMP

XCOMP er t.d. infinitivskonstruksjonar (å), eller visse relativsetningar (t.d. NP-en «han som las boka»). Det ligg i XCOMP at dei får subjekt utanfrå.

1.6.3.2 COMP (SCOMP)    SPML

COMP er t.d. at-setningar, eller visse relativsetningar (t.d. NP-en «boka som eg las»). Har overt SUBJ. På norsk må COMP vere finitt (???).

1.6.3.3 XADJ

XADJ er adjunkt som ikkje har overt SUBJ

1.6.3.4 ADJ (SADJ)    SPML

SADJ er adjunkt som har overt SUBJ. (Døme: «He works [ADJ in the morning]» – korrekt???)

1.6.4 Equi vs Raising

Equi og Raising er to predikatklasser8. Dei:

  • har same frasestruktur
  • har same grammatiske relasjonar
  • har ulike semantiske rolletildelingar
  • tek infinitive XCOMP
1.6.4.1 Equi
  • subjekt med vilje
    • try, plan, pretend, intend, refuse, agree, hope, eager, reluctant
  • kan ha utvalsskrankar på subjekt:
    1. * it tries to be raining
  • Passivisering endrar proposisjonen
    • (det nye) subjektet blir alltid agens
  • a-struktur på forma 'foo<(^ SUBJ)(^ OBJ)(^ XCOMP)>' – «transitivt»

Det er ei kopling mellom Equi-verb og rotmodalitet hos dei norske modale hjelpeverba; eit modalt hjelpeverb i rottolking har same a-struktur som Equi-verb.

1.6.4.2 Raising
  • tilfeldige omstende
    • seem, appear, likely, certain, tend, begin, tough
  • kan ha eksplitive subjekt / «dummy subjects» (ikkje-refererande, utan PRED):
    1. it seems to be raining (verb har utvalsskrankar på argument, og berre argument, så raising-verb har ingen skrankar på subjekt)
  • Passivisering gir same proposisjon
  • kan la ein del («chunk») av eit idiom bli subjekt, med same idiomatiske tyding
  • a-struktur på forma 'foo<(^ SUBJ)(^ XCOMP)>(^ OBJ)' - «intransitivt»

Det er ei kopling mellom Raising-verb og epistemisk modalitet hos dei norske modale hjelpeverba; eit epistemisk tolka modalt hjelpeverb har same a-struktur som Raising-verb.

Tough-movement (transformasjonsgrammatisk omgrep) er når den kontrollerte er noko anna enn det grammatiske subjektet. T.d. vil konstruksjonar med visse adjektivar i Engelsk som tek infinitive komplement vise ein slik funksjonstilordning; i 1. nedenfor er John objekt for infinitivskomplementet, medan i 2. er han subjekt:

  1. John is tough to please
  2. John is eager to please
1.6.4.3 Modalitetar

Ein rotmodalitet kan vere:

  • deontisk
  • habilitativ
  • obligativ
  • volitativ

(Dei tre siste er subjektorienterte.)

rotepistemisk
har plikt tildet må visst vere slik at
kanhar lov til, er i stand tildet kan jo vere slik at
vilhar lyst tilkjem til å
skalhar plikt tilkjem til å, det skal visst vere slik at

På norsk (vanleg bokmål iallfall) vil fleire modale hjelpeverb på rad, for nokre av verba iallfall, vere utvitydiggjort ved dei verba som kjem etterpå:

  1. Han må ha kunne ville dreie handtaket

Her er og kunne iallfall epistemisk, medan ville er tvitydig (men i setninga «Studentane må ha levert før 3», der me har ein tidsfrist med, er tvitydig igjen, så det er ikkje heilt enkelt).

1.7 kap.6: Tema/rema, fokus/føresetnad, pragmatikk

Diskursfunksjoner:TOP FOCSUBJ
ikkje-argument DFargumentfunksjon og DF
(Sjå au subjektprominens vs topic-prominens)

Topic / tema: Gitt. Det setninga er «om», noko som er kjend for tilhøyrar (eller mogleg å resonnere seg til frå kontekst). (Rema er omtrent som «comment» til topic.) Tema treng gjerne lite markering, t.d. pronomen utan trykk, samsvarsmarkering i «pro-drop»-språk eller heilt borte (NULL-anafor). Men, temaendring, temakontrast eller temaval kan trenge markering.

Fokus: Nytt. Ny informasjon, ukjend, tilføyer viten. Fokus er ofte markert ved ordfølgje og/eller partiklar/klitika.

1.7.1 Kva vil det seie at noko er «gitt» eller «nytt»?

  1. Eg såg far din i går

«far din» har fokus-trykk, så det er «nytt», men referensielt er det jo gitt, sidan tilhøyrar jo kjenner til sin eigen far.

  • Referensielt gitt: har ein kjent referent. Ofte bestemt form.
  • Gitt innhald:
    1. Per er glad i maleri, han kjøpte eitt i dag («eitt» har gitt innhald her)
  • Relasjonelt gitt: Relasjonen til eit predikat er gitt.
    1. Kven beit postbudet? – Hunden (beit postbudet).

Gitt innhald og relasjonelt gitt er typisk for TOPIC.

Det er ein tendens til at det første i setningen (i topicposisjonen) har vidast logisk rekkjevidde, med mindre det er tydeleg innhaldsgitt. Topic er referensielt primært, du tek utgangspunkt i det. Kvantorane kan vise dette sanningsfunksjonelt; om topic ikkje skal vere vidast, men tydeleg innhaldsgitt, må me konstruere ein kontekst kor dette skjer, t.d. «Finst det eit semester kor dei tek to eksamenar? -Jo, to eksamenar tek alle studentane i første semester», her kan me tolke skopet som ∀ x ∃2y (sjå standardfølgja i delen om topic-prominens).

Prosodi gir lågast kvantorskop, smalare rekkjevidde («/alle/ studentane vil ikkje ta eksamen» - ikkje alle vil).

1.7.2 Markering av topic og fokus

  • Topic/Comment
    • Topikalisering / Kontrastivt tema
    • Venstre-dislokering (med resumptivt pronomen)
      1. Per, har du sett han?
    • Eksternt tema (nytter eit adverbial, det er ikkje grammatisk topic, berre eit adverbial «som veldig uttrykkeleg er topic»)
      1. Når det gjeld Per, så har han reist
  • Fokus/Presupposition
    • Utbryting (clefts)
      • Pseudo-utbryting
    • Fokuserande adverb («bare», «først og fremst»)
    • Prosodi

Fokusering ved utbryting:

  1. Det var bror din som bygde dette huset.

Engelsk markering: Fronting.

  1. Kontrastivt tema: John we managed to rescue; his dog we never found _
  2. Venstre-dislokering: My friend John, a snake bit him on the hand
  3. Eksternt tema: As for John, a python swallowed his dog

I 1, ein typisk norsk topikalisering, har me gap-strategien, medan 2 og 3 nyttar resumptive pronomen («him» og «his»).

1.7.3 Adjunkt-topics vs «dangling» topics m/semantisk lenking    SPML

Mandarin-kinesisk er topic-prominent, og har omtrent ingen bøying (og difor veldig rigid ordfølgje). I motsetning til dei fleste andre (subjekt-prominente) språk kan dei ha fleire topics i eitt ledd.

Kinesisk har to strategiar for vanlege topics. I ekstraksjonsstrategien (gap-filler) er lenkingen funksjonell; medan i resumptivt-pronomen-strategien er lenkingen anaforisk. Båe desse strategiane blir nytta for adjunkt-topics, kor topic i tillegg har den grammatiske funksjonen adjunkt (t.d. lokativt).

Anaforisk lenking med resumptive pronomen blir nytta for å topikalisere «utilgjengelege» funksjonar som POSS, OBJ2 eller objekt til preposisjonar og serielle verb (sjå relativiseringshierarkiet for relativsetningar).

I tillegg kan kinesisk ha «dangling topics», kor lenkingen er reint semantisk: :(24a) shûiguô tã zuì xîhuan píngguô

     frukt     han   mest like   eple
     TOPIC    «SUBJ»             «OBJ»

Her er topic utanfor rolleramma (argumentstrukturen), og berre innskrenkar domenet. Språk med «dangling» topics, kor topic ikkje er gitt ei argumentrolle, kan au ha relativsetningar kor hovudet ikkje speler ei rolle (jf. den store likskapen mellom topic-comment-strukturen og relativsetningar). «Dangling topics» har altså heller ingen adjunktfunksjon.

Gamalnorsk: «desse ting du no har spurt om, kan eg ikkje gjere deg vis» – det manglar eit «om» til slutt, temaet/relativsetninga (???) har ingen plass til ein kjerne.

1.7.4 Identifikasjon av topic og fokus

Eit spørjeord må ha pragmatisk fokus, som ikkje er kompatibelt med topicfunksjonen.

Topic kan gjerne vere bestemte (eller generiske, som på kinesisk), men sjelden ubestemte (aldri på kinesisk).

1.7.5 Semantikk vs Pragmatikk

(1) Per klipte plenen
(2) [FOC Det var Per] [PRESUPPOSITION som klipte plenen]

1.7.5.1 Montague, Richard: Formell semantikk og λ-kalkyle.

Semantikk er deiktiske referentar, aktørar i talesituasjonen, eller, semantikk er det som gir sanningsvilkåra, det som avgjer om setninga si påstand er sann.

Pragmatikk er det som gir påstanden «valør».

«Felicity conditions vs Truth conditions»:

Det er eit hovudsakleg pragmatisk skille mellom setning (1) og (2). Men ein kan au finne forskjell i sanningsvilkår her; (2) fungerer ikkje om Kari au klipte plenen, dette er ulikskap i sanningsvilkår (men (1) kan au lesast telisk – at Per klipte heile plenen – og då er heller ikkje (1) sann om Kari au var med og klipte).

1.7.5.2 Typisk «lingvistskille» mellom semantikk og pragmatikk

Semantikk: det som er uttrykt i setninga

Pragmatikk: det som berre ligg i situasjonen.

Setning (1) er «nøytral» når det gjeld om Per er «ny informasjon» eller ikkje, Per kan vere ny i ein gitt situasjon, men i (2) gir semantikken denne informasjonen at Per er det nye9.

1.7.5.3 Eller?

Pragmatikk: diskurssituasjonen

Syntaks (Συν – ταξις): den skildra situasjonen

1.7.6 Omgrepsavklaring: Tema/rema vs topic/comment

Tema og Rema er omtrent som TOPIC og COMMENT, men ikkje heilt det same (litt ulike tydingar i ulike lingvistiske tradisjonar). Og «theme» blir jo oftast nytta som den nøytrale semantiske rolla, medan Lyons kaller det språklege uttrykket theme, vs topic som tingen sjølv (referenten?).

1.8 kap.7: Langdistanseavhengnader og relativisering

Norske langdistanseavhengnader: topikalisering, kv-spørsmål og relativsetningar. Kv-spørsmål er langdistanseavhengig på dei fleste språk (utanom t.d. vietnamesisk og kinesisk, kor dei nyttar resumptive pronomen).

(«Ekstraksjon» = filler/gaps osb.)

1.8.1 Relativsetningar i LFG

Korleis viser me i trekkstrukturen at Per las same boka som Per las i NP-en «boka som Per las»? Me får iallfall ein struktur som har dette i seg: :|PRED 'bok' | :| |PRED 'lese<(^ SUBJ)(^ OBJ)>' | | :|ADJUNCT {|SUBJ «Per» |} | :| |OBJ [] | |

Objektet til lese må vere boka i den ytre strukturen. Ein metode er ha ei syklisk kopling, og unifisere objektet med den ytre strukturen.

Ein annan metode er å la semantikken handtere at dei er like. Me legg til eit attributt TOPIC-REL i adjunktet med PRED='pro', som må unifisere med det indre objektet (eller det indre subjektet, alt ettersom), og samsvare med den ytre strukturen. I NP-en «huset som er rødt» vil då TOPIC-REL (og det indre subjektet, ved unifikasjon) få informasjon om nøytrumsgenus frå «rødt», og dette må då samsvare med den ytre strukturen, som har same genus frå «huset». Sidan TOPIC-REL ikkje er unifisert med den ytre strukturen, må dei koindekserast slik at semantikken kan kople dei saman.

Samsvar skjer då i NP-regelen, vha. unifikasjon med (↓ TOPIC-REL) som kan vere dypt innføyd (så her må ein nytte funksjonell utryggleik).

1.8.2 Relativiseringshierarkiet

Det er ein stor likskap mellom topic-comment-konstruksjonar og relativisering; språk med topic-konstruksjonar av ein type vil lett kunne relativisere same konstruksjon.

Visse funksjonar er lettare å relativisere enn andre, i følgje relativiseringshierarkiet til Keenan og Comrie (1977): :SUBJ > OBJ > OBL > POSS (kor SUBJ er lettare å relativisere – «mannen som går der», medan POSS er vanskeleg – «mannen hvis kone går der»; i tillegg finst funksjonar som preposisjonsobjekt og objekt til serielle verb, som au er vanskelege å relativisere/topikalisere)

På norsk må «som» vere der når kjerna i relativsetninga er subjekt internt i relativsetninga, for å unngå fleirtydige setningar:

  1. Internt objekt: Guten (som) eg såg
  2. Internt subjekt: Guten som var her
  3. Han sa (at) det regna
  4. At det regna, var ei velsigning

«at» og «som» er strukturindikatorar («som» er forresten ikkje relativt pronomen, men ein «relativizer»).

Interrogert subjekt treng (oftast?) som:

  1. Internt subjekt: Han spurte kven som var med
  2. Internt objekt: Han spurte kven (?som) dei såg

(1. kan vere grammatisk utan «som» viss det er sitering)

1.8.3 Restriktiv vs ikkje-restriktiv relativisering

Om relativsetninga er naudsyn for å avgrense referansen, er han restriktiv.

  1. [NP Per, som står der,] (restriktiv)
  2. [NP Studenten, som (forresten) står der,] (restriktiv)
  3. [NP Studenten som står der] (ikkje-restriktiv)

Har å gjere med referensiell tyngd.

1.8.4 Strategiar

1.8.4.1 Gap-strategi
1.8.4.2 Resumptivt pronomen («pronoun retention»)

Resumptive pronomen er leddinterne og opptrer på plassen assosiert med deira grammatiske funksjon.

Svensk nyttar resumptive pronomen mykje meir enn norsk, t.d. «vem sa du att jag inte vet vad han heter _?», noko som forresten ikkje går på engelsk, med eller utan r.p.

Vietnamesisk og japansk har spørjeord in situ, som i norske ekkospørsmål – «du traff kven10.

1.8.4.3 Relativt pronomen

Som resumptive, men førekjem først i relativsetninga (kjem alltid før det modifiserande leddet). Det relative pronomenet fyller «gap»-et, og fungerer som tema for det modifiserande leddet. Det kan (1) vere hovud i det modifiserande leddet i tillegg til å stå i anafor med antesedenten; eller (2) stå saman med eit anna ord (dog) som utgjør kjerne, utan å vere i anaforisk kopling til antesedenten.

(1) der Manni, [deni [Marie liebt ___ ]] (2) the mani, [whosei dog [John killed ___ ]]

Heile leddet er i tillegg del av eit større ledd.

1.8.4.4 Relativisert argument uttrykt ved full NP (intern kjerne / korrellativ)

1.8.5 Øy-fenomen («island phenomena») s.168

Øyer er isolerte (duh), du kan ikkje trekke ut frå eller refleksere inn i dei.

Engelske øyer:

  • Koordinering, A and B
    1. They got A and B today
    2. * This is the man / B whom they got [A and ] today
  • Indirekte spørsmål
    1. I don't know [how much he gave Thelma]
    2. * Thelma's the girl that I don't know [how much he gave ]
    3. Men greit nok på norsk: Thelma er jenta som eg ikkje veit kor mykje han gav
  • That-trace
    1. This is the boy who you said (* that) was ill
    2. Men det går på norsk: Dette er guten som du sa (at) var syk
  • Komplekse NP-ar / NP-øyar
    1. The police are denying [reports that he helped Louise escape]
    2. * I saw the guy that the police are denying [reports that _ helped Louise escape]
    3. Eg kjenner guten som politiet har mistanke om (at) er skyldig
    4. * Eg kjenner guten som politiet har mistanken om (at) er skyldig

(Ved bestemt form «mistanken» blir relativiseringa/ekstraksjonen ugrammatisk, pga. konflikt med referensiell tyngd.)

1.8.6 Fyll-gap-konstruksjonar (ekstraksjon)

Gap/filler er ein term frå transformasjonsgrammatikken, dei snakka om \bar{A}-movement (altså «ikkje-argument-flytting»): :Desse kakene sa Petter [at Kari meinte [(at) – var gode]] :_FILLER__/ GAP

LFG analyserer det same utan flytting.

Fyllet kan ha ein grammatisk relasjon og ei semantisk rolle i eit ledd som det ikkje er strukturelt ein del av; i tillegg vil det typisk ha ein spesiell pragmatisk funksjon. I dei fleste språk er det ingen grenser for antall ledd mellom fyll og gap («unbounded dependency»), men jo djupare gapet er i forhold til fyllet, jo meir sannsynleg er det at me får eit resumptivt pronomen i gapet.

1.9 kap.8: Kausativar    SPML

Kausativar skildrar ein semantisk kompleks situasjon kor ei hending forårsaker ei anna. Kausative uttrykk lager komplekse predikat, anten syntaktisk (2.), morfologisk eller leksikalt (3.):

  1. My cat died
  2. She caused my cat to die
  3. She killed my cat

Den som forårsaker, agens i første hending, er kausanten; dette skaper den forårsaka hendinga, der det mest prominente argumentet (subjektet i eit enkelt ledd som skildrar hendinga) er kausaten.

(Morfologiske døme???)

Kausativtypar:

  1. Perifrastisk (analytisk)
    • To separate verb. Dei fleste språk har dette (på tigrinya er denne utvitydig direkte).
    • Eitt ledd: serielle verb (k.9)
    • To ledd: leksikalt determinert kontroll (k.5)
  2. Leksikal
    • Analysert som transitive predikat
    • Årsak er ein del av verbets semantiske tyding
      • kill = «cause to die»
    • Ofte, men ikkje alltid, er det ein fonologisk likskap:
      • fell = «cause to fall»
      • feed = «cause to eat»
  3. Morfologisk
    • Affiksering på verbet deriverer kausativen frå eit enkelt predikat (på tigrinya er denne tvitydig mellom direkte og indirekte).
    • Engelsk har suffiks for å lage kausativar av adjektiv og substantiv, men ingen produktiv morfologisk prosess for å lage kausative verb frå verbale røter. (Det same gjeld norsk???)
    • Valensauking: Argumentstrukturen blir endra, eit nytt argument, kausanten / forårsakaren / «causer», kjem til.
      • Dette nye argumentet, kausanten, er nesten alltid subjekt11.
      • Kausaten kan ha ulike moglege funksjonar, her finst to hovudmønstre (sjå neste del).

Refleksivar treng ein antesedent i same «minimale» ledd, dette kan nyttast for å teste om ein perifrastisk kausativ er monoklausal eller biklausal. På tyrkiske er subjektet ein del av same ledd som kausaten, så dei har monoklausal kausativ, medan japansk og bantuspråket chimiwiini har biklausale (fransk har båe).

Perifrastisk kausativ: :make-die<agens, Event>

        SUBJ   die<patiens>
                   OBJ

   (^ XCOMP SUBJ)=(^ OBJ) (???)

Leksikal kausativ: :kill<agens, patiens>

    SUBJ   OBJ

Morfologisk kausativ: :cause<agens, Event>

     SUBJ   die<patiens>
                OBJ

(men det er berre eitt ledd, oftast)

1.9.1 «Status of the causee» (Kausat som OBJ, eller kausat som OBJ_2/OBL?)    SPML

Mottakar/mål i enkle ditransitive konstruksjonar i eit gitt språk gir ein god peikepinn på kva for grammatisk relasjon kausaten får. Det finst i følgje Baker (1988) to hovudkonfigurasjonar:

  • Kausaten stel primærobjekt: I språk kor er mottakar OBJ og tema (t.d. gåve) OBJ_2, blir oftast ein transitiv kausat au primært OBJ, medan det som før var primært objekt blir dytta ned til OBJ_2. (Dette skjer t.d. på engelsk???)
  • Kausaten tek første ledige: I språk kor ditransitive tema held på status som OBJ og mottakar er OBL eller OBJ_2 med ein spesifikk kasus (som dativ), blir kausaten au OBL/OBJ_2. Dette skjer på tyrkisk, malayalam, tysk og koreansk, kor tema er det einaste som kan passiviserast.

Altså, viss mottakar er primærobjekt, så er det ein sterk tendens til at den transitive kausaten er primærobjekt au. (Kausaten kan au vere subjekt i sitt eige ledd, ved biklausale kausativar; sjå nedanfor.)

På tigrinya er det ikkje mogleg å passivisere kausativen morfologisk (men det er mogleg å passivisere båe tema og kausat perifrastisk). Så passiv kan ikkje nyttast til å teste objektstatus. Men: kausativ av intransitiv får same markering og samsvar som vanleg transitiv.

På swahili og engelsk må primært objekt vere rett ved verbet. På swahili vil berre det primære og ikkje det sekundære objektet samsvare med verbet, og ved passiv av kausativ vil kausanten få same OBL som ved vanleg passiv oblik agens.

Einaste test for primært/sekundært objekt ved tigrinya-kausativen er at primærobjektet har verbsamsvar, men sidan me ikkje kan passivisere uansett, er det kanskje irrellevant.

1.9.2 Kausaten som «første ledige grammatiske relasjon»

Comrie (1981) seier at den grammatiske relasjonen (GR) til kausaten i språk som tyrkisk kan føreseiast frå det relasjonelle hierarkiet: kausaten vil alltid få den høgaste relasjonen på hierarkiet som ikkje er ein del av subkategoriseringsramma til basisverbet, altså den neste tilgjengelege GR:

Subkategorisering av basisverbGR til kausaten
SUBJOBJ
SUBJ, OBJOBJ2
SUBJ, OBJ, OBJ2OBL
SUBJ, OBJ2 / OBLOBJ (neste tilgjengelege på hierarkiet)

1.9.3 Semantikken til kausativar

Det finst ofte ulike måtar å markere kausaten innanfor språk, og desse korrelerer ofte med semantiske kontrastar, t.d. kor påverka kausaten er, kor mykje kontroll kausaten har eller om handlinga er direkte eller indirekte.

Når det finst eit val mellom å markere kausaten som objekt eller oblik, vil kausaten oftast markerast som objekt når dei har mindre kontroll over situasjonen, mindre fri vilje eller er meir direkte påverka; og oftare som oblik når dei har meir kontroll, fri vilje eller når forårsakinga er meir indirekte.

1.9.3.1 Direkte vs mediert (indirekte)

Direkte forårsaking er vanlegvis intendert eller planlagt, medan ein indirekte forårsaka handling ikkje treng vere intendert, men kan vere eit tilfeldig resultat.

Leksikale kausativar, som «kill» er oftare direkte enn perifrastiske («cause to die»). På malayalam er den leksikale alltid direkte, medan den meir produktive morfologiske gjerne kan vere indirekte.

1.9.3.2 (Fysisk) manipulasjon vs (verbal) instruksjon

Leksikale kausativar impliserer oftare fysisk manipulasjon, i motsetning til perifrastiske. Visse japanske leksikale kausativar kan berre nyttast med inanimate kausatar, medan den morfologiske er ugrammatisk med inanimate kausatar, og er fleirtydig (mellom manipulasjon og instruksjon) med animate kausatar.

Val mellom kasusmarkering på kausaten kan gjerne markere kontrastar, som at ein dativ kausat tydar på fysisk manipulasjon frå kausanten, medan dette ikkje treng gjelde om kausaten er OBL_INSTR (på det dravidiske språket telugu).

1.9.3.3 Tvang («coercion») vs nøytral/balansert vs tillating

Kor mykje val har kausaten? Får kausaten berre lov til å gjere det?

  1. Tvang: John made his daughter watch TV
  2. Tillating: John allowed his daughter to watch TV
  3. Nøytral: John had his daughter watch TV

Morfologiske kausativar er ofte fleirtydige her. Igjen kan kasus indikere kor mykje kontroll kausaten har; t.d. er dativ-kausatar moglege på japansk. Dativ gir på japansk ei meir balansert/tillatande tyding, t.d. at kausaten gjer handlinga av eigen vilje.

1.9.3.4 «Ingestivar» og «affekt»    NORGLISH

Med ingestive eller perseptuelle transitive verb, som «drikke» eller «sjå», er kausanten ofte meir interessert i kva som skjer med kausaten enn med patiens (t.d. i setninga «Eg fekk ho til å drikke vatnet», vs den ikkje-ingestive «Eg fekk ho til å sleppe øksa»), og kausaten vil med morfologiske kausativar frå ingestive transitive røter følgje kasusmønsteret som elles er assosiert med intransitive kausativar.

I eit typisk transitivt verb er patiens det same som «Undergoer», den som handlinga rører ved. Med ingestive verb vil agens (kausativt: kausaten) vere den som er rørt ved, og kausantens handlingar, formål eller intensjon er primært retta mot kausaten (dvs. «Undergoer»).

På engelsk og norsk nyttar ein her ofte ikkje-kausativar, som i «gi ho noko å drikke», og ofte vil patiens vere heilt utelate. På malayalam, som vanlegvis gjer kausaten oblik, kan ein med ingestive verb velje mellom primærobjekt eller oblik, avhengig av kva intensjonen til kausanten er, kven kausanten er interessert i (eller kven som er X i spørsmålet «Kva gjorde kausanten med/til X»?).

1.9.4 Strukturen til kausative ledd (eitt eller to?)

Dei fleste morfologiske kausativar er monoklausale, men det finst evidens for biklausale morfologiske kausativar au. Ved biklausale kausativar vil kausaten vere subjekt i eit underordna ledd (eller kontrollør til eit underordna subjekt).

Chimwiini og japansk er språk som har biklausale kausativar, der dei biklausale hovudsakleg er permissive medan dei monoklausale indikerer tvang; i tillegg vil kausaten i sitt ledd vere subjekt.

1.9.5 (Eg nyttar kausant og kausat høvesvis «causer» og «causee»)    NORGLISH

1.10 kap.9: Serielle verb (ikkje pensum?)

Karakteristika ved serielle verb-konstruksjonar:

  • ein prototypisk SVC har minst to morfologisk uavhengige verb innan samme ledd, og ingen av desse er AUX
  • ingen konjunksjonar eller «overte» subjunksjonsmarkørar eller koordinasjon separerer dei to verba
  • dei serielle verba høyrer til èin intonasjonskontur, utan ein pause til å separere verba
  • heile SVC-en refererer til èi (kanskje kompleks) hending
  • ein ekte SVC har berre ein spesifikasjon for tid, aspekt, modalitet, negasjon osb., sjølv om desse ofte er overflødig markert på båe verba
  • dei to SVC-verba deler minst eitt semantisk argument
  • obligatorisk koreferanse: ein ekte SVC vil ikkje ha to «overte» NP-ar som refererer til same argument
  • ein prototypisk SVC har berre eitt grammatisk subjekt

Hovudpoenget er at ein seriell verb-konstruksjon er innanfor eitt ledd.

1.11 kap.10: Kasus og Quirky Case

«Case is a system of marking dependent nouns for the type of relationships they bear to their heads»-Blake 2001:1

«Standardmarkering» i germanske språk er OBJ-acc, SUBJ-nom osb.

Strukturell kasus: SUBJ -> nom, OBJ -> acc, IOBJ -> dat, uavhenging av θ-rolle. Argument kan få endra kasus etter syntaktiske operasjonar som passivisering; kasus kjem altså frå ein strukturell konfigurasjon.

vs

Inherent kasus: leksikalt stipulert og (relativt) upåverka av t.d. passivisering. Mål/benefaktiv -> dativ, instrumental -> instrumentalis, osb.

Quirky Case: avvik frå språkets standardmarkering (Miriam Butt: Theories of Case)

1.11.1 Leksikalt stipulert kasus

Tyske preposisjonar har leksikalt stipulert (inherent) kasus:

  • acc <- durch für gegen ohne um
  • dat <- aus ausser bei mit nach zeit von zu
  • båe <- an auf hinter in neben über unten vor zwischen (semantisk styrt, avhengig av om det er på (dat) eller til (acc) området)

(Engelsk er enklare sidan alle har acc/objektkasus: «to him / * he».)

Visse verb på tysk får dativsubjekt fordi [|rolla|] ikkje er påverka (altså opprinneleg semantisk styrt, men no konvensjonelt fastsatt; ikkje alle verb kor referenten til rolla ikkje er påverka får dativ):

  • dat <- antworten begegnen danken fluchen folgen

Desse verba har idiosynkratiske leksikale eigenskapar, spesifisert vha. [OBJ CASE]=dative / [OBJ CASE DATIVE]=+ , men: subjekttesting viser at dativmarkering på subjektet på tysk ikkje held ved syntaktiske operasjonar som passivisering (og ikkje i det heile ved Equi-kontroll av passiven), kor me i staden får ein upersonleg passiv – utan subjekt, sidan tysk (i følgje Zaenen &al) systematisk hindrar argument med leksikalt stipulert kasus frå å bli subjekt.

«Den lange tales korte mening» (sitat Dyvik) er altså at morfologiske eigenskapar som samsvar, kasus eller til og med ordfølgje ikkje kan nyttast som prov for å fastsetje grammatiske forhold – syntaktiske eigenskapar må til.

1.11.2 Semantiske eigenskapar ved Quirky Case

Verb som gir quirky dativ subjekt er typisk «experiencer_ / psych verbs», verb som skildrar kognitive/emosjonelle/psykologiske tilstandar. På tamil får første argument, opplevar, dativrolla her, medan viss det finst eit andreargument (stimulus eller upåverka patiens) får det akkusativ viss animat, nominativ viss inanimat.

Ein annan bruk for dativsubjektet er for å uttrykkje eierskap. På tamil får her patient/tema-rolla nominativ sjølv om det er animat.

I nokre språk (malayalam, hindi, kannada) samsvarer valet mellom dativ og nominativ/ergativ med kontrasten mellom ikkje-volisjonell og volisjonell handling. På malayalam kan i tillegg visse modale suffiks, som uttrykkjer tillating eller ønske, kreve dativsubjekt.

1.11.3 Islandsk Quirky Case og subjekttesting

Islandsk har verb som gir Quirky Case på objekt au subjekt:

  • dat OBJ <- redde fullføre
  • gen OBJ <- besøke vente
  • acc SUBJ <- lengte drømmeom smelte drive mangle fryse
  • dat SUBJ <- tale velte stige synest likne
  • gen SUBJ <- ståut/yve
  1. mig langar að fara til Islands
    meg(ACC) lengtar å dra til Island

Me kan prove at desse Quirky subjekta faktisk er subjekt vha. ulike testar som anaforkontroll, subjekt-ellipsis, subjekt-verb-inversjon og «raising».

Anaforkontroll og refleksivbinding: berre refleksive pronomen kan referere til subjekt i same ledd, og berre subjekt kan antesedere refleksive pronomen.

  1. hennii (osb.)
    hoi(DAT) synst bror sjølvsi / * hennari er keisam

Subjektellipsis for koreferensielle NP-ar: Ved to NP-ar med same referanse, kan ein utelate alle utenom den første, viss dei alle er subjekt.

  1. He ate and (he) went to school
  2. He cut the bread and (he) ate it/*Ø (ikkje-subjekt kan ikkje utelatast)
  3. þeir flutta líkið og (þeir) grófu það/*Ø
  4. hann segist vera duglegur, en (honum) finnst verkefnið of þungt
    han(NOM) seiest vere dugeleg, men (han.DAT) finn leksene for vanskelege
  5. * hann segist vera duglegur, en mer finnst Ø latur
    han(NOM) seiest vere dugeleg, men eg finn (han) lat

Subjekt-verb-inversjon: Ja/nei-spørsmål og innhaldsspørsmål krev at subjekt-NP-en vere rett etter det finitte verbelementet på islandsk (elles har islandsk ganske fri ordfølgje)

  1. Henni hefur alltaf þótt Ólafur leðinlegur
    ho(DAT) har alltid tykt Olaf(NOM) keisam(NOM)
  2. Hefur henni halltaf þótt Ólafur leðinlegur?
    har ho(DAT) alltid tykt Olaf(NOM) keisam(NOM)?
  3. * Hefur Ólafur henni alltaf þótt leðinlegur?
    har Olaf(NOM) ho(DAT) alltid tykt keisam(NOM)?

Liknande testar kan nyttast på malayalam (refleksiv-antesedent, kontroll av subjekt), hindi (diskursantesedenten til eit genitivpronomen kan ikkje vere nemnt i same setninga og kan difor ikkje vere subjekt, subjektet i partisippe adjunktledd er obligatorisk kontrollert (dvs. ikkje-overt) av matrisesubjektet) osb.

1.11.4 Kasusbevaring og funksjonell kontroll (s.264-)

Kasusbevaring er ei viktig åtferd til inherent kasus; strukturell kasus, derimot, endrar kasus på argument, t.d. når patiens/tema blir nominativ ved passivisering, eller ved funksjonell kontroll (matrisesubjekt = XCOMP-subjekt).

Leksikalt spesifisert kasus er bevart ved løfting på islandsk. Dei nemnte islandske verba vil i Raising-kontruksjonar gi same kasus til kontrolløren som den kontrollerte ville hatt i det underordna leddet (t.d. løfting til subjekt i «ho(DAT) synest å tykkje Olaf(NOM) keisam(NOM)»; eller til objekt i «han(NOM) trur at ho(DAT) tykkjer Olaf(NOM) keisam(NOM)»), medan om me nyttar eit vanleg verb som «elske», vil kasus endrast ved løfting.

Leksikalt spesifisert kasus er bevart ved passivisering au på islandsk, men ikkje på tysk.

1.11.5 Kasusmarkering og funksjonell kontroll vs anaforkontroll

Ved funksjonell kontroll er vanlegvis einkvar endring i kontrollør reflektert i den kontrollerte. På islandsk ser me det ved at «hún(NOM) er vinsæl(NOM)» som eit XCOMP gir den kontrollerte same kasus som kontrolløren, «þeir(NOM) telja hana(ACC) [Ø(ACC) vera vinsæla(ACC)]» (dvs. ved at adjektivet i XCOMP-en er i akkusativ fordi det samsvarer med det kontrollerte subjektet i XCOMP-en, som får akkusativ frå matriseobjektet via kontrollikninga). Dette skjer slik fordi ved funksjonell kontroll har kontrollør og kontrollert same attributt i f-strukturen.

Ved anaforkontroll derimot er kontrollør og kontrollert ikkje funksjonelt identifisert, men den kontrollerte er eit slags null-pronomen som må ha kontrolløren som antesedent.

Visse islandske Equi-konstruksjonar involverer anaforkontroll heller enn funksjonell kontroll (Andrews 1982), og tek infinitive komplement. Sidan det ikkje er nokon funksjonell identifikasjon ved anaforkontroll, vil kontrollør og kontrollert her ikkje dele same kasusmarkering (men eit XADJ inni det kontrollerte leddet vil faktisk ha kasus til det kontrollerte null-pronomenet!, t.d. «ég(nom) vonast til að vanta ekki einan(ACC) í tímanum»).

Kasus blir altså endra gjennom anaforkontroll, men bevart gjennom funksjonell kontroll.

1.12 kap.11: Ergativ

2 DASP201, Lexical-functional syntax (LFG)

Oversyn over LFG-strukturar med «mismatches» og ufullstendig korrespondanse og alt det der:

              c(onstituent)-str
            /          |       \
           /           |        \
          /            |         \
         /             |          \
        /              |           \
 f(unctional)-str  d(iscourse)-str  p(honological)-str
       |                                   |
 s(emantic)-str                        phonology
       |
   semantics

Kjelde: Interfacing Phonology with LFG, av Miriam Butt and Tracy Holloway King

Les au ein intro til LFG + XLE av M. Butt (frå heimesida hennar), synest å gi eit fint lite oversyn.

2.1 Dyvik, H. 2000. «Nødvendige noder i norsk»

Artikkel (PDF).

Norsk er eit V2-språk – i motsetning til walisisk (sjå kap.7 om endosentrisitet og hovud) finst det ein posisjon før det finitte verbet. I motsetning til engelsk, er det berre ein posisjon der, topic, det er ingen adjunksjon av adverb eller topic. Det finst ein subjektposisjon etter det finitte verbet, og det finitte (hjelpe-/hovud-)verbet er i IP alltid til venstre for negasjon, i den verbposisjonen som er mest til venstre12.

:Norsk: _ f.v. _ i.v. _ :Engelsk: __ aux _ h.v. _

Men, i underordna leddsetningar kjem negasjon (og andre setningsadverb) og subjekt før finitt verb. Så det finitte verbet er alltid rett ved komplementa sine; underordna leddsetningar er ikkje V2.

Den norske IP-en har i følgje Dyvik først ein plass for topic (som kan vere subjekt eller objekt, til hovudledd eller underordna ledd), så kjem det finitte verbet, og så ein eksosentrisk S. I S er subjekt og negasjon i valfri følgje før ei mogleg finitt verbfrase – denne har i heilsetningar IP-en sitt finitte verb som utvida hovud, medan den same S-en blir nytta i leddsetningar, kor denne finitte VP-en har det finitte verbet internt i seg. Fakultativitet (med økonomi) av døtrene til IP og S, samt kompletthet og unikhet sikrar at me får dekka dei ulike måtane ein kan stille opp frasar.

2.1.1 Den semantiske verdien til IP: talehandlinga    SPML

  1. Kari sa at [IP ho var ikkje sjuk] (eg trur på Kari)
  2. Eg tviler på at [S Kari ikkje var sjuk]
  3. * Eg tviler på at [IP Kari var ikkje sjuk]
  4. Per sa at [IP han skreiv ikkje artikkelen]
  5. * Artikkelen sa Per at [IP han skreiv ikkje]
  6. Artikkelen sa Per at [S han ikkje skreiv]

IP er den modale kjerna, her skjer sjølve talehandlinga, det er underforstått at me trur på IP, medan ein S uttrykkjer det proposisjonale innhaldet åleine, utan støtte frå implisitt talargodkjenning. Så før ein S vil ein kunne seie «Eg trur/tvilar/er sikker på at» – altså ein tematisert epistemisk vurdering, medan IP-en har «eg trur på at» implisitt.

Dette heng au saman med referensiell tyngd, når «artikkelen» i 4-6 blir topikalisert kan ikkje at-setninga vere på IP-form, sidan topikaliseringa si referensielle tyngd kjem i konflikt med IP-en sin (korrekt???).

Prosodisk trykk/emfase ved f.v. i IP kan gi heile setninga tilleggstydinga at det faktisk er sant, i tillegg til den vanlege emfasefunksjonen sjølvsagt (altså, trykk på «lest boka» tyder «ikkje skumma gjennom boka» osb.).

2.1.2 NP-syntaks

Nominale ledd har som kjenneteikn at dei typisk må vere argument til predikatorer, medan adverbiale ledd (som «der», «til Bergen»), kan stå åleine og gi seg sjølv eigeskapar som «lokativ».

Hovud/kjerne =def Det som kan erstatte heilskapen.

I setninga «kvar bil blei lakkert» er «kvar» per denne definisjonen kjerna, sidan dette ordet kan stå åleine (medan «bil» ikkje kan), det er altså ein determinativfrase, DP, utanfor NP-en, sjølv om determinativen semantisk sett er ein del av NP-en, ein spesifikator til NP-en.

Så på c-nivå er «spesifikatoren», determinativen, kjerne, medan på f-nivå er determinativen innanfor NP-en, så på dette nivået er den semantiske kjerna slik:

PRED 'bil'
SPEC [QUANT [PRED 'kvar']]

D er ein «funksjonell» c-kategori (F: C, I, D; sjå Bresnan 2001:102, kap.6), og ikkje har noko PRED på øverste nivå. Spesifikatorar til FP er funksjonelle kohovud, så:

FP → D: ↑ = ↓; N: ↑ = ↓.

  1. alle desse dine mange elendige innvendingar

Ei viss ordfølgje er krevd i denne «komplekse DP-en», basert på kategoriar. alle kan gjerne byttast ut med kvar (av), mange med nokre eller 3, osb.

mange er adjektivliknande, kan bøyast til fleire-flest, nokre er ikkje adjektivliknande, men båe har same posisjonar i frasa, og dermed same c-kategori. Båe kan kvantifisere.

[AllQP AllQ:alle [DP D:desse [POSSP POSS:dine [QuantP Quant:mange [NP [AP A:elendige] N:innvendigar]]]]]

Berre dei to siste orda, «elendige innvendigar», har PRED på øvste nivå, resten er determinativar, funksjonelle kategoriar, med slike spesifikasjonar:

mange: (↑ SPEC AQUANT PRED)='mange'
denne: (↑ SPEC DET PRED)='denne'

osb. for din (..POSS..), alle (..QUANT..), nokre (..QUANT..) (båe alle og nokre spesifiserer QUANT, og kan dermed ikkje opptre saman, medan mange er AQUANT, adjektivliknande kvantor).13

2.1.2.1 Reglar for NP-syntaks i XLE:
   NOM = { AllQP | AllQCOMP | PROP | PRON }.

   AllQP --> AllQ AllQCOMP. 
   AllQCOMP = { DP | DCOMP }.

   DP --> D DCOMP.
   DCOMP = { POSSP | POSSCOMP }. «todo: syklane mine, omvendt følgje»

   POSSP --> POSS POSSCOMP.
   POSSCOMP = { QuantP | NP }.

   QuantP --> Quant NP.
2.1.2.2 Bestemthet og kjønnsbøying

På nordsvensk kan du seie «mine syklane» ol., mine er same ubøygde ord i alle formar, og då er substantivet bestemt. Generalisering (Vangsnes): bestemthet er uttrykt på første «kjønnsbøygde» ord i NP-en (DP-en), altså første kjønnsbøygde ord frå venstre til høgre. Så «mine syklane» går sidan «mine» i denne dialekta ikkje er kjønnsbøygd (ikkje kan kjønnsbøyast).

Possessivplasseringa på norsk blir då eit spesialtilfelle av dette:

  1. syklane mine - syklane har DEF = +, mine som kjem sist har DEF =c +
  2. *syklar mine - syklar har DEF uspesifisert
  3. mine syklar - mine først har DEF = +
  4. denne sykkel -
  5. denne sykkelen -

2.2 Generelle prinsipp:    DEFINISJON

Bresnan, Joan. Lexical-Functional Syntax. Oxford: Blackwell, 2001.

C-strukturen er tverrspråkleg veldig ulik, medan f-strukturen meir invariant14.

2.2.1 Kompletthet    NORGLISH

f-strukturen må ha alle relasjonar nemnt i PRED si subkategoriseringsramme (t.d. om me har PRED 'reparere<SUBJ,OBJ>' så må SUBJ og OBJ finnast i f-strukturen)

2.2.2 Koherens

f-strukturen kan ikkje ha subkategoriserbare grammatiske relasjonar som ikkje er nemnt i PRED si subkategoriseringsramme.

2.2.2.1 Governable relations

Viss ein governable relation er nytta i f-strukturens PRED, må dei vere i f-strukturen, og omvendt – dette er dei subkategoriserbare grammatiske relasjonane. (Adverbial er jo derimot oftast ikkje-obligatoriske.)

2.2.3 Uttrykkets økonomi    NORGLISH

Alle syntaktiske frasestrukturnodar er opsjonelle og ikkje nytta med mindre dei er påkrevd av uavhengige prinsipp (kompletthet, koherens, semantisk «uttrykksfullhet»)

Det følgjer at kvar syntaktisk node i c-strukturen må gi ny informasjon til f-strukturen.

2.2.4 Leksikal integritet

Morfologisk komplette ord er lauv i c-trea, og kvart lauv er nøyaktig èin c-node.

2.2.5 Unikhet

2.2.6 Monotonisitet

Sjå k.5.

2.2.7 Optimalitetsteori og LFG

OT seier at det er ein konflikt mellom økonomi («latskap» hos ytrar) og ikonisitet (at språket skal vere forståeleg). Språkleg variasjon oppstår som eit resultat av at det finst ulike måter å prøve å løyse denne konflikten, der ingen måte er perfekt.

Ikonisitet, ved kompletthet og koherens: Gir full representasjon, visse konstituentar er påkrevde.

Økonomi, ved leksikal integritet og uttrykkets økonomi: Eliminasjon av ikkje-naudsynlege konstituentar (à la Ockhams barberblad).

F-strukturen er den mest innhaldsrike delen av syntaksen. Økonomiverknader kjem til syne i c-strukturen, difor er alle c-nodar over preterminalt nivå valfrie – f-strukturen må lisensiere deira eksistens. Tomme lauv kan berre finnast der dei legg til informasjon i f-strukturen, og koplar dette til resten vha. inside-out funksjonell utryggleik. Leksikalsk integritet gir at kvart lauv elles er eit fullt forma ord, prosessane som formar ord treng ikkje syntaks eller frasestrukturen rundt.

2.3 kap.4:

2.3.1 Inside-Out Functional Uncertainty (s. 65)

(a f') <=> (f a)=f'

(COMP ↑) <=> (f COMP) = ↑

[X [COMP Y]] <=> (X COMP) = Y

2.4 kap.5: Monotonisitet

Unifikasjon er ein monoton prosess (chart-parsing au er monotont). Det er ein reint additiv prosess, så følgje er irrelevant (transformasjonsgrammatikkar derimot er prosedurale, ikkje-monotone15).

Avbildinga frå tekststreng til f-struktur er au monoton – forholdet mellom c-struktur og f-struktur er altså transparent, noko som vil vere relevant for ein teori for universell grammatikk.

Finst det motdøme til syntaktisk monotonisitet? Passivisering blir i LFG til ein leksikalsk redundansregel, men komplekse predikat kan gjere det vanskeleg å halde ei slik oppdeling mellom syntaks og leksikon (Miriam Butt forskar på dette). Prinsippet om direkte syntaktisk innkoding er hypotesen om at me kan nytte fullt bøygde formar i syntaksen.

2.5 kap.6: Ein teori for struktur-funksjon-avbildingar

2.5.1 Funksjonstypar

TOP, FOC,SUBJ >OBJ > OBJθ > OBLθ > COMPL >ADJ
DF & -AFDF & AFCF & AF-AF

DF, diskursfunksjonar: TOP FOC SUBJ

AF, argumentfunksjonar: SUBJ > OBJ > OBJ_\theta > OBL_\theta > COMPL

-AF, ikkje-argumentfunksjonane (LaTeX: AF): TOP FOC ADJ

CF, komplementfunksjonar (ikkje-diskurs argumentfunksjonar): OBJ > OBJ_\theta > OBL_\theta > COMPL

kjernefunksjonar (kjerneargument, «core arguments»): SUBJ > OBJ > OBJ_\theta

ikkje-kjernefunksjonar: OBL_\theta > COMPL > ADJ

2.5.2 Kategoritypar

(Bresnan 2001: 100)

«Funksjonelle» kategoriar F: C, I, D

«Leksikale» kategoriar L: N, V, A, P

Kategoritypar:

«predikativ»«transitiv»
V++verbal
P-+pre- eller postposisjonal
N--nominal
A+-adjektival

Kategorinivå:

type:012
VV'V'' (VP)
PP'P'' (PP)
NN'N'' (NP)
AA'A'' (AP)

Funksjonalitetsflagg:

KategoriFlaggMoglege underkategoriar
DF1N
IF1V
CF2N, V
N,V,A,PØF

Det finitte V blir c-struktur-kjerne i IP sidan båe kategoritrekkmatrisane deira er [+ predikativ, + transitiv] (forskjellen er at I er funksjonell og V er leksikalsk).

2.5.2.1 Kombinatorisk skranke på funksjonelle kjernar:    DEFINISJON

Ein kategori C kan vere komplement til ein funksjonelt kjerne F berre viss den kategoriale trekkmatrise til F er mindre markert enn den til C (altså er einaste forskjell at F har minus kor C har pluss).

2.5.3 Leksosentrisitet og S

S, som står for «setning», er ikkje-projekterande og eksosentrisk. Ikkje-prosjekterande tyder at S ikkje har ein kategorikjerne X0, eksosentrisk tyder at S kan ha ein f-strukturkjerne av ein annan kategori (V, N, A, VP, NP, AP, &c).

Typar morfologisk funksjonsspesifikasjon:

  • dependentmarkering: (↓ CASE) = κ → (↑ GF) = ↓
  • hovud-/kjernemarkering: ((↓ AGR) = (↑ AF) → (↑ AF) = ↓)

Dependentmarkering er på sjølve argumenta, medan hovudmarkering er på t.d. verbet. Viss objektet er markert på kjernen, så vil iallfall subjektet vere det, medan dependentmarkeringen har motsett følgje på AF-hierarkiet, meir oblike funksjonar vil ha dependentmarkering før dei mindre oblike.

2.5.4 Fleksibel definisjon av endosentrisk komplement-node

Eit c-struktur-komplement er ein ikkje-prosjekterande node som ikkje har nokon ikkje-prosjekterande node som søster – altså ein XP utan XP-søstre(?).

2.5.5 Endosentriske avbildingsprinsipp    PUGGE NORGLISH DEFINISJON

LFG er eit ganske ope rammeverk for kva for grammatikkar me kan skildre, så for å unngå «monstertre» så sett me skrankar på kva for c-tre/f-strukturar me kan få. Uttrykkets økonomi fjernar dei nodane som ikkje yter ekstra informasjon til strukturen (alle nodar er fakultative); dei endosentriske avbildingsprinsippa sett endå fleire skrankar.

a. Alle c-strukturkjernar er f-strukturkjernar, men ikkje omvendt.

    XP
     \
     ^=!
      X'

b. Spesifikatorar til F-kategoriar er DF (TOP, FOC, SUBJ):

        XP
      /   \

:(^ DF)=! ^=!

    YP    X'

c. Komplement til F-kategoriar er f-kokjerner:

     F'  (C', I', D')
    /  \
  ^=!  ^=!
   F    ZP

d. Komplement til leksikale kategoriar er CF (ikkje-diskurs men-argumentfunksjonane OBJ, OBJθ, OBLθ og COMPL):

      L'   (N', V', A', P')
    /   \
  ^=!  (^ CF)=!
   L     ZP

e. Konstituentar kopla på frasekonstituentar er AF (ikkje-argumentfunksjonane TOP, FOC eller ADJUNCT), eller uannotert:

         XP   
       /   \

:(^ ~AF)=! ^=!

   YP       XP
            /_\

Meir formelt:

  • a. Kjerne (hovud) – c-kjernar er f-kjernar

Annoter ein projekterande node (X0/X1) i ein projeksjon (X1/X2) av same type med ↑ = ↓.

  • b. Spesifikatorar (på godt norsk?) – F-spec er DF

Annoter ein ikkje-prosjekterande node i F'' med (↑ DF) = ↓.

  • c. Kokjernar («coheads») – F-kompl er kokjernar

Annoter ein ikkje-prosjekterande (XP) komplement-node dominert av ein kvar kategori Xn med ↑ = ↓.

  • d. KomplementL-kompl er CF

Annoter ein ikkje-prosjekterande (XP) komplement-node komplement-node dominert av ein leksikal kategori Ln med (↑ CF) = ↓ (kor CF er ikkje-diskurs argumentfunksjonane, altså komplementfunksjonane).

  • e. Adjunkt (adverbial?)

Valfritt, annoter ein ikkje-prosjekterande (XP) node og adjunkt-søsternoden med høvesvis (↑ AF) = ↓ og ↑ = ↓ (kor AF er ikkje-argumentfunksjonane TOP, FOC eller ADJUNCT).

(Bresnan 2001: 119)

Eller, meir kompakt:

konstituenttypeannotasjondøme
a.c-kjerne↑ = ↓N under N' under NP, I under I' under IP
b.spesifikator under F''(↑ DF) = ↓SUBJ under IP eller CP
c.komplement under F'↑ = ↓
d.komplement under L'(↑ CF) = ↓ eller ↑ = ↓
e.( adjunkt under Xn+1(↑ AF) = ↓TOP og IP som søstre
Xn+1 under Xn+1↑ = ↓ )under ein mor-IP

Ein konstituent som er søster til X', under X', blir her funksjonelt tvitydig: han kan vere anten eit komplement eller ein adjunkt. Dette er endå eit døme på den uperfekte korrespondansen mellom struktur og funksjon i LFG, og kan spele ei rolle i diakron utvikling av syntaks.

2.5.6 \bar{X}-syntaks (aka X-bar aka X')

Grunnleggande skjema:

[XP YP [X' X0 ZP]]

   XP
  /  \
 YP   X'
     / \
    X   ZP

YP er spesifikator, SPEC, X0 er hovud/kjerne og ZP er komplement.

Leksikalske projeksjonar for L: N, V, A, P
Funksjonelle projeksjonar for F: C, I, D
(desse kjem ikkje med eigne PRED/semantisk innhald, nokre preposisjonar kan vere i funksjonelle projeksjonar slik at F: C, I, D, P)

«Chomsky-adjunction»:

 XP
/  \

:WP XP

  /  \
 YP   X'

WP er adjunkt til XP. I LFG kan me og ha eit adjunkt som søster til X', under X' (sjå endosentrisitetsprinsippa over).

Den andre typen adjunksjon er søster-adjunksjon, kor WP, YP og X' alle er søstre under XP.

2.5.6.1 Døme på leksikale projeksjonar
  1. [NP [YP Cæsar's] [N' [N0 conquest] [ZP of Gallia]]] – «Cæsar's», POSS, er SPEC til NP, «of Gallia» ($ ADJ?) er COMP til N'
  2. [VP [YP Cæsar] [V' [V0 conquered} [ZP Gallia]]] – «Cæsar», SUBJ, er SPEC til VP, «Gallia», OBJ, er COMP til V'
  3. [AP [A0afraid] [ZP of dogs]] – «of dogs» er COMP til A' (men den noden er fjerna ved økonomi)
  4. [PP [YP three miles] [P' [P0 past] [ZP the border]]] - «three miles» er SPEC til PP, «the border» er COMP til P'
2.5.6.2 Døme på funksjonelle projeksjonar
  1. [CP [C that] [ZP Mary left]]
  2. [IP [YP Mary] [I' may] [ZP leave John]]
  3. [DP [D0 this] [ZP theory]]

2.6 kap.7: Endosentrisitet og hovud

Transformasjonsgrammatisk «hovud-mobilitet» = variabel hovud-posisjonering.

2.6.1 utvida hovud    PUGGE DEFINISJON

N er eit utvida hovud til C viss:
N er den minimale noden i C sitt funksjonelle domene som c-kommanderer C utan å dominere C

eller:

N er eit utvida hovud til C viss:
N er N'-c-hovudet til Y eller
C ikkje har eit c-hovud, men N er det nærmaste elementet høgare oppe i treet som fungerer som funksjonelt hovud til C

eller:

N er eit utvida hovud til C viss X er den minimale ikkje-dominerande noden i same funksjonelle domene (altså φ-1(φ(C))).

1-til-mange-relasjon: ein node kan vere utvida hode til mange kategoriar

2.6.2 c-kommando    DEFINISJON

2.6.2.1 = «constituent command» (gammel term)

A c-kommanderer B viss kvar node som propert dominerer A, au dominerer B
(Så A c-kommanderer seg sjølv og alle nodane dominert av mora si)

A c-kommanderer B viss kvar node over A i treet dominerer B; A c-kommanderer alle nodane som er dominert av kvar node over A i treet

2.6.2.2 Andre definisjonar

«A c-commands B iff
a. neither A nor B dominates the other
b. the lowest branching node that dominates A also dominates B.»
(Bresnan ser ikkje ut til å ha krav om forgreining hos mødre)

  • m-command
    a. A m-commands B if and only if A does not dominate B and,
    b. every XP (maximal projection) that dominates A also dominates B.

2.6.3 dominerer

2.6.3.1 refleksiv
  • så A c-kommanderer mora si, sidan ho dominerer seg sjølv (upropert)
2.6.3.2 transitiv
  • typisk for hierarkiske relasjoner…
2.6.3.3 antisymmetrisk
  • typisk hierarkiske relasjoner som inkluderer seg selv (er refleksive)
  • <= og >= er antisymmetriske
  • Dab & Dba -> a=b
2.6.3.4 proper dominans er ikkje-refleksiv (og altså ikkje antisymmetrisk)

2.6.4 minimal node:

er lågast i hierarkiet av c-kommando

2.6.5 funksjonelt domene til C    DEFINISJON

φ-1 ( φ ( C ) )

φ mapping (φ-avbilding) er definert ved unifikasjon mellom konstituentar i treet.

2.6.6 endosentrisitet    DEFINISJON

Kvar leksikal kategori har eit utvida hovud.

2.6.7 Konfigurasjonelt    DEFINISJON

Konfigurasjonelle språk har ein VP.

2.6.8 Distribuert eksponens

ein eksponent av eit funksjonelt trekk (som TENSE, NUM, PERS) er eit uttrykk i c-struktur (t.d. affiks eller klitika)

2.7 kap.8: Pronomen-inkorporering og samsvar    SPML

Det finst ei diakron kopling mellom pronomen og bøyingsaffiks, dei har ofte formelle likskapar (bøyingsaffiks liknar ofte på reduserte formar av pronomena dei deler tyding med)16.

Det er bindingseigenskapane, kongruenseigenskapane og kasus til pronomena som differensierer dei:

PRED 'PROi'
bind β
agr α
CASE κ

(bind og agr er metavariablar.)

Utvikling frå pronominal bøying til grammatisk samsvar går gjerne frå at obligatoriske semantiske og bindingseigenskapar blir valfrie, og frå det punktet gradvis forsvinn. Når PRED og bind er til stades, som over, fungerer bøyinga som eit inkorporert pronomen, og har komplementær distribusjon med eit korresponderande syntaktisk argument.

Når desse eigeskapane er borte, som nedanfor, fungerer bøyinga som grammatisk samsvar, og doblar eit korresponderande syntaktisk argument

  • denne situasjonen blir kalt «pro-drop»17.
    agr α
    CASE κ

Finare mellomstadie finst, t.d. kan det hende at dei semantiske eigenskapane forsvinn medan bindingseigenskapane er igjen, slik at samsvarsbøyinga berre doblar syntaktiske pronomen, men ikkje NP-ar, sidan leksikale nominalar ikkje er kompatible med pronomiale bindingseigenskapar:

bind β
agr α
CASE κ

Verbale klitika vil typisk diakront endre seg til morfologisk bundne affiks, som mistar PRED-verdien og blir samsvarsmarkørar.

2.7.1 Chichewa og subjektsamsvar vs objektsamsvar

Subjektkongruens er mykje meir vanleg enn objektkongruens, og det er foreslått at ingen språk har objektkongruens utan subjektkongruens.

Chichewa er konsekvent kjerneinitialt (dei fleste språk har motsatt kjerneplass for V og A, men Chichewa har få adjektiv). 18 genus («folketaksonomi»), kjernemarkering (agr osb.), altså med affiks til verbet. Ingen IP, så ingen fast/reservert posisjon til eit finitt element.

Den obligatoriske subjektmarkøren er fakultativ, og samsvarer med subjektet.

Den valfrie objektmarkøren er ikkje fakultativ, han har eit PRED. Objektmarkøren samsvarer anaforisk med antesedenten, og gjer eit tidlegare/seinare objekt til topic.

SVO og VOS er einaste moglege permutasjonar utan objektmarkøren til stades. Om objektmarkøren er der, blir eit eventuelt objekt til topic, og alle seks permutasjonar er moglege, me har difor denne frasestrukturregelen:

S → NP, VP , NP

Der den eine NP-en er subjekt, og den andre er topic (komma tydar «valfri følgje»). Utvida med skrankar på NP-ane får me då:

S → NP: (↑ SUBJ)=↓, VP , NP: (↑ TOP)=↓

2.7.1.1 Uavhengige pronomen (vs topic-anaforiske/«backreference»)

Alle språk har to pronomentypar som kan nyttast anaforisk:

  • diskursrefererande (TOP)
  • kontrastive / fokuserande / vektleggande (med meir fonetisk innhald)

Bruken av uavhengige pronomen i diskurs kan gi vidare evidens for forskjellen mellom grammatisk og anaforisk samsvar.

2.7.2 Hypotetisk futuristisk austnorsk

Dislokering av tema på vanleg norsk:

  1. [TOPc Per,] han var der i går
  2. Han var der i går, [TOP Per]

(I 1 har med kontrastivt tema.)

  1. [TOPc 'a-Kari,] 'n-liker-'a, [TOP 'n-Per]
  2. [TOPc 'a-Kari,] 'n-har aldri likt-'a, [TOP 'n-Per]
  3. [TOPc 'a-Kari,] dessverre har-'n aldri likt-'a, [TOP 'n-Per]
  4. [TOPc 'a-Kari,] dessverre liker-'n-'a, [TOP 'n-Per]
  5. * dessverre har-'n n'-Per aldri likt-'a
  6. dessverre har n'-Per aldri likt-'a

I 5 og 6 ser me at det er ein komplementær distribusjon mellom klitiske pronomen og fullt subjekt.

Skal me følgje Bresnan (for spansk), må me vente at -'n- blir sementert fast anten etter, eller helst før verbet, og blir ein del av det.

2.8 kap.9: Topikalisering og «scrambling»

2.8.1 Engelsk topikalisering og «funksjonell utryggleik»    PUGGE NORGLISH

Prinsipp for å identifisere «gaps» (på norsk???):
Assosier XP → ε med ((x ↑) DF) = ↑

Sidan det står XP så vil det seie at berre maksimale projeksjonar kan ekstraherast (sjå kapittel 4, s. 65: Inside-Out Functional Uncertainty om formlar på forma ((x↑)y)).

(5) That he was sick, we didn't talk about

blir analysert slik at CP-en er adjungert, [IP CP IP] (medan på norsk får tema posisjonen [SPEC, IP], engelsk subjektposisjon):

[CP That he was sick], we didn't talk [PP about [NP e]]

kor den tomme strenga ε er annotert med ((x ↑) TOP) = ↑ , eller som i dømet under: ((XCOMP COMP ↑) TOP) = ↑

     \
   (^ OBJ) = !
       NP    :
       |     :                 (`..' tyder «funksjonell identifikasjon»)

:((x ^) TOP) = ^

       e     :.....
                   :

:| XCOMP [COMP [OBJ [ ]]] | :| TOP……………: |

Prinsippa for engelsk struktur-/funksjonsassosiering seier at den adverbiale CP-en er tema, PP-en er komplement (og OBL_\theta pga. preposisjonen og dei leksikale eigeskapane til verbet talk) og DP/NP-gapet er OBJ til preposisjonen. (Den topikaliserte CP-en blir utvida hovud til «gapet» sidan han er nærmaste frase i same f-domene som c-kommanderer det utan å dominere det.)

Det at CP-en og DP/NP-en har ulike c-kategoriar er ikkje eit problem for f-identifikasjon av temaet og preposisjonobjektet, CP-en har aldri vore flytta frå DP/NP-posisjonen18. (Men me kaller det ekstraksjon likevel.)

(7) * We didn't talk about that he was sick.

Men korleis kan me sameine tomme kategoriar med prinsippet om økonomi?

2.8.2 Uttrykkets økonomi og topikalisering

testnorsk.lfg nytta me outside-in funksjonell utryggleik, og sa at (↑ ({ XCOMP | COMP }* COMP) { SUBJ | OBJ }) = (↑ TOP)19.

Bresnans døme på engelsk topikalisering nyttar inside-out etter at ein tom NP har fått funksjonen OBJ. Ein tom kategori kan berre forsvarast mot prinsippet om Uttrykkets Økonomi om han gir ekstra informasjon til f-strukturen, og det gjer han i dette tilfellet sidan han seier at VP-en over har eit OBJ her (som me seinare kan unifisere med TOP vha. den (ikkje-konstruktive) funksjonelle utryggleiken.

Den tomme kategorien er siste utveg for å sikre kompletthet og koherens; russisk treng han ikkje fordi dei viser kva som er subjekt/objekt vha. leksosentriske prinsipp (kasus, dependentmarkering).

2.8.3 Topikalisering vs «Scrambling»    NORGLISH DEFINISJON

Topikalisering: konstituenten er på ein fast posisjon, først i setninga eller hovudet.

Scrambling: argumentkonstituentar har ein av mange mediale adjunktposisjonar. Scrambling er leddbunde, medan ekstraksjon (filler-gap) kan krysse ledd (sjå neste del).

Hadde engelsk hatt leksosentrisk funksjonsspesifikasjon, kunne me hatt ein DP som adjunkt til VP (td. [VP [DP the old boat [VP sold]]]), med ein dependentmarkering og likningen (↓ CASE)=acc ⇒ (↑ OBJ)=↓ . Engelsk med scrambling ville kunne gitt som 3 og 4 nedenfor, slik engelsk faktisk er, er dei ugrammatiske:

  1. Kanonisk: Rick doesn't talk about Ann
  2. Topikalisering: Ann Rick doesn't talk about
  3. Scrambling: * Rick Ann doesn't talk about
  4. Scrambling: * Rick doesn't Ann talk about

Russisk har slik funksjonsspesifikasjon. På russisk kan ein berre topikalisere på øvste nivå, altså ingen langdistanseavhengnad, men scrambling er mogleg, t.d. «he has the boat sold».

Tysk har kasus og scrambling au. I CP-en «dass das Buch der Mann liest» er «das Buch» adjungert til IP:

          CP
         /  \
        C    \
      dass   IP
            /   \
      (^ OBJ)=!  \
         DP       IP
    «das Buch»  «der Mann liest»

Endosentrisitetsprinsippa gir at konstituentar adjungert til funksjonelle nodar er ikkje-argumentfunksjonar eller uannotert, i dette tilfellet kjem objekt-annotasjonen frå leksikon pga. akkusativ.

2.8.3.1 Leddprominens til diskursfunksjonar:    SPML DEFINISJON

Kvifor kan me ikkje analysere leddet som er «scrambled» som ein spesifikator til VP (altså ein DF), slik at scrambling blir eit spesialtilfelle av topikalisering?

Fordi (s.191-192 i Bresnan) DF-adjunktar må vere leddprominente, enten på «kanten» av eit ledd eller ved kjernen.

Me kunne kalt ein medial posisjon for tema, og nytta ekstraksjon med ein tom kategori for å gjere scrambling til ein undertype av ekstraksjon. Men, DF-adjunktar er meir prominente enn andre adjunktar, så scrambling er ikkje ein spesiell type ekstraksjon.

I Bresnans teori er dei einaste funksjonsspesifikasjonane som krysse leddkategoriar dei som designerer diskursfunksjonane (TOP, FOC, SUBJ).

2.8.3.2 Er Adjunct synonymt med Adverbial?    SPML
2.8.3.3 s196 – blir det rett med konfirmasjonssangsyntaks?    SPML

«Einkvar si mor har likt ε» som i «einkvar har likt si mor»

2.8.4 Tomme kategoriar, bindingspresedens og prominens    DEFINISJON

Bindingsgeneralisering for Malayalam: eit pronomen kan ikkje vere før bindaren.

Berre overte pronomen er dekka av denne generaliseringen, nullpronomen kan vere «før» bindaren; dette følgjer av LFG-føresetnaden at nullpronomen er funksjonelle element utan uttrykk i c-strukturen, lineær følgje høyrer heime i c-struktur, ikkje i f-struktur. Slik kan generaliseringa gjelde uavhengig av relativ hierarkisk prominens til bindar og bunden.

I Malayalam har alle verb nullpronomen som standard kjerneargument, frå økonomiprinsippet følgjer det då at desse ikkje kan vere tomme kategoriar i c-struktur; og dei kan difor ikkje spele ei rolle i lineær ordfølgje. Alle pronomen, inkludert nullpronomen, er representert i f-strukturen derimot, så dette må vere det naturlege domenet for bindingsrelasjonar. For å inkorporere ordfølgje frå c-strukturen i dette, nyttar ein omgrepet f-presedens.

Definisjon av f-presedens:
Gitt ei korrespondanseavbildning φ frå c-struktur til f-struktur, og to datter-f-strukturar α og β, så vil α «f-precede» β viss noden mest til høyre i φ-1(α) er før noden mest til høyre i φ-1(β).

Dette plukker då ut kva for uttrykk i c-strukturen som er mest til høyre. Eit nullpronomen utan uttrykk i c-strukturen vil då ikkje «f-precede» noko i det heile.

Presedensskranke på pronomial binding:
Domenet til ein bindar ekskluderer eitkvart pronomen som «f-precedes» bindaren.

Ein empirisk konsekvens av ein faktisk tom kategori er då at han kan endre på binding vha. f-presedens, dette skjer t.d. i Hindi. Hindi har båe scrambling innan ledd, og ekstraksjon på tvers av ledd, med tomme kategoriar som siste utveg der leksikon ikkje kan spesifisere funksjon. Ved ekstraksjon ut av ledd kjem den tomme kategorien, synleg som bindaren sin «høyre kant» sidan presedensskranka blir brutt (og indeksen ikkje lenger kan vere lik):

  1. * [Opi]OBJ . . . [ . . . proni . . . ]SUBJ . . . [ei] . . .

(kor Op kan vere ein kvantor som «alle», eller eit kv-ord el.) Ikkje alle språk nyttar presedensskranken; Chichewa nyttar heller ein rangeringsskranke.

Rangeringsskranke på pronomial binding:
Domenet til ein bindar ekskluderer eitkvart pronomen innanfor ein konstituent som utrangerer bindaren.

Syntaktisk rang:
Gitt relasjonshierarkiet SUBJ > OBJ > OBJ_\theta > OBL_\theta > COMPL > ADJUNKT:
α utrangerer β viss α og β høyrer til same f-struktur og α er meir prominent enn β på funksjonshierarkiet (over) eller viss α utrangerer ein γ som inneheld β.

Desse rangeringsskrankane kan generaliserast til det følgande prinsippet.

Prominensprinsipp:
Domenet til ein bindar ekskluderer eitkvart personleg pronomen som er meir prominent enn det. Domenet til ein bindar er det minimale leddet eller den minimale predikatstrukturen som inneheld bindaren (formelt modellert som den minimale f-strukturen).

Ulike språk vel ulike kombinasjonar og prioriteringar (per optimalitetsteori) av desse bindingsdimensjonane:

  • c-struktur: ordfølgje
  • f-struktur: syntaktisk rang
  • a-struktur: tematisk prominens
  • p-struktur: intonasjon
  • d-struktur: fokus-struktur
  • s-struktur: ???

Tysk ser ut til å ha valt ein kombinasjon av syntaktisk rang og ordfølgje (og innanfor ledd er syntaktisk rang viktigast, sjå s. 199-200 i Bresnan (2001)).

2.8.4.1 «Pied pipes»    DEFINISJON

Skal ein flytte rundt på kjernen, t.d. ved topikalisering, må resten følgje, medan avhengige ledd kan topikaliserast åleine, utan kjernen (hovudet).

(Sjå au den heller dårlege wikipedia-artikkelen.)

2.8.4.2 «unselective quantifiers» or polyadic operators?    SPML
2.8.4.3 secondary or weak crossover effects?    SPML
2.8.4.4 true variable-binding quantifiers and referential expressions?    SPML
2.8.4.5 off-path constraints? extraction paths?    SPML

2.9 kap.10: Enkel bindingsteori

2.10 kap.14: Frå argumentstruktur til funksjonell struktur (LMT)

LMT = Lexical Mapping Theory; dei moglege koplingane mellom funksjonar (f-struktur) og roller (a-struktur); restriksjonar på og forholdet mellom strukturane.

Argumentstrukturen:

  • reflekterer predikat og argument koda av leksikon og språksyntaks
  • har nok syntaktisk informasjon til å støtte avbilding til f-strukturen
  • er ikkje eit «reint semantisk nivå», men den semantiske sida av syntaktiske rammer til leksikale einingar

Ein kan ta for gitt eit universelt hierarki av roller, og skrive:
«reparerer» reparere<SUBJ, OBJ>
«repareres» reparere< Ø , SUBJ>
det er her underforstått at det første argumentet er høgast i det tematiske rollehierarkiet.

2.10.1 Dekomposisjon av argumentfunksjonar (AF)    SPML

Argumentfunksjonar kan skildrast vha. to trekk, o og r.

o står for «objective». Ikkje-objektive funksjonar (SUBJ, OBL_\theta) kan vere komplement til intransitive predikatorar som N eller A (korrekt???).

r står for «restricted», desse AF-ane er regulerte/avgrensa til ei viss type semantisk rolle (det er au difor dei har θ-subscriptet – tematisk rolle).

Dekomposisjon av argumentfunksjonar (AF):

- r+ r
- oSUBJOBLθ
+ oOBJOBJθ

Dette gir opphav til eit delvis markeringshierarki:

SUBJ>OBJ,OBL_\theta>OBJ_\theta
[-o][+o][-o][+o]
[-r][-r][+r][+r]

Desse skal koplast til det tematiske hierarkiet:
agens > benefaktiv/malefaktiv > experiencer/mål > instrument > patiens/theme > lokativ/sti

(Så om agens blir lenka til [-o], kan han ikkje lenkast til OBJ eller OBJ_\theta.)

2.10.2 Avbildingsprinsipp og semantisk klassifikasjon

Predikatargument blir ordna etter posisjon i dette tematiske hierarkiet. Me treng difor ikkje spesifisere semantiske roller, og unngår å blande for mykje semantikk inn i grammatikken. Kvar semantisk rolle får ein klassifikasjon med trekka +/-o og +/-r.

Semantisk klassifikasjon

  • θ[-r]
    • Patiensliknande roller får [-r]
    • Asymmetrisk objektparameter
    • Engelsk kan berre ha éi [-r]-rolle, andre språk kan ha fleire
  • θ[+o]
    • sekundært patientliknande roller (som gåva i verbet gi) får [+o]
  • θ[-o]
    • andre semantiske roller får [-o]

Desse er «generelle prinsipp», og har sjølvsagt unntak.

Det logiske subjekt \hat{θ} [-o] er den mest prominente semantiske rolla, og kjem først i argumentstrukturen.

Avbildingsprinsipp

  1. \hat{θ} [-o] blir avbilda på SUBJ om rolla er først i a-strukturen
  2. Elles blir θ[-r] avbilda på SUBJ
  3. Andre roller blir avbilda på den lågaste passande funksjonen på markeringshierarkiet:
    SUBJ>OBJ,OBL_\theta>OBJ_\theta
    [-o][+o][-o][+o]
    [-r][-r][+r][+r]

2.10.3 Undertrykking

Roller kan undertrykkast til NULL. Berre umarkerte (minusmarkerte) argument kan undertrykkast. Typisk undertrykkingsprosess: passivisering. Argumentstrukturmengda kan ved undertrykkingsprosessar utvidast morfologisk.

Døme 1: 'slå<agens, patiens>' :aktiv 'slå< x , y >' => passiv 'slå< x , y >'

          [-o] [-r]                   [-o] [-r]
            |    |                      |    |
          SUBJ  OBJ                     Ø   OBJ

Pga. avbildingsprinsipp 1 (rolla er først i a-strukturen) blir \hat{θ} [-o] avbilda på SUBJ i aktiv (om me ikkje hadde ein [-o] ville [-r] blitt avbilda på SUBJ).

I passiv derimot, blir θ[-r] avbilda på SUBJ, sidan [-o] er undertrykt.

2.10.3.1 «The Unaccusitive Hypothesis»

Hypotesen om at det finst to basistypar verb, uergative og uakkusative.

Uakkusative «ambitransitive» verb, t.d. «synke», gir det intransitive subjektet same rolle som det transitive objektet:

  1. Skipet sank.
  2. Torpedoen sank skipet.

Uergative «ambitransitive» verb, som «ete», gir det intransitive subjektet same rolle som det transitive subjektet:

  1. Eg åt.
  2. Eg åt ein pudding.

«fryse» er eit uakkusitivt verb, det har èi patiensliknande rolle, og får dermed θ[-r]: :'fryse< x >'

     [-r]

Her er det prinsipp 2 som gir SUBJ til denne rolla, sidan ingen rolle med [-o] var først i a-strukturen.

«bjeffe» er eit uergativt verb, det har èi agensliknande rolle («andre semantiske roller» i klassifikasjonen), og får dermed θ[-o]: :'bjeffe< x >'

      [-o]

Prinsipp 1 gir her SUBJ sidan ei rolle med [-o] står først i a-strukturen20.

2.10.3.2 Engelsk: «The Asymmetrical Object Parameter»

«The Asymmetrical Object Parameter» seier at det er ulovleg med to [-r]-markerte roller:

  1. * θ[-r] θ[-r]

Så når det ditransitive verbet give får undertrykt [-o]-rolla ved passivisering, så kan berre ei av dei andre to rollene ha [-r]: :aktiv 'give< x , y , z >' => passiv 'give< x , y , z>'

           [-o] [-r] [+o]                        [-o] [-r] [+o]
             |    |    |                           |    |    |
           SUBJ  OBJ  OBJ_\theta                   Ø  SUBJ  OBJ_\theta

  Regel:     1     3    3                 (undertrykt)  2    3

Dette forklarer at me ikkje kan seie *«the flowers were given her» på engelsk, medan «she was given the flowers». Denne parameteren er språkspesifikk (på norsk kan me t.d. seie «blomane blei gitt ho», tillegg til «ho blei gitt blomane»).

3 DASP201, Speech and language processing

(Les au NLP-sidene til Rolf Niffel)

Historie: Winograd, LUNAR (Woods' Prosedurale semantikk og ATN-ar), osb.

3.1 Chomsky-hierarkiet

TypeAutomatSpråkProduksjonsreglar
0Turingmaskin«recursively enumerable» språk («unrestricted rewrite systems»)α → β
1Lineært bunden ikkje-deterministisk TMkontekst-sensitive språkα Aβ → αγβ
2Ikkje-deterministisk stakkautomatkontekstfrie språkA → γ
3Endeleg tilstandsmaskinregulære språkA → ε og A → aB
LFG er omtrent «Type 1.5»; det er eit mål å få tida ned i O(N3), kubisk, som CFG. I verste fall er LFG O(an), eksponensiell tid, men XLE's «compact representations» tilnærmer seg O(n3).

Må naturlege språk vere avgjerbare? I såfall vil type-0 kunne skrive «altfor vanskelege språk», sidan TM-en er uavgjerbar (stoppeproblemet / «the halting problem»).

Høgare generativ kraft gir høve til meir presise avgrensningar av delmengda av grammatiske strengar.

CFG – altså c-struktur – overgenerere i ein (spesifikk) LFG-grammatikk, slik at f-strukturen kan filtrere bort det som er støy og ordsalat. (Men hugs at det er det spesifikke formelle språket som under-/overgenererer, medan språktypen har ein viss presisjonskraft.)

3.2 Chart Parsing (Early-parseren)

3.2.1 Historie, motivasjon

Oppfinnarar: Kay, Earley, Kaplan m.fl.

Dynamisk programmering (tabellar). Kan chart-parse top-down (måldrevet) eller bottom-up (datadrevet), DFS eller BFS. Tabellen (chart) vil aldri endrast på, me berre legg til ny informasjon der.

Motivasjon: bl.a. at venstrerekursive reglar som NP–>NP N gir løkker ved vanleg top-down parsing, om me ikkje er veldig forsiktige med å omskrive regelfølgje, men omskrivingar blir fort kompliserte.

Frå NLTK.sf.net: «The bottom-up shift-reduce parser can only find one parse, and it often fails to find a parse even if one exists. The top-down recursive-descent parser can be very inefficient, since it often builds and discards the same sub-structure many times over; and if the grammar contains left-recursive rules, it can enter into an infinite loop. These completeness and efficiency problems can be addressed by employing a technique called dynamic programming, which stores intermediate results, and re-uses them when appropriate.»

3.2.2 Early-algoritmen, med unifikasjon (s.431 i SLP)

3.2.3 Parsingen

Aktive kantar er til venstre for prikken (•), inaktive til høgre. Me initierer oftast dei leksikalske kategoriane til orda før sjølve parsingen. Med eit par enkle reglar vil dei aktive kantane (hypotesane) typisk se slik ut for chart[ 0]:
S → • NP VP
NP → • N
NP → • N PP

(NLTK.sf.net har ein chart-parser tutorial, med fine bilete.)

3.2.4 Døme:

PREDICTOR (S → • VP, [fn:0,0]) gir oss:

VP → • Verb, [fn:0,0] i chart[ 0]
VP → • Verb NP, [fn:0,0] i chart[ 0]

SCANNER kan flytte • eitt ord framover.
SCANNER (VP → • Verb NP, [fn:0,0]) med (det potensielle verbet) «book» som første ord gir oss:

VP → Verb • NP, [fn:0,1] i chart[ 1]

COMPLETER kan flytte • fram forbi lengden av input-tilstanden.
COMPLETER (NP → Det Nominal • , [fn:1,3]) finn alle tilstander som slutter på 1, og venter på ein NP:

VP → Verb • NP, [fn:0,1] funnen, gir:
VP → Verb NP • , [fn:0,3] i chart[ 3]

3.2.5 Unifikasjon, trekk og chart-parsing

Ved unifikasjonsbasert chart-parsing vil me berre utvide inaktive med aktive kantar der unifikasjonen er vellykka.

0 → 1 2
(0 cat) = S
(1 cat) = NP
(2 cat) = VP
(0 head) = (2 head)
(1 head) = (0 head subj)
osb. ned til ordnivå, med (0 lex)='ordet' (eller (0 pred)='ordet'), slik at S ved unifikasjon vil få lex/pred frå verbet.

Me kan chart-parse med atomiske kategoriar og uløyste ligningsmengdar slik at me får kantar a la
S–> NP • VP (S, lS (NP, lNP (N, lN)))
som skildrar treet

 S
/ \

:NP :N

Unifikasjon er destruktiv, så unifikasjon skjer ved kopiar. (Det finst ein del smarte måtar å unngå for mykje kopiering på.)

Aktive kantar blir kopiert opp til inaktive, det er dei inaktive som må unifiserast med kvarandre.

Aktive kantar frå aktive kantar (PREDICTOR?) får ingen unifikasjon: Når du legg til ein ny regel på ein aktiv kant er han ikkje unifisert med den som foreslo han, i tilfelle andre kantar med ulike trekk, som treng ein slik regel, kunne nytta han. Eg. ved setninga «the sheep walk», me får ein inaktiv kant\\ VP[] → • V[]\\ Om VP, som kom frå S->NP VP, hadde blitt unifisert med den regelen, kunne han ha dratt med seg informasjon som [num sg] (som ikkje unifiserer med «walk», og me ville trengt ein eksplosjon av hypotesar pga. alle dei ulike trekksamansetningane.

3.3 Kategorialgrammatikk

Historie (folk som utvikla systemet): Kazimierz Ajdukiewicz (i 1935), Yehoshua Bar-Hillel (i 1953), Joachim Lambek (i 1958).

Kategorialgrammatikken har eit fattig inventar av primitive kategoriar, med mogleg uendeleg samansette kategoriar vha. funksjonssymbolet `/' (og `\', i følgje wikipedia).

Bytt ut frasesymbol med den endosentriske kjerna. S/N er ein funksjon frå N til S, og tydar «gi meg ein N, så får du ein S»:

    S              S    
   / \            / \   
  NP VP    =>    N  S/N 
     /\            /  \ 
    V  NP       S/N/N  N

(Viss X og Y er kategoriar, så er X/Y ein kategori, kategoriar er lukka under `/'.)

3.4 GPSG og HPSG

Peters & Ritchie: Transformasjonar er type-0 (TM), så det hjelp ingenting at me arbeidar med CFG-ar (worst-case O(n3)) når transformasjonane er så altfor kraftige.

Før HPSG var det noko som heitte GPSG, Generalized Phrase Structure Grammar, som nytta «meta-regler». Med GPSG kunne ein på CFG-nivå derivere manglande reglar for å ivareta langdistanseavhengnader, og klare seg heilt utan transformasjonar. (Desse skråstrekkategoriane er ein del av trekkstrukturen i HPSG.) GPSG blei utvikla på 70-80-tallet.

3.5 Trekkstruktur

Uordna mengde av ordna par, der kvart attributt er unikt innafor mengda (effektivitetsskranke). Trekkstrukturar er difor funksjonar.

3.5.1 Projeksjon

Mor er ↑ eller «M»:
↑ = f::M

Min eigen projeksjon er ↓ eller * :
↓ = f::*

3.5.2 Døme på komplisert funksjonell skildring:

(f2 (f5 CASE)) = f5
(f5 CASE) = OBLgo

Som gir opphav til denne trekkstrukturen:

f2:1]

(kor altså OBLgo som attributt i f2 er unifisert med OBLgo som verdien til CASE i f5.)

3.5.3 Subsumpsjonsrelasjonen [ (LaTeX: \sqsubseteq)

f-skildring1f-skildring2
~~~~~~~~~~~~~~~~~~
~~~~~~~~~delmengde av, C~~~~~~~~~
~~~~~~~~~
~~~~~~~~~
[ ]subsumerer, [[ ]

Den tomme strukturen [] subsumerer alle strukturar, skildrar/står for alt, dvs. strukturen legg ingen skrankar («constraints»).

Subsumpsjonsrelasjonen gir trekkstrukturar ei delvis ordning, slik at dei kan ordnast i eit gitter, ein lattice21.

3.5.4 Unifikasjon | | (LaTeX: \sqcup)

Unifikasjonen av A og B er den minste strukturen (mest generelle strukturen) som blir subsumert av kvar av dei. Liknar på union, men union vil alltid lykkast, medan unifikasjon vil mislykkast dersom eitt attributt har ulike verdiar i A og B.

Strukturar kan vakse monotonisk ved unifikasjon, så rekkjefølgje er irrellevant.

A U B = C vil seie at A subsumerer C (A [ C) og B subsumerer C og C er den minste slike struktur.

Dei to strukturane me opererer på blir erstatta av unifikasjonen - det er ein destruktiv operasjon. Dei to gamle strukturane vil no peike på ein og same struktur – med ei og same adresse i minnet, så ved ein LISP operasjon vil dei ikkje berre vere equal, men au eq.

Det går an å ha tre strukturar som alle kan unifiserast med èin av dei andre, medan alle ikkje er unifiserbare: [a b], [c d], og strukturen kor a og c peiker på same tomme struktur.

3.5.5 Abstraksjon frå symbolane

I staden for S –> NP: (^ SUBJ)=!; VP: ^=! kan me au halde oss til berre unifikasjonar:

S –> NP VP
<S SUBJ> = <NP>
<S> = <VP>

Vidare kan me no abstrahere bort symbolane, berre gi dei indeksar, og kalle S for 0, NP for 1 og VP for 2; me lagrar kategorisymbolane under attributtet cat.

0 –> 1 2 <0 cat> = S <1 cat> = NP <2 cat> = VP

Men no vil ikkje <0> = <2> (frå <S> = <VP>) la seg unifisere lenger, så me unifiserer alt utanom kategorisymbolet:

<0 head> = <2 head> <0 head subj> = <1 head>

Ved unifikasjon må me kopiere strukturen til regelen frå grammatikken, for å unngå å endre (destruere) den subsumerande strukturen i grammatikken.

Reglane me no har, gir dette treet:

0:|cat: S                 |  1:|cat: NP   |  2:|cat: VP   |
  |head: [ 1] [subj: [ 2]]|    |head: [ 2]|    |head: [ 1]|

(Desse grafane er i prinsippet ikkje asykliske, dei er altså DGs, ikkje DAGs.)

3.5.6 Subkategorisering og unifikasjon

pdf om subkategorisering (se s.50) 22

Chomskyanske subkategoriar:
gi: [ _ NP NP ]
love: [ _ NP VP ]

LFG-subkategoriar:
'gi<(^ SUBJ)(^ OBJ)(^ OBJθ)>'
'love<(^ SUBJ)(^ OBJ)(^ XCOMP)>'

          S
         / \
       NP   VP  («min subcat er min VP-dotter sin subcat rest»)
       |    / \
   Arthur  /   \
          VP    VP
         / \    | \    
        /   \   |__\    
       V    NP  to storm Cornwall     
persuades Uther                            
                                                        first: søster
              _                                         rest:  mor             _
             | cat: V  «persuades»                                              |
             | head: [form: finite]                                             |
             |          _                                                       |
             |         |first: [cat: NP  «Uther»  ]                           _ |
             |         |       _       _                      _              _ ||
             |         |      |       | cat: VP  «to storm..»  |              |||
             |         |      |first: | head: [form: inf]      |              |||

:persuades |-> | subcat: |rest: | |subcat: [rest: end] | _ |||

             |         |      |        _        _                        _  | |||
             |         |      |       | first: | cat: NP  «Arthur»     _  | | |||
             |         |      |rest:  |        |            | num:   sg | | | |||
             |         |      |       |        |_head: agr: |_person: 3_|_| | |||
             |         |      |       |                                     | |||
             |         |      |       |_rest: end    (S-regelen)           _| |||
             |         |      |_                                             _|||
             |         |_                                                     _||
             |_                                                                _|

VP1 → VP2 NP
<VP1 head> = <VP2 head>
<VP2 subcat first> = <NP>
<VP2 subcat rest> = <VP1 subcat>

VP1 → VP2 VP3
<VP1 head> = <VP2 head>
<VP2 subcat first> = <VP3 >
<VP2 subcat rest> = <VP1 subcat>

S → NP VP
<S head> = <VP head>
<S head form> = finite
<VP subcat first> = <NP>
<VP subcat rest> = end

Reglar som desse overfører veldig mykje data til leksikon.

Me kan generalisere VP-reglane til èin regel:
VP1 → VP2 X
<VP1 head> = <VP2 head>
<VP2 subcat first> = <X>
<VP2 subcat rest> = <VP1 subcat>

<VP2 subcat rest> er frå leksikon, medan <VP1 subcat> er toppnivå (den «avskrelte lauken»).

3.5.6.1 Semantikk og trekkstrukturar

Nytt trekk: trans («translation», kunne au kalt det sem).

 _                           _
| cat: NP  "Uther"            |
|       _      _         _ _  |
|      |      | num:   sg | | |
| head:| agr: |_person: 3_| | |
|      | trans: uther      _| |
|_                           _|

 _                                                            _
| cat: V _                       _                             |
|       | form: finite            |                            |
|       |         _            _  |                            |
| head: |        | pred storm   | |                            |
|       | trans: | arg1 [ 1][ ] | |                            |
|       |        |_arg2 [ 2][ ]_| |                            |
|       |_                       _|                            |
|          _       _                      _                  _ |
|         | first:| cat: NP                |                  ||
|         |       |_head [ trans [ 1][ ] ]_|                  ||
|         |        _                                        _ ||
|         |       |        _                              _  |||
|         |       |       | cat: NP _                  _   | |||
| subcat: |       |       |        |       _         _  |  | |||
|         | rest: | first:|        | agr: | num: sg   | |  | |||
|         |       |       | head:  |      |_person: 3_| |  | |||
|         |       |       |_       |_trans [ 2]        _| _| |||
|         |       |_rest: end                               _|||
|         |_                                                 _||
|_                                                            _|

persuade – objektkontroll, <head sem arg2> = <head sem arg3 arg1> promise – subjektkontroll, <head sem arg1> = <head sem arg3 arg1>

(Subj persuades Obj/Subj to do X) (Subj/Subj promises Obj to do X)

sleep: intrans, <subcat first head sem> = <head sem arg1 foo> persuade: trans, <head sem arg1> = <subcat rest rest first head sem> <head sem arg2> = <subcat first head sem> <head sem arg3> = <subcat rest first head sem>

        _rel:  persuade
       /_arg1: Arthur

:head sem/arg2: obj.kontroll_arg1: Uther

       \_arg3: _VPinf_______/_arg2: Cornwall
                            \_rel:  storm

3.5.7 Unifikasjonsalgoritmen

[], den tomme strukturen, er identitetselementet for unifikasjon. Unifikasjonsalgoritmen er rekursiv; han kallar på kvar struktur, sjekkar at atomiske verdiar er like, kopierer over ulike strukturar. Unifikasjon vil skifte ut operandande ein unifiserer, det er altså ein destruktiv operasjon. To unifiserte strukturar vil ha same adresse i minnet, og attributtar som peiker på desse vil peike på same element. Ein struktur kor to attributt ikkje berre har like verdiar, men peiker på same substruktur, gir meir informasjon enn ein som berre har like verdiar utan like peikarar.

Unifikasjonsalgoritmen har fire hovudutfall:

Atomær Dg2Kompleks Dg2
(if(ident Dg1 Dg2)
Atomær Dg1#tFAIL
FAIL)
Kopier ulike attributt,
Kompleks Dg1FAILkall unify rekursivt
på like attributt

Komplekse og atomære Dg-ar er trivielt ulike, så dei feiler. Atomære sjekkar me om er overflatisk like, og returnerer i så fall den eine av dei – om me held oss til LISP-symbol kan me sjekke dette ved eq og ikkje gjere meir enn å returnere Dg1, sidan overflatisk like LISP-symbol alltid har same minneadresse; elles må me definere ein funksjon ident som sjekkar for overflatisk likskap, og så returnere den eine om dei er like.

To komplekse Dg-ar er litt verre. For alle attributt i Dg2 som ikkje er i Dg1, legg me dei til i Dg1. For alle felles attributt, unifiser verdiane, og viss dei unifiserer, returner (ein kopi av) Dg1, elles FAIL.

3.5.7.1 Ymse LISP-operasjonar:

(nconc L1 L2) er destruktiv, og fester L2 på siste cdr i L1 med setq (på det som før var nil).

(rplacd L1 L2) gjer det same med første cdr.

(rplaca L1 'x) gjer det same med første car.

(push foo bar) ein destruktiv (conc foo bar)

3.5.7.2 Unifikasjon i LISP

LISP og peikarar: Om me berre endrar på peikarar ut frå cons-cellar, slepp me å sjekke at andre identitetar enno peikar på Dg-en.

:(record Arc (attr . value)) :(record SimpleDg (flag . body))

value til Arc er ein SimpleDg / «atomic»,
body til SimpleDg er ei liste med Arc-ar.
(SLP-boka kaller innhaldet i sine DAG-ar content og pointer.)

Denne trekkstrukturen:

a b
c d
kan representerast ved ein slik dotted list i LISP: :'(nil (a nil . b)
     (c nil . d))

som er ein SimpleDg kor flag er nil, og body-lista har to Arc-ar. Desse Arc-ane har attr a og c, og value er igjen to SimpleDg-ar. Desse har au nil som flag, og som body dei atomære symbola b og d. Representasjonen er altså:

SimpleDg: (flag . body: Arc:(attr . value: SimpleDg: flag . body)
                       Arc:(attr . value: SimpleDg: flag . body)
                        ...)

Me kan skrive ein enkel funksjon list-to-dg som tek t.d. '((a b)(c d)) og returnerer '(nil (a nil . b)(c nil . d)).

Ei slik SimpleDG-representasjon kan nyttast i unify-funksjonen, som tek to DG-ar (linje 1) og unifiserer dei:

 1:  (defun unify (dg1 dg2)
 2:    "Destructively unify two DGs -- loosely based on various notes, bound to be wrong"
 3:    (let ((body1 (fetch-body (follow-pointers dg1)))
 4:         (body2 (fetch-body (follow-pointers dg2)))
 5:         (cond
 6:          ((eq dg1 dg2) dg1)             ; eq -- pointer equality
 7:          ((null body1) 
 8:           (make-pointer dg1 dg2))
 9:          ((null body2) 
10:           (make-pointer dg2 dg1))
11:  
12:          ((or (atomic body1)
13:               (atomic body2)) 
14:           (cond 
15:            ((equal body1 body2) dg1)    ; equal -- surface equality
16:            ((and (full body1)           ; empty bodies unify easily
17:                  (empty body2)) 
18:             (make-pointer dg1 dg2))
19:            ((and (full body2)
20:                  (empty body1)) 
21:             (make-pointer dg2 dg1))))
22:                                         ; none of the above, so both are complex: 
23:          (t (make-pointer dg2 dg1)      ; make dg2 point to dg1, then 
24:             (if ((for arc in body2)     ; unify each arc of body2 with the corresponding body1 arc
25:                  (let ((value1 (get-value dg1 (fetch-attr arc))))
26:                            (cond ((null value1)
27:                                   (push (fetch-body dg1) arc))
28:                                  (t (and (unify value1 (fetch-value arc))
29:                                          (follow-pointers dg1))))))
30:                 dg1
31:                 nil))))))

(Sjå au kjeldekoden til den unifikasjonsbaserte chart-parser til Peter Norvig. 23)

|a |b c| | = '((a ((b c))(d e)) (f g)) = '(((a b) c) 
|  |d e| |                                 ((a d) e) 
|f g     |                                  (f g))
3.5.7.3 «Atomær» i LISP vs atomære retta grafar    SPML

«Atomær» er her litt meir komplekst enn eit LISP-atom, som berre er symbol+tal – men kva anna inneheld den atomære Dg-en? Tekststrenger? (Kan ikkje dei vere representert ved symbolar?)

3.6 Finite State Transducers (FST)

FST-ar blir nytta i LFG til morfologisk annalyse («Kimmo-analyse», etter utviklaren Kimmo Koskenniemi, ein tonivåanalyse frå morfofonologiske reglar til FST). Ein FST har to bånd som køyrer gjennom i parallell, ein overflatestreng og ein analysestreng.

Overflatestreng: H.E.S.T.E.N
Analysestreng: H.E.S.T.def.sg

I XLE kan me køyre den morfologiske analysen slik: :morphemes stoler :analyzing { stoler } :{ stole "+Verb" "+pres" | stoler "+Token" | "stol" "+Noun" "-sg" etc. }

4 Ymse usortert

4.1 XLE-syntaks

Reglar:

S-->VP NP. 
XP: ! $ (^ ADJUNCT) «mengdemedlemsskap»
{ A | B } «ein og berre ein av A eller B»
(A) «valfritt A (A eller ingenting)»
A; B. "A fulgt av B, så slutt"
A, B. "A og B i valfri følgje, så slutt"
 "funksjonelle skrankar står mellom : og ;"
V: ^=! "verbet er i det funksjonelle domenet til mora,"
   (^ FORM)=c fin; "og må vere finitt"
(^ DEF) "eksistensskranke, krev berre at trekket finst"

Leksikale oppslag:

"typisk passiv verbform m/underforstått agens:"
foo V * (^ PRED)='foo<NULL(^ SUBJ)>' 
        (^ VFORM)=fin.                                   
bli V * (^ PRED)='PASSIVE<(^ XCOMP)>(^ SUBJ)>' 
        "krev subjekt til xcomp utan å ha det som argument"
        (^ SUBJ)=(^ XCOMP SUBJ) 
        @FOO. "legg til eit template (ein mal) til slutt"

Variblar:

(^ REGEXP) = %VAR "t.d. om du må halde på ein viss sti"
(%VAR foo) = fie 

4.2 Facebook-notatar(!) i syntaks

«Anaphor: [A Noun Phrase] that obligatorily gets its meaning from another NP in the sentence» For example: himself, herself, themselves, etc.

«Binding: A binds B if and only if A C-commands B AND A and B are co-indexed. A is the BINDER, B is the BINDEE»

«Coindexed: Two [Noun Phrases] that have the same index ([subscript] i, j, k, etc.) are said to be coindexed.» Basically, they refer to the same entity in the world.

«C-Command: Node A c-commands node B if every node dominating A also dominates B AND neither A nor B dominates the other.»

«(Proper) Domination: Node A dominates node B if and only if A is higher up in the tree than B and if you can trace a branch from A to B going only downwards.»

(Andrew Carnie, Syntax: A Generative Introduction 2006)

4.3 «Det …» (upersonleg subjekt?)

Ei(n) N V der
vs.
Det V ei(n) N der
«Det …»-strukturen har ein semantisk effekt, handlinga trer i bakgrunnen. Det må vere observerbare handlingar; prøv «sitt» -> ok, «tenkjer» -> ikkje ok, «arbeider» -> gir tydingsskifte.

4.4 Anakoluti

Denne setninga ville vore ok om hovudleddet var i aktiv (t.d. med «vi» som subjekt, og kontrollør av XCOMP-subjektet), men slik han er, ser det ut som ein anakolutt (med mindre hytta er animat):

  1. [Etter å ha lukta på tomt båe ved Leirungen og på Marvangen] blei hytta plassert ved Gjendeoset

4.5 Språk og referanse

Språket er eit reiskapslager der ord er midler til referanse, dei denoterer. Ord fyller syntaktiske funksjonar som SUBJ, OBJ; referentar fyller semantiske roller som agens, patiens.

4.5.1 Kasus ablativ

Ablativ (t.d. på latin), semantisk: «reiskapsledd»

4.6 Semantisk tyngd <=> PRED

Det er semantisk tunge ord som har ein PRED. Det faktiske PRED, som 'på', er instansiert så du kan ikkje unifisere det med 'på'24.

4.7 Norsk genus

Norsk bokmålsgenus er komplisert. Feminin er 100% valfritt, så ingen disjunksjon, men heller underspesifikasjon:

[NØYTRUM] = -

4.8 Fraseintern ordfølgje i skandinaviske PP-ar

SV: kjerneinitialt
«Han kastade ut hunden» – P NP
«Han kastade ut den» – P PRON

DA: kjernefinalt
«Han smed hunden ud» – NP P
«Han smed den ud» – PRON P

NB: pronomen initialt, ikkje-pronomen finalt, eller initialt
«Han kastet ut hunden» – P NP, eller «Han kastet hunden ut» – NP P
«Han kastet den ut» – PRON P

4.9 Depictives = frie predikativar    SPML

  1. John chased the thief out naked

(kven var naken? tvitydig)

4.10 PREDLINK

Kan sjå omtrent slik ut: :PRED 'være<fiolin, lett>' | :PREDLINK | PRED 'lett' | |

        | ADJUNCT {| PRED 'spille<pro>NULL' |} | |

(Prøv XLE-webgrensesnittet.)

4.11 «Selectional restrictions»    SPML

Skrankar som verbet sett på argumenta sine. Mange ting bryt desse utvalsskrankane, t.d. negasjonar («denne boka åt ikkje meg»), metafor («maskinen veit det ikkje»), eventyr osb., så NorGram nyttar +Pref på dei mest vanlege tolkingane, heller enn å fjerne dei heilt.

Verb har utvalsskrankar på argument, og berre argumenta.

Raising-verb har ingen skrankar på subjektet sitt (korrekt???) – difor kan raising-verb (men ikkje equi-verb) ha ekspletive (ikkje-refererande) «dummy» subjekt. («det byrjar å regne» vs #«det prøver å regne», «renta byrja å falle» vs #«renta prøvde å falle»).

4.12 Referensiell tyngd    SPML

Topikalisering vs bestemt form:

  1. Per, sa Kari at ho hadde eit maleri av
  2. ? Per, sa Kari at ho hadde maleriet av

Det blir litt meir ugrammatisk å topikalisere Per når «maleri» er i bestemt form, sidan båe tema og bestemt form er måtar å gi referensiell tyngd.

Ubestemthetsrestriksjonen på (direkte) objekt:

  1. Det blei spist mat / * maten
  2. Det blei gitt mat / * maten / guten mat / ? gut mat (???)

På islandsk kan dei minske referensiell tyngd ved å tale i konjunktiv; i staden for indikativ, som aukar referensiell tyngd. I konjunktiv kan dei ha langdistanseavhengnader, medan indikativ gir øyer (som bestemt form gjer i norske NP-øyer).

Finitte setningar er generelt meir refererande enn ikkje-finitte (Norsk har eit slags modusuttrykk der me kan nytte IP-forma i ein at-setning, der me vanlegvis nyttar S.)

Anaforbinding er generelt vanskelegare ved høg referensiell tyngd.

4.13 Eit «paradoks» ved norske preposisjonar

  1. han tenkte på flyet (tenke-på<han, fly>)
  2. han sov på flyet (sove<han>; på flyet er eit eige adverbialt ledd)
  3. *ut hunden kasta han
  4. på flyet tenkte han

I 1 er ein del av predikatet, medan i 2 er det del av adverbialet. 4 går merkeleg nok greit, medan 3 ikkje går. Er utfylling til tenkte eller er på flyet eit eige ledd her?

Me kan analysere med valfritt PRED, der komplementet (NP-en under PP) er f-kokjerne når P ikkje har PRED, og elles er OBJ til preposisjonen. F-strukturen til han tenkte på flyet blir då: :| PRED 'tenke<SUBJ, 1:OBJ>' | :| SUBJ "han" | :| OBJ [ 1] | :| |PRED 'på<1:OBJ>' | | :| ADJ { |OBJ 1:"flyet" | } | :| | | |

4.14 Teoriar i NLP og syntaks

4.14.1 Generative grammar

4.14.1.1 Transformational grammar (TG)
  • Generally:
    • Less computational efficiency
    • Theoretical basis
    • Complex rules
    • Simple lexicons
  • Chomsky hierarchy & First TG
  • Standard Theory (1965)
    • Sentence
      • Deep structure
      • Surface structure
    • Generative TG
      • Basic part
        • Produce deep structure
        • CFG
      • Transformational part: Transformational Rules
        • Convert deep structure to surface structure
        • Transformational Rule ~ Transformation
        • Example: (same deep structures)
          • (i) The boys place the book on the table.
          • (ii) The boy has placed the book on the table.
          • (iii) Did the boy place the book on the table?
  • Extended Standard Theory
  • Government & Binding Theory (1981-1988)
4.14.1.2 Constraint-Based Lexicalist grammar (CBLG)
  • Constraint satisfaction more important than transformational derivation
  • Strict lexicalism
    • Lexicons: syntactic atoms of a language
    • Independent Internal structure from syntactic constraints
  • Surface structures are produced directly

4.14.2 Language Categories

4.14.2.1 Type 0: Natural (Irregular)
4.14.2.2 Type 1: Context sensitive
4.14.2.3 Type 2: Context free
4.14.2.4 Type 3: Regular

4.14.3 «Unification-based grammars» (or more general: constraint-based)

They go beyond many earlier representation languages in that they have a clean denotational semantics that permits the encoding of grammatical knowledge independent from any specific processing algorithm.

Complex formal descriptions of grammatical units (words, phrases, sentences) by means of sets of attribute-value pairs, so called feature terms.

Feature terms can be underspecified. They may contain equality statements expressed by variables or coreference markers.

The formalisms share a uniform operation for the merging and checking of grammatical information, which is commonly referred to as unification.

Restriction on term interpretations (attribute values restricted to basic term interpretation) is at the heart of the difficulties encountered in implementing such linguistically motivated extensions to the basic formalism as negation and disjunction.

4.14.3.1 Grammar: A set of constraints between feature structures
4.14.3.2 Key concept: Subsumption relation
4.14.3.3 Constraint-based Categorial frameworks (LFG, HPSG)
  • Lexical-Functional Grammar (LFG) LFG-summary
  • Head-Driven Phrase Structure Grammar (HPSG)
    • HPSG is a constraint-based, lexicalist approach to grammatical theory that seeks to model human languages as systems of constraints.

4.14.4 Attribute grammar

4.14.4.1 (attribute evaluation problem)

AG does not restrict attribute values to their basic term.

This makes attribute grammar expressive and computationally efficient and, on the other, makes it computationally difficult to implement

4.14.5 Augmented Transition Network (ATN)

4.14.5.1 Transitive network ~ Expanded Finite-State machine
4.14.5.2 ATN Grammar ~ A set of transitive networks
4.14.5.3 Features
4.14.5.4 Constraints
4.14.5.5 ATN research and its deficiencies introduced LFG

4.14.6 Definite Clause Grammar (DCG)

Prolog? A –> B C

1 «medium» er ein syntaktisk aktiv, men semantisk passiv diatese, t.d. «kjøtet steikte i komfyren»

2 går dette greit på nynorsk?

3 det må altså ha mindre referensiell tyngd?

4 Det engelske «herself» er tvitydig, og kan i ulike kontekstar omsetjast til «sjølv» (t.d. «She did it herself»), «seg sjølv» (t.d. «She likes herself») eller «ho (henne) sjølv» (t.d. ???).

5 X tyder her at pronomenet kan ha ein unemnd referent, P at det kan referere til Per og K til Kari.

6 «sin» er inalienable, «hennar» er alienable – kva tydar det???

7 Tysk har «sein Mutter» for «hans Mor», tysk «sein» er ikkje-refleksivt, medan norsk «sin» er utskilt til ein refleksiv funksjon.

8 predikat vil typisk seie adjektiv og verb, dei er «+ predicative»

9 er det ikkje syntaksen som gir informasjonen om at Per er det nye? Det er iallfall uttrykt i setninga uansett.

10 Vietnamesiske spørjeord er i tillegg ulike norske sidan dei ikkje synest å vere kvantorar; «kven kom?» har same ordstilling som på norsk, medan «ingen kom» har same ordfølgje som «ikkje kven kom».

11 I applikativ er det nye argumentet alltid objekt.

12 norske hjelpeverb er forresten fullstendige verb som tek komplement («har villet kunne gå»), ikkje berre AUX – dei har PRED.

13 Semantisk blir «alle desse» tolka som «alle av desse», altså med ein skjult partitiv, så «alle x av desse y» (det er vel slik ein uansett må nytte «nokre» når dette har andre determinativar før NP?)

14 Men kor invariant? Skal LFG-rammeverket i tillegg inkorporere ein substantiell lingvistisk teori, eller berre vere eit deskriptivt rammeverk? Om me tvinger grammatikkar for ulike språk til å ha like f-strukturar, vil dei kanskje bli meir som semantiske representasjonar (som berre gir det trivielle faktum at språka kan uttrykkje det same – ikkje at dei naudsynleg gjer det på same måte syntaktisk). Me må uansett skilje mellom empiriske føresetnader og fenomen og metodiske definisjonar (normative framgangsmåtar). Skal du kunne hypotetisere, må du kunne konstruere eit tilfelle som skal utelukkast av teorien.

15 Tentative løysingar, frå partiell kunnskap, treng ikkje-monoton logikk.

16 proklise og enklise er høvesvis klitika før og etter ordet.

17 (For)dobling/«doubling»: same informasjon er uttrykt på to stader, typisk for samsvar (agr, kongruens).

18 Dette var eit av Bresnans originale argument mot transformasjonar på 70-talet – CP-en kan ikkje ha vore flytta, så kor kom han frå? Kan me forklare det utan flytting, så treng me ingen «dyp struktur».

19 Men dette regulære uttrykket skal eigentleg vere ikkje-konstruktivt, altså utførast etter at alt er unifisert og ikkje føre til vidare unifikasjon (det skal altså vere ein skranke, constraint equation), så det burde ikkje fungere sidan den djupaste f-strukturen ikkje allereie er tildelt funksjonen OBJ (eller SUBJ); det fungerer i XLE fordi XLE i desse tilfella tek subjektet og objektet (eller COMP eller XCOMP) i (↑ PRED)='foo<(↑ SUBJ)(↑ OBJ)>' som konstruktive.

20 det er ein forskjell i kva for hjelpeverb ein kan nytte med norske intransitive verb, med uakkusative kan ein i tillegg til har nytte er, som i «er falt» (nesten adjektivaktig?).

21 Eller semilattice – altså at sjølv om alle har mødre, har ikkje alle døtre, eller omvendt.

22 utvalsskrankar / selectional restrictions høyrer til semantikk, det gjeld t.d. om subjektet må vere animat; medan subkategorisering er antall roller, eller om t.d. tredje argument (på hierarkiet av tematiske roller) er ein COMP, og høyrer til syntaks.

23 I GWB/Medley kan me gi a verdien til b ved identitet ved å gi han strukturen peikt på av b: ='(a (b))=. Så (list-to-dg '((a b)(c (a)))) gir ein struktur kor c peiker på same struktur (b) som a peiker på.

24 I XLE kan du instansiere vilkårlege verdiar vha. ein postposisjon _ (lågstrek, underscore).

Forfattar: Kevin Brubeck Unhammer <pixiemotion hos gmail.com>

Dato: 2009-08-30 15:07:51 CEST

HTML generated by org-mode 6.29c in emacs 22