Help

Max Planck Institute for Psycholinguistics

WebCelex Help - Dutch Lemmas

Dutch Lemmas contains the following items:

NameDescriptionType
AbStemCntabstract stem, number of lettersnumeric
AbStemDiaabstract stem, diacriticsstring
AbStemabstract stemstring
AdvNumfor adjectives: adverbial usage, numericnumeric
Advfor adjectives: adverbial usage, labelstring
AuxNumfor verbs: auxiliary verb, numericnumeric
Auxfor verbs: auxiliary verb, labelstring
CardOrdNumfor numerals: cardinal/ordinal, numericnumeric
CardOrdfor numerals: cardinal/ordinal, labelstring
ClassNumword class, numericnumeric
Classword class, labelstring
CompCntnumber of morphological componentsnumeric
CompFrame1complementationframe 1 for complementstring
CompFrame2complementationframe 2 for complementstring
CompFrame3complementationframe 3 for complementstring
CompFrame4complementationframe 4 for complementstring
CompFrame5complementationframe 5 for complementstring
Compcompound analysis methodstring
DatComppossibility of "dat"-sentence complementationnumeric
DeHetNumfor nouns: "de/het" distinction, numericnumeric
DeHetfor nouns: "de/het" distinction, labelstring
Defdefault analysisstring
DerCompderivational compound analysis methodnumeric
Dictdictionary entrystring
FamFreqfamily frequencynumeric
FamSizefamily sizenumeric
FlatClassflat segmentatio, word class labelsstring
FlatSAflat segmentation, stem/affix labelsstring
Flatflat segmentationstring
GendNumfor nouns: gender, numericnumeric
Gendor nouns: gender, labelstring
HeadCntheadword, number of lettersstring
HeadDiaDescdescription of semantics for HeadDiastring
HeadDiaNewheadword, diacritics, new spelling, new orthographystring
HeadDiaOldheadword, diacritics, old spelling same as HeadDiastring
HeadDiaheadword, diacriticsstring
HeadLowSortheadword, lowercase, alphabetical, sortedstring
HeadLowheadword, lowercase, alphabeticalstring
HeadRevheadword, reversedstring
HeadSylCntheadword, number of orthographic syllablesstring
HeadSylDiaNewheadword, syllabified, diacritics, new spelling, new orthographystring
HeadSylDiaheadword, syllabified, diacriticsstring
HeadSylheadword, syllabifiedstring
Headheadwordstring
IdNumlemma numbernumeric
ImmAllostem allomorphy, top levelstring
ImmClassimmediate segmentation, word class labelsstring
ImmSAimmediate segmentation, stem/affix labelsstring
ImmSubCatimmediate segementation, subcat labelsstring
ImmSubstaffix substitution, top levelstring
Immimmediate segmentationstring
InfComppossibility of infinitive sentence complementationnumeric
InlDevINL frequency deviationnumeric
InlLogINL frequency, logarithmicnumeric
InlMlnINL frequency (1,000,000)numeric
InlSpellDevINL spelling frequency deviationnumeric
InlSpellFreqINL spelling frequencynumeric
InlINL frequencynumeric
IntComppossibility of interrogative sentence complementationnumeric
LevelCntnumber of morphological levelsnumeric
MorCntnumber of morphological analysesnumeric
MorphCntnumber of morphological formsnumeric
MorphNummorphological analysis numbernumeric
MorphStatusmorphological statusstring
NomComppossibility of nominal complementationnumeric
OrthoCntnumber of spellingsnumeric
OrthoNumspelling numbernumeric
OrthoStatusstatus of spellingstring
PassVerbpossibility of passive verbnumeric
PhonCLXphon. headword, CELEX charsetstring
PhonCPAphon. headword, CPA charsetstring
PhonCVBrheadword, phon CV pattern, with bracketsstring
PhonCVheadword, phon. CV patternstring
PhonCntheadword, number of phonemesnumeric
PhonDISCphon. headword, DISC charsetstring
PhonSAMphon. headword, SAM-PA charsetstring
PhonStCLXphon. stem CELEX charsetstring
PhonStCPAphon. stem, CPA charsetstring
PhonStCVBrstem, phon. CV pattern, with bracketsstring
PhonStCVstem, phon. CV patternstring
PhonStCntstem, number of phonemesnumeric
PhonStDISCphon. stem, DISC charsetstring
PhonStSAMphon. stem, SAM-PA charsetstring
PhonStrsCLXsyll. phon. headword, with stress, CELEX charsetstring
PhonStrsCPAsyll. phon. headword, with stress, CPA charsetstring
PhonStrsDISCsyll. phon. headword, with stress, DISC charsetstring
PhonStrsSAMsyll. phon. headword, with stress, SAM-PA charsetstring
PhonStrsStCLXsyll. phon. stem, with stress, CELEX charsetstring
PhonStrsStCPAsyll. phon. stem, with stress, CPA charsetstring
PhonStrsStDISCsyll. phon. stem, with stress, DISC charsetstring
PhonStrsStSAMsyll. phon. stem, with stress, SAM-PA charsetstring
PhonSylBCLXsyll. phon. headword, CELEX charset (brackets)string
PhonSylCLXsyll. phon. headword, CELEX charsetstring
PhonSylCPAsyll. phon. headword, CPA charsetstring
PhonSylDISCsyll. phon. headword, DISC charsetstring
PhonSylSAMsyll. phon. headword, SAM-PA charsetstring
PhonSylStBCLXsyll. phon. stem, CELEX charset (brackets)string
PhonSylStCLXsyll. phon. stem, CELEX charsetstring
PhonSylStCPAsyll. phon. stem, CPA charsetstring
PhonSylStDISCsyll. phon. stem, DISC charsetstring
PhonSylStSAMsyll. phon. stem, SAM-PA charsetstring
PhonolCLXphonological deep structure, CELEX charsetstring
PhonolCPAphonological deep structure, CPA charsetstring
PrepCompfixed prepositions with nominal complementationnumeric
PropNumfor nouns: proper noun, numericnumeric
Propfor nouns: proper noun, labelstring
SemCatsemantic category for nominastring
SemAnimanimacy descriptionstring
SemClassentity class descriptionstring
SemDescfull semantic descriptionstring
Sepaseparablestring
SpellChglemma affected by new spelling, new orthographystring
StStrsPatstem, stress patternstring
StSylCntstem, number of phonetic syllablesnumeric
StemCntstem, number of lettersnumeric
StemDiastem, diacriticsstring
StemRevstem, reversedstring
StemSylCntstem, number of orthographic syllablesnumeric
StemSylDiastem, syllabified, diacriticsstring
StemSylstem, syllabifiedstring
Stemstemstring
StrsPatheadword, stress patternnumeric
StrucAllostem allomorphy, any levelstring
StrucBrackLabstructured segmentation, word class labels onlystring
StrucLabstructured segmentation, word class labelsstring
StrucSubstaffix substitution, any levelstring
Strucstructured segmentationstring
SubCatNumfor verbs: subcategorization, numericnumeric
SubCatfor verbs: subcategorization, labelstring
SubClassPNumfor pronouns: subclasses, numericnumeric
SubClassPfor pronouns: subclasses, labelstring
SubClassVNumfor verbs: subclasses, numericnumeric
SubClassVfor verbs: subclasses, labelstring
SylCntheadword, number of phonetic syllablesnumeric

New Additions

There are 5 new options added to dutch lemmas in the WebCelex version:

Help on Valency (Dutch only)

De file dvl.cd bevat semantiek en complementatiepatronen (argumentstructuren) voor nomina, verba en adjectiva. Wellicht ten overvloede zijn alle lemmata uit de file dutch/dol/dol.cd opgenomen, om vergelijking met dit bestand te vergemakkelijken. Dit geldt dus ook voor lemmata waarvoor geen speciale features zijn gecodeerd, of voor lemmata die tot geheel andere woordklassen behoren. In deze gevallen zijn de relevante velden achter IdNum en HeadDia leeg.

Niet alle nomina, verba an adjectiva zijn gecodeerd voor semantiek en complementatiepatronen. Voor opname in de ze file zijn de volgende criteria gehanteerd:

Voor de nomina:
  • alle ongelede of niet geleedbare nomina, behalve eigennamen, met INL-frequentie (op 42,3 miljoen tokens) > 0.
  • alle gelede nomina met INL-frequentie > 50.
  • alle homografe nomina niet reeds in a of b.

    Voor de verba:
  • alle gelede, ongelede of niet geleedbare verba, met INL-frequentie (op 42,3 miljoen tokens) > 0.

    Voor de adjectiva:
  • alle gelede, ongelede of niet geleedbare adjectiva, met INL-frequentie (op 42,3 miljoen tokens) > 0.

    Voor alle lemmata geldt, dat zij alleen zijn gecodeerd als relevante gegevens in woordenboeken te vinden waren. Er is dus niet gepoogd woorden die oorspronkelijk geselecteerd waren volgens de bovengenoemde criteria toch te voorzien van labels, als geen duidelijkheid bestond over betekenis en/of valentie.

    Formele structuur van de file:
    \ : het volgende karakter is letterlijk bedoeld
    | : of
    <...> : niet-terminaal symbool
    '...' : letterlijke string
    [...] : een karakter uit de gegeven karakterset
    [^...] : een karakter anders dan uit de gegeven karakterset
    [x-y] : de karakterset bestaande uit 'x' t/m 'y'
    * : 0-N maal het voorgaande element
    + : 1-N maal het voorgaande element
    ? : 0-1 maal het voorgaande element

    Veldbeschrijvingen

    <SemCat> ::=
    <seman>((;<seman>|\[<seman>(;<seman>)*\]))*
    <seman> ::= ([A-Z]|-L)[0-9]*[MVOWK]*

    Semantische categorie voor nomina. Zie voor verdere documentatie Appendix I.

    <NomComp> ::=
    '0' | '1' | ''

    Mogelijkheid nominale complementatie nomina:
    0 = niet mogelijk
    1 = mogelijk (als in 'een kilo [aardappelen]','een doos [koekjes]')
    NULL = categorie n.v.t.

    <PrepComp> ::=
    <prep>(';' <prep>)* <prep> ::= 'aan' | 'achter' | 'bij' ... | 'voor'

    Vaste preposities bij complementatie nomina.

    <DatComp> ::=
    '0' | '1' | ''

    Vast dat-zin complement bij nomina:
    0 = niet mogelijk
    1 = mogelijk (als in 'het advies [dat hij moet stoppen]', 'het idee [dat de wet niet deugt]')
    NULL = categorie n.v.t.

    <InfComp> ::=
    '0' | '1' | '2' | ''

    Vast infinitief-zin complement bij nomina:
    0 = niet mogelijk
    1 = alleen te-infinitief mogelijk (als in 'de bekentenis [hier verantwoordelijk voor te zijn]', 'de pretentie [een autoriteit te zijn op dit vlak]')
    2 = (om) te infinitief mogelijk (als in 'het fatsoen [(om) zijn mond te houden]')
    NULL = categorie n.v.t.

    <IntComp> ::=
    '0' | '1' | '2' | '3' | ''

    Vast vraagzin complement bij nomina (beginnend met vragend bijwoord, vragend voornaamwoord of onderschikkend voegwoord 'of'):
    0 = niet mogelijk
    1 = alleen beginnend met vragend bijwoord of vragend voornaamwoord mogelijk (als in 'een voorbeeld [hoe het niet moet]', 'het vermoeden [wie de dader is]')
    2 = onderschikkend voegword 'of' alleen mogelijk (als in 'de onzekerheid [of hij nog zal opduiken]')
    3 = beide mogelijk (als in 'de kwestie [wie er nu gewonnen heeft]' 'de kwestie [of de Spaanse kandidaat nu gewonnen heeft]')
    NULL = categorie n.v.t.

    <PassVerb> ::=
    '0' | '1' | '2' | '3' | ''

    Passivizeerbaarheid verbum:
    0 = niet mogelijk
    1 = onpersoonlijk passief mogelijk (als in 'er wordt nauwelijks gehoorzaamd', 'er werd gelijkgespeeld')
    2 = persoonlijk passief mogelijk (als in 'het verlies wordt gedekt door de verzekering', 'zij werd overgehaald om toch mee te doen')
    3 = beide mogelijk (als in 'hij wordt vaak gediscrimineerd' 'er wordt vaak gediscrimineerd')
    NULL = categorie n.v.t.

    <HeadDiaDesc> ::=
    [ "()+,\-./123;=A-Za-z]*

    Betekenisomschrijving HeadDia, uitsluitend bij homografen. Komt helaas, door gebruik verschillende bronnen, niet altijd overeen met de semantische features. Zo komt het voor, dat een lemma, dat zowel een dier als een mens kan aanduiden, de code H0 krijgt voor het dier, en D0 voor de mens. Het is nu alleen een indicatie voor de betekenisverschillen tussen de diverse lemmata, ongeacht de koppeling aan de bijbehorende woordingang in de file.

    <CompFrame> ::=

    <functielabel> '{' <categorielabel> '}' <optioneel> '|' <bind>

    <categorielabel> ::=
    <cat> (';' <cat>)* ('<' <lett> (',' <lett>)* '>')? (':' <seman> (';' <seman>)*)?

    <functielabel> ::=
    LabelBeschrijving
    'AA' (adverbial argument, bijwoordelijke bepaling)
    'CAO' (comitative argument, object-oriented; object-gerichte comitatieven nemen deel aan de/het door het gezegde uitgedrukte handeling, proces of toestand samen met of in combinatie met het object, meestal gerealiseerd in <lett> door 'met', b.v. 'Ik associeer die symfonie altijd met Brahms')
    'CAS' (comitative argument, subject-oriented; subject-gerichte comitatieven nemen deel aan de/het door het gezegde uitgedrukte handeling, proces of toestand samen met of in combinatie met het subject, meestal gerealiseerd in <lett> door 'met', b.v. 'Ik speel altijd met mijn neefjes')
    'CAU' (causative argument, bepaling van oorzaak, in dit speciale geval meestal gerealiseerd in <lett> door 'van', b.v. 'Ik brand van verlangen')
    'DO' (direct object, lijdend voorwerp)
    'DOC' (direct object complement, bepaling van gesteldheid)
    'IA' (instrumental argument, instrumentbepaling, ingeleid door prepositie, te vinden als realisatie van <lett>; vrijwel altijd 'met')
    'INF' (werkwoord alleen in onbepaalde wijs in bepaalde constructies, zoals 'modaal/marginaal hulpww + inf', 'aan het + inf', b.v. 'Ik kan niet buikspreken', 'Hij staat te/is aan het houthakken')
    'LA' (locative argument, plaatsbepaling)
    'LAD' (directive locative argument, richtingsbepaling)
    'MA' (measurement argument, bep. van kwantiteit)
    'O' (niet geklassificeerd object)
    'PO' (prepositional object, voorzetselvoorwerp)
    'RO' (reflexive object)
    'S' (subject, onderwerp)
    'SC' (subject complement, naamw. deel van het gezegde)
    'SO1' (secondary obj 1: indirect object, meew. voorwerp)
    'SO2' (secondary obj 2: experiencing object,ondervindend)
    'SO3' (secondary obj 3: beneficiary, belanghebbend)
    'TA' (time argument, tijdsbepaling)
    'VC' (verb complement)

    <cat> ::=
    Realisatie van functies Uitgebreidere omschrijving als in Appendix II
    'ADV'
    'AHI' (AH-INFS)
    'ALS' (als-COMP)
    'AP'
    'D' (dat-FINS)
    'ERD' (er-PREP#dat-FINS)
    'EROF' (er-PREP#of-FINS)
    'EROTI' (er-PREP#*om-te-INFS)
    'ERW' (er-PREP#wh-FINS)
    'H' (HET)
    'HD' (het#dat-FINS)
    'HOF' (het#of-FINS)
    'H*OTI' (het#*om-te-INFS)
    'I' (INFS)
    'NP'
    'OF' (of-FINS)
    'OTI' (om-te-INFS)
    'PART'
    'PP' ('(' 'PREP,' ('ADV'|'AP'|'ELKAAR'|'I'|'NP'|'RNP')')')?
    'RNP'
    'TI' (te-INFS)
    'W' (wh-FINS)
    'X' (dummy categorie voor werkw. alleen in onbepaalde wijs; zie functie INF hierboven)
    '*HD' (*het#dat-FINS)
    '*HOF' (*het#of-FINS)
    '*HW' (*het#wh-FINS)
    '*OTI' (*om-te-INFS)

    <lett> ::= 'aan' | 'achter' | 'beneden' ... | 'zover'

    Vaste voorzetsels of andere niet-voorzetsels in vaste uitdrukkingen, gebruikt bij het werkwoord in dit bepaalde frame.

    <optioneel> ::= '*' | ''

    Is het complement optioneel?

    '*' = het voorafgaande complement is optioneel NULL = het voorafgaande complement is verplicht voor dit bepaalde frame

    <bind> ::= <b> (';' <b>)*
    <b> ::= 'S=' ( 'A' | 'DO' | 'LA' | 'PO' | 'RO' | 'S' | 'SO1' | 'SO2' | 'SO3' )

    Bindingsinformatie: indien een infiniete clause als werkwoordscomplement voorkomt, als in 'Ik probeer [te werken]', wat is dan het subject van die clause, voor zover dat gerealiseerd wordt in de matrixzin, d.w.z. de zin met het finiete werkwoord, b.v.

    'Ik probeer [te werken]' => S=S ('Ik probeer [ik werk]')
    'Ik laat hem [werken]' => S=DO ('Ik laat hem [hij werkt]')
    'Ik geef hem [te eten]' => S=SO1 ('Ik geef hem [hij eet]')

    De code 'A' duidt op een arbitraire referent buiten de matrixzin, die uit de situationele context kan worden afgeleid, b.v.

    'Het valt niet mee [om thuis te moeten blijven]' => S=A
    'Het staat me tegen [om zoveel soldaten de dood in te sturen]' => S=SO2;S=A
    'Ik verfoei het [om er zo bij te lopen]' => S=S;S=A

    Adjectiva hebben (uiteraard) geen bindingsinformatie.

    Beschrijving complete veldstructuur

    Complementatieframe voor werkwoorden en adjectiva. Hier staan zoveel velden als er complementen zijn, dus een trivalent werkwoord met b.v. een Subject, Direct Object en Secondary Object beslaat velden 11 tot en met 13. Het hoogst mogelijke veld is 15. Mochten er meerdere complementatieframes mogelijk zijn, dan staan die onder elkaar, net zoals verschillende semantische lezingen bij nomina.

    Appendix I

    Hieronder volgt een beschrijving van de semantische klassen die onderscheiden worden voor zelfstandige naamwoorden. De semantische categorieŽn van nomina zijn in een hiŽrarchisch model geordend. Omdat wij door de aard van ons lexicon elementen uit een zeer groot domein (natuurlijke taal in zijn geheel) semantisch moeten beschrijven, blijft de classificatie beperkt tot een grove indeling. We zijn hierbij uitgegaan van het model dat in Longman Dictionary of Contemporary English (LDOCE 1978) is gehanteerd. Ongeveer dezelfde structuur is terug te vinden in Helbig und Schenkel (1983, pp. 97-99). Bovendien dient dit schema veelvuldig als illustratie in literatuur over NLP (Natural Languge Processing-)systemen. Dit zeer grove model ziet er als volgt uit:



    We hebben dit grove model verfijnd aan de hand van het ontologisch model, dat Dahlgren heeft opgesteld voor zelfstandige naamwoorden (Dahlgren 1988). Ook de betekenisomschrijving van zelfstandige naamwoorden, zoals gehanteerd in Cobuild (1987) heeft ons geholpen om met name de concrete nomina verder te subclassificeren. Cobuild maakt in zijn betekenisomschrijving namelijk gebruik van hyponiemrelaties (bijvoorbeeld "een stoel is een meubelstuk waarop..."; en "een bed is een meubelstuk waarin..."). Een aantal van deze hyperoniemen is als subcategorie gebruikt. Zo komen we tot een totaal van 67 semantische hoofd- en subcategorieŽn.

    De ontologische boom ziet er als volgt uit:



    Aan deze semantische klasse zijn de volgende features toegevoegd:

    Onder de knoop LEVEND [L]
    [M] = mannelijk
    [V] = vrouwelijk
    [O] = onvolwassen
    [W] = volwassen

    Onder de knopen ABSTRACT [A] en VAST [S]:
    [K] = collectief

    De hoogste knoop [E]: entiteit omvat alles waarnaar wij in ons universum door middel van nomina kunnen verwijzen. Direct daaronder volgen de knopen ABSTRACT en CONCREET, wier onderverdelingen hieronder apart behandeld zullen worden. Een kleine x geeft aan dat de overkoepelende semantische klasse onderverdeeld kan worden in de subklassen die achter cijfers genoemd worden.

    A - ABSTRACT
    CRITERIA:
    Niet aanraakbaar in de werkelijkheid, zonder massa, zonder volume, geen ruimtelijkheid.

    A0 - REST
    CRITERIUM: Alle woorden die niet tot ťťn van de andere categorieŽn gerekend kunnen worden.
    VOORBEELD: Cognitieve begrippen zoals 'geluk', 'taalkunde', 'economie', en geschiedkundige perioden of tijdperken als 'Renaissance', 'ijstijd'.

    A1 - MAAT
    CRITERIA:
    -Grootheden en eenheden.
    -Tevens niet-absolute eenheden, zelfstandige naamwoorden die een bepaalde hoeveelheid of intensiteit aanduiden.
    VOORBEELD:
    Grootheid: 'lengte', 'hoogte', 'gewicht', 'tijd'.
    Eenheid: 'Ňngstrom', 'meter', 'kilo', 'uur'.
    Niet-absolute eenheden: 'hoeveelheid', 'kar', 'lepel', 'hoop'.
    -tijdsperioden zoals 'uur', 'minuut'.

    A2 - GEESTELIJKE GESTELDHEID EN KARAKTEREIGENSCHAP
    CRITERIUM:
    Het zelfstandige naamwoord duidt de mentale toestand of instelling van een bezield wezen aan.
    VOORBEELD:
    Psychische emoties/sensaties/gesteldheden: 'woede', 'angst', 'verslagenheid', 'depressie'.
    Karaktereigenschappen: 'gevatheid', 'vergevensgezindheid'.
    Ook geestelijke processen, mentale aktiviteiten zoals 'aandacht', en 'aanbidding' behoren tot deze categorie.

    A3 - LICHAMELIJKE GESTELDHEID
    CRITERIUM:
    Het zelfstandige naamwoord duidt de lichamelijke toestand van een bezield wezen aan.
    VOORBEELD:
    Fysieke sensaties: 'jeuk', 'honger'.
    Ziektes: 'griep', 'cholera'.
    Lichamelijke aandoeningen: 'buil', 'wond'.

    A4 - EIGENSCHAP/HOEDANIGHEID
    CRITERIUM:
    Het zelfstandig naamwoord duidt een eigenschap/hoedanighed aan van een entiteit, die door middel van een 'van'-bepaling met het eigenschapswoord verbonden kan worden:
    De zwakheid van de man.
    De actualiteit van een kwestie.

    De semantische klasse [A2] is de mentale tegenhanger van deze categorie.

    A6 - INSTITUUT/ORGAAN
    CRITERIA:
    'Personificatie' van een collectief (menselijk). Dit houdt in dat een instituut gewoonlijk duidelijk als een geheel fungeert en zich ook als zodanig manifesteert, waarbij de individuele mensen, die deel uitmaken van het instituut, op de achtergrond blijven. Het is dus een collectieve, sociale entiteit, met een, in tegenstelling tot de categorie H9, interne struktuur die uit vaste rollen bestaat.
    VOORBEELD:
    Instanties: 'reclameraad', 'omroep', 'Raad van State'.
    Organisaties: 'voetbalclub', 'bedrijf', 'vakgroep'.

    A7 - GEBEURTENIS
    CRITERIA:
    Het zelfstandig naamwoord duidt een gebeurtenis aan, waarbij niet ťťn handelende persoon gedacht kan worden (als dit wel het geval is zie A8).
    VOORBEELD: 'ineenstorting', 'feest', 'concours', 'wedstrijd'.

    De semantische klasse [A2] is de mentale tegenhanger van deze categorie.

    A8 - HANDELING
    CRITERIA:
    Het zelfstandig naamwoord duidt een door ťťn subject gecontroleerde handeling aan. De categorie heeft een dynamisch karakter.
    VOORBEELD: 'registratie', 'advisering', 'schoonmaak'.

    A9 - TOESTAND
    CRITERIA:
    Het zelfstandig naamwoord drukt een letterlijke of figuurlijke statische gesteldheid of omstandigheid uit. De categorie heeft een statisch aspekt. Tot deze categorie behoren niet de geestelijke en lichamelijke toestanden. Deze vallen respectievelijk onder de categorieŽn A2 en A3.
    VOORBEELD: 'winter', 'gevangenschap', 'armoede', 'geluk'.

    De abstracte categorieŽn kunnen nader gespecificeerd worden door middel van het feature [K]: COLLECTIEF Dit feature markeert verzamelnamen. Deze verzamelnamen kunnen telbaar en niet-telbaar zijn:

    het puikje
    het alles
    het complex
    het aanwezige

    C - CONCREET
    CRITERIA: Entiteit met massa, met volume, met ruimtelijkheid. Aanraakbaar in de werkelijkheid.

    L - LEVEND
    CRITERIA: Duidelijk.

    B - BEZIELD
    CRITERIA: Duidelijk.

    H - MENS
    0-Restcategorie.
    CRITERIUM: Alles wat niet tot de andere categorieŽn behoort.
    1-Beroep/hiŽrarchische sociale status/aanspreekvormen.
    CRITERIA: Woorden die een beroep, functie of sociale status aanduiden.
    VOORBEELD: 'stewardess', 'slaaf', 'baron'.
    Deze klasse krijgt automatich het feature [W] mee. Geslachtsonderscheid wordt alleen gemaakt wanneer dit in het Nederlands gemaakt wordt op het morfologisch vlak, e.g. 'baron' versus 'barones'.
    2-religieuze, mythologische personages (ook godheden).
    9-Collectief.
    CRITERIA: Een menselijk collectief, bezit geen interne struktuur (in tegenstelling tot [A6] = instituut).
    VOORBEELD: 'menigte'.

    D - DIER
    0-Restcategorie.
    CRITERIA: Alles wat niet tot de andere categorieŽn behoort.
    1 t/m 6-Zoogdier, vogel, vis, amfibie, reptiel, insekt.
    CRITERIA: Duidelijk.
    9-Collectief.
    CRITERIA: Duidelijk.
    VOORBEELD: 'kudde', 'fauna'.

    Dode dieren: als prooi: [S0]
    als voedsel: [S9] bv. 'Wij eten vandaag kip.'

    P - PLANT
    0-Restcategorie.
    CRITERIUM: Alles wat niet tot de andere categorieŽn behoort.
    1-Boom
    2-Struik/heester
    3-Bloem
    4-Fruit
    9-Collectief.
    VOORBEELDEN: 'bos', 'flora'.

    Groente wordt beschouwd als voedsel, zie dus categorie [S9].

    M - MICRO-ORGANISMEN

    Tot deze klasse gehoren de bacterieŽn en de schimmels.

    -L - NIET LEVEND
    Duidelijk.

    G - GAS
    CRITERIUM:
    Gasvormige entiteiten.
    0-Restcategorie: Alles wat niet tot de andere categorie behoort.
    6-Landschappelijk/meteorologisch verschijnsel.
    VOORBEELD: 'wolk', 'atmosfeer', 'damp', 'mist', 'rook'.

    Q - VLOEIBAAR
    CRITERIUM:
    Entiteiten die bestaan uit vloeibaar materiaal.
    0-Restcategorie: Alles wat niet tot de andere categorieŽn behoort.
    6-Natuurlijk landschappelijk/meteorologisch verschijnsel.
    VOORBEELD: 'rivier', 'zee'.
    7-Kunstmatig landschappelijk/meteorologisch verschijnsel.
    VOORBEELD: 'kanaal'.
    9-Drank, vloeibaar voedsel.
    VOORBEELD: 'melk', 'cola', 'kop koffie', 'koffie'.

    S - VAST
    CRITERIUM:
    Entiteiten die bestaan uit vast materiaal.

    0-Restcategorie.
    CRITERIUM:Alles wat niet tot de andere categorieŽn behoort.
    Onder dit hoofd vallen o.a.:
    Scheikundige elementen en medische stoffen, waarvan de aard onduidelijk is. Alle stoffen en vloeistoffen krijgen de semantische codering van de fase, waarin zij bij kamertemperatuur verkeren, mee. Verder steensoorten, metaalsoorten, weefsels, houtprodukten, gestorven schepselen, gaten, openingen, geld.
    1-Kleding
    CRITERIA: Duidelijk.
    VOORBEELD: 'hoed', 'sjaal', 'borstrok', 'ondergoed'.
    2-Gebruiksvoorwerpen.
    CRITERIA: Gebruiksvoorwerpen zijn per definitie door de mens vervaardigde voorwerpen, met behulp waarvan hij/zij bepaalde werkzaamheden gemakkelijker uit kan voeren. Verder behoren tot deze klasse de artefacten die de mens zijn levensgemak vergroten. Men denke hier o.a. aan video- en audioapparatuur, en medische hulpstukken als 'beugel' en 'prothese'.
    VOORBEELD: 'stoel', 'hamer', 'viool', 'wasmaschine'.
    Deze categorie wordt in kleinere klassen opgedeeld.
    0 Restcategorie
    1 Meubelstuk.
    2 Werktuig (in de meer nauwe betekenis van gereedschap).
    3 Muziekinstrument.
    3-Vervoermiddel.
    CRITERIA: Middel waarmee men verplaatst kan worden, of zich kan verplaatsen.
    VOORBEELD: 'kinderwagen', 'vrachtvaarder'.
    4-Tweedimensionale afbeelding/documentatie.
    CRITERIA: Al hetgeen een beeld weergeeft. (3-dimensionaal: [S0]) Verder alle entiteiten die pagina's met letters bevatten,
    VOORBEELD: 'foto', 'dia', 'tekening'; 'rapport', 'boek', 'folder'.
    5-Gebouw/vertrek.
    CRITERIA: Elke kunstmatige, door steen, glas, metaal of aarde omgeven ruimte, waarin mensen of dieren kunnen verblijven.
    VOORBEELD: 'flat', 'kamer'.
    6-Natuurlijk landschappelijk objekt.
    VOORBEELD: 'berg', 'rotspartij'.
    Ook planeten en sterrebeelden vallen in deze categorie.
    7-Kunstmatig landschappelijk objekt, geografische entiteit.
    VOORBEELD: 'land', 'streek', 'stad', 'dijk', 'terp'.
    8-Lichaamsdeel.
    CRITERIA: Elk anatomisch onderdeel van een levend lichaam, hetzij menselijk, hetzij dierlijk, hetzij plantaardig. Hiermee worden dus niet alleen ledematen aangeduid, maar bv. ook inwendige organen als 'luchtpijp' en 'achillespees'. Als aanvulling op deze categorie moet de deel-geheel-relatie aangegeven worden, dus van welk levend wezen het betreffende woord een lichaamsdeel is. Het geheel wordt achter [S8] tussen vierkante haken vermeld:
    'arm': S8[H0]
    'vleugel': S8[D2]
    9-Vast voedsel.
    VOORBEELD: 'nassi', 'zuurkool', 'koekje'.

    F - VUUR Alles wat bestaat uit het vurige element: 'fik', 'bliksem', enz.
    Z - MET BETREKKING TOT ZINTUIGLIJKE WAARNEMING
    CRITERIUM: CategorieŽn die waarneembaar zijn door middel van de zintuigen.
    1-Zicht.
    VOORBEELDEN: 'rood', 'geel', 'beeld', 'blos', 'bontheid'.
    2-Gehoor.
    VOORBEELDEN: 'accent', 'boventoon', 'kakofonie', 'mi', 'slag'
    3-Reuk en Smaak.
    VOORBEELDEN: 'aroma', 'odeur', 'smaak'.
    4-Gevoel.
    VOORBEELDEN: 'lichtheid', 'ruwheid'.

    Bij sommige van de categorieŽn die onder deze knoop vallen zijn de volgende features in de definiŽring van de semantische code opgenomen:

    1) Mannelijk [M] CRITERIA: Duidelijk.
    -
    Vrouwelijk [V]

    2) Volwassen [W] CRITERIA: Leeftijdgrens: 18 jaar
    -
    Onvolwassen [O]

    Deze featureparen worden alleen voor de precisering van de categorieŽn [H] en [D] gebruikt. Als deze features niet aangegeven worden in de semantische definitie van een woord, dat tot deze categorieŽn behoort, betekent dit dat een onderscheid binnen het bereik van die features niet van toepassing is. Bij bijvoorbeeld 'kampioen' is niet vast te stellen of de entiteit volwassen of onvolwassen is. Door weglating van de features [W] en [O] wordt aangegeven dat 'kampioen' niet gedifferentieerd is wat betreft leeftijd.

    Een ander feature dat gebruikt wordt is:

    3) Collectief [K]

    Collectieve woorden zijn woorden die meestal niet telbaar zijn en een verzameling van objecten aangeven. Dit feature wordt gebruikt voor:
    - de markering van niet-levende concrete objecten (entiteiten die onder de knoop C hangen), zoals 'afwas', 'beddegoed', 'armada', 'gerei' en 'garnituur'.
    - abstracte entiteiten als 'mengelmoes' en 'puik').

    Collectieven die verzamelingen van mensen, dieren en planten denoteren zijn in aparte categorieŽn ondergebracht, resp. [D9], [H9] en [P9].

    Er wordt zoveel mogelijk in eindknopen gecodeerd, dat zijn in de boom de rechts gelegen categorieŽn. Woorden die aspekten van meerder semantische klassen in zich hebben, krijgen een combinatie van die klassen als codering mee: brandstof: G0;Q0;S0

    De combinatie van [A0] met een andere semantische categorie wordt alleen dan meegegeven, wanneer het begripsmatige karakter van het woord in kwestie zeer sterk is. Immers, alle woorden kunnen immers als begrip gebruikt worden. Wanneer men een woord als "auto" beschouwt, is het heel goed mogelijk om door middel van dit woord het begrip, de Platonische idee "auto" aan te geven. Gezien de sterk Aristoteliaanse inslag van onze ontologie is deze beschouwing niet bij alle woorden verwerkt in een semantische code.

    Directe superordinates (Rosch: "middle level") krijgen de semantische klasse, die hun naam als label voert, toegewezen. 'Bloem' bijvoorbeeld is de superordinate van 'roos', 'dahlia', 'chrysant' enz. Deze laatsten worden dan ook de subordinates of hyponiemen van 'bloem' genoemd. (Rosch: "subordinate level") In ons systeem wordt 'bloem' gedefinieerd door P3, de klasse 'bloem'. Iedere eindklasse bestaat dus uit alle hyponiemen van de superordinate, uitgedrukt door de naam van die klasse, plus die superordinate zelf.

    Er zijn echter woorden die onder andere door semantische depletie een zo algemene betekenis hebben gekregen, dat ze hoog in onze ontologische boom hangen. Ze kunnen niet door een eindcategorie gedefinieerd worden, zelfs niet door een opsomming van een beperkte groep eindcategorieŽn. Wij zijn dus genoodzaakt om deze woorden een semantische codering mee te geven, die bestaat uit een hogere knoop in de boom.

    Voorbeelden:
    dier [D]
    goederen [-L] met feature [K]
    artikel [C]
    wezen [L]

    Appendix II

    Hieronder volgt een opsomming van de syntactische realisatiemogelijkheden van de complementen van werkwoorden, zelfstandige naamwoorden en adjectieven. Door middel van een sterretje wordt aangegeven dat het element in kwestie optioneel is.

    De volgende syntactische categorieŽn worden onderscheiden:

    Symbool Omschrijving
    NP Noun Phrase. De hond blaft tegen zijn baasje. Aangenomen wordt dat de volgende voornaamwoorden dezelfde distributie hebben als woorden van deze categorie: persoonlijke voornaamwoorden: Jullie hebben daar geen schuld aan. zelfstandig gebruikte aanwijzende voornaamwoorden: Ik vind deze de beste. zelfstandig gebruikte bezittelijke voornaamwoorden: De mijne gaat niet zo hard. zelfstandig gebruikte betrekkelijke voornaamwoorden: Hij is ziek, en dat komt me niet goed uit. Mijn Latijn is niet meer wat het geweest is. zelfstandig gebruikte onbepaalde voornaamwoorden: Men spreekt tegenwoordig veel over het milieu. zelfstandig gebruikte uitroepende voornaamwoorden: Wat een stof ligt hier!
    RNP Reflexieve NP bij verplicht en toevallig reflexieve werkwoorden. De patiŽnt herinnerde zich niets van het gebeurde. De burgemeester waste zich grondig.
    HET Onbepaald voornaamwoord "het" als subject van onpersoonlijke werkwoorden of als object van bepaalde werkwoorden en werkwoordelijke uitdrukkingen. Het regent buiten. Ik heb het koud.
    PP(PREP,NP) Ban dat idee uit je hoofd.
    PP(PREP,RNP) Hij schijft zijn verantwoorde- lijkheden van zich af.
    PP(PREP,ELKAAR) De ballon barstte uit elkaar.
    er-PREP#dat-FINS Denk eraan dat je de deur goed sluit.
    er-PREP#of-FINS Ik twijfel eraan of de rekening wel klopt.
    er-PREP#*om-te-INFS Ze rekent erop te zullen slagen.
    er-PREP#wh-FINS Ik lach erom hoe dat gelopen is.
    AP Adjectival Phrase Hij schilderde het hek groen.
    PART Participle. Alleen bij hulpwerkwoorden. Zij heeft de hele dag gewerkt.
    INFS Infiniet S-complement. Piet is voetballen.
    te-INFS Infiniet S-complement ingeleid door "te". Dat is niet te eten. Zij zei vroeg thuis te zullen zijn.
    *om-te-INFS Infiniet S-complement beginnend met "(om) te". Ik werd gedwongen (om) dat mee te nemen.
    om-te-INFS Infiniet S-complement beginnend met "om te". Dat is niet om te eten.
    het#*om-te-INFS Infiniet S-complement met verplicht voorlopig subject of object "het". Ik haat het om altijd de laatste te zijn. Het is zo fijn om gelukkig te zijn.
    AH-INFS Infinitiefcomplement, ingeleid door "aan het". Ruud krijgt haar aan het huilen.
    wh-FINS Finiet S-complement ingeleid door een vragend voornamwoord of onderschikkend voegwoord: "hoe", "waarom", "wie". Ik vraag me af hoe hij dat wil doen.
    *het#wh-FINS Complement met een facultatief voorlopig subject of object "het": Ik vind het een probleem wie daarvoor moet zorgen.
    of-FINS Finiet S-complement ingeleid door "of". Ik vraag me af of hij dat wil doen.
    het#of-FINS Complement van werkwoorden met een verplicht voorlopig subject "het". Het lijkt of hij niets uitvoert.
    *het#of-FINS Complement met een verplicht voorlopig subject of object "het". Ik vind het twijfelachtig of hij komt.
    dat-FINS Finiet S-complement ingeleid door "dat". De verkoper wist dat de prijs veranderd was. Niemand schijnt te zien dat je je best doet.
    *het#dat-FINS Complement met een facultatief voorlopig subject of object "het": Het komt voor dat hij te laat is. Het is gebleken dat niemand dat wil. Ik vind het leuk dat je morgen komt. Wij betreuren het dat je gekomen bent.
    als-COMP Complement ingeleid door "als". Ik beschouw hem als mijn beste vriend.
    ADV Adverbiaal complement voor werkwoorden Mijn broer boert goed. Hij woont gezellig. Roberta gedroeg zich voorbeeldig.

    EXTRAPOSITIEVERSCHIJNSELEN

    Een opmerking aangaande de complementen met een voorlopig subject of direct object "het" en de complementen met een voorlopig voorzetselvoorwerp "er": Binnen het theoretisch kader van Government and Binding wordt dit "het" en dit "er" een semantisch leeg suppletief pronomen genoemd, dat na toepassing van de zogenaamde extrapositieregel verplicht in de zin aanwezig is. Door middel van extrapositie wordt de subjectszin, de direct objectszin of de voorzetselvoorwerpszin in postverbale positie geplaatst. Wanneer extrapositie mogelijk is, wordt dit expliciet door middel van een syntactische categorie als *het#dat-FINS bij het betreffende werkwoord aangegeven. De optionaliteitsmarkering bij het voorlopig subject of direct object "het" betekent dat naast extrapositie ook een constructie mogelijk is, waarin de dat-zin als subject of direct object fungeert. deze niet-geŽxtraponeerde variant is vaak grammaticaal gemarkeerd:

    Het komt voor dat hij te laat is.
    Dat hij te laat is komt voor.

    Wij betreuren het dat U ontslagen bent.
    Dat U ontslagen bent betreuren wij.

    Deze informatie is van belang voor de volgende syntactische categorieŽn:

    er-PREP#dat-FINS
    er-PREP#of-FINS
    er-PREP#*om-te-INFS
    er-PREP#wh-FINS
    het#*om-te-INFS
    *het#wh-FINS
    het#of-FINS
    *het#of-FINS
    *het#dat-FINS