-
Notifications
You must be signed in to change notification settings - Fork 12
Description
Er zijn wat problemen met de FoLiA voor morfemen:
In de diepe morfemen FoLiA analyse in Frog kennen we een CELEX POS tag toe aan de morfemen.
Bijv voor 'dit':
<morphology>
<morpheme class="complex">
<t>dit</t>
<feat class="[dit]pronoun" subset="structure"/>
<pos class="O" set="http://ilk.uvt.nl/folia/sets/frog-mbpos-clex"/>
<morpheme class="stem">
<t>dit</t>
<pos class="O" set="http://ilk.uvt.nl/folia/sets/frog-mbpos-clex"/>
</morpheme>
</morpheme>
</morphology>
Waarbij 'O' idd een pronoun is.
(Sub-probleem: je kunt discussieren of dit een compex morfeem is of niet. maar goed)
Voor woorden met de CGN tags SPEC en LET, gaat dat ook ongeveer zo:
<morphology>
<morpheme class="stem">
<t>!</t>
<feat class="[!]" subset="structure"/>
<pos class="LET" set="http://ilk.uvt.nl/folia/sets/frog-mbpos-clex"/>
</morpheme>
</morphology>
en:
<morphology>
<morpheme class="stem">
<t>York</t>
<feat class="[York]" subset="structure"/>
<pos class="SPEC" set="http://ilk.uvt.nl/folia/sets/frog-mbpos-clex"/>
</morpheme>
</morphology>
Dit is echter erg problematisch! SPEC en LET zijn geen bestaande CELEX tags. (ze staan ook NIET genoemd in de setdefinitie )
(Sub-probleem: Daarnaast lijkt mij dit dan toch eerder een STEM, dan een structure....)
(Sub-probleem: in setdefinitie is sprake van cgntags, dit moet celex zijn)
We zullen denk ik hier OF moeten kiezen voor een bestaande tag (maar welke????)
Of onze set uitbreiden met SPEC en LET. (S en L??)
@antalvdb misschien heb jij een 'cunning plan'?