From cdc30736dc8d7db0f65824f275ec354fb480ab9f Mon Sep 17 00:00:00 2001 From: hennie Date: Wed, 31 Mar 2021 17:59:23 +0200 Subject: [PATCH] Create ner_on_voc_collection_data.md --- cases/ner_on_voc_collection_data.md | 52 +++++++++++++++++++++++++++++ 1 file changed, 52 insertions(+) create mode 100644 cases/ner_on_voc_collection_data.md diff --git a/cases/ner_on_voc_collection_data.md b/cases/ner_on_voc_collection_data.md new file mode 100644 index 0000000..ab2bdee --- /dev/null +++ b/cases/ner_on_voc_collection_data.md @@ -0,0 +1,52 @@ +# NLP and NER on VOC related data sets + +## Metadata + +* **Status:** In Progress +* **Type:** Specific +* **Work Package**: WP6 +* **Research Coordinators:** Joris van Zundert (Huygens ING) +* **Coordinators for CLARIAH:** +* **Participating Institutes:** VU, INT, HuC +* **End-users**: Lodewijk Petram, Huygens ING, principal investigator +* **Developers**: Sophie Arnoult, Piek Vossen, Katrien Depuydt, Jesse de Does, Hennie Brugman +* **Interest Groups**: Ann, TP, WF +* **Task IDs**: + +## Description +(to be translated to English) + +In het CLARIAH+ WP6-overleg van dinsdag 16 april 2019 is besloten een idee voor een gezamenlijke use case verder uit te werken. Het doel van deze use case is de tools en methodes van de verschillende partners in WP6 op elkaar af te stemmen. Als onderwerp is de VOC gekozen, enerzijds vanwege het rijke en veelzijdige bronnenmateriaal dat beschikbaar is over deze onderneming en haar activiteiten, anderzijds vanwege de uitdagende en relevante historische onderzoeksvragen die met deze use case beantwoord kunnen worden. + +### What is the research about? + +Onderzoeksvragen - Historisch + +- Welke verschuivingen traden er op in de aanwezigheid van de VOC in Indië en in de interactie van de compagnie met lokale vorsten en hun onderdanen (1600-1800)? +Op welke manier ontwikkelden de netwerken waar het personeel van de VOC in Azië deel van uitmaakte? +- Hoe ontwikkelde de wijze waarop in officiële documenten van de VOC werd geschreven over de lokale Indische bevolking, en over de interactie tussen het personeel van de VOC en de lokale bevolking? +- Hoe heeft de wijze waarop in secundaire literatuur wordt geschreven over de aanwezigheid van de VOC in Indië, de lokale Indische bevolking en de interactie tussen het personeel van de VOC en de lokale bevolking zich ontwikkeld? +- Hoe heeft de wijze waarop waarop in kranten, populaire tijdschriften en pamfletten wordt geschreven over de aanwezigheid van de VOC in Indië, de lokale Indische bevolking en de interactie tussen het personeel van de VOC en de lokale bevolking zich ontwikkeld? + +#### Data + +Sources: +- Generale Missiven (text from periods 1610-1767 and 1960-2007) +- Pieter van Dam, Beschryvinge van de Oostindische Compagnie (1692-1701) +- Dagh-register gehouden int Casteel Batavia vant passerende daer ter plaetse als over geheel Nederlandts-India (1624-1682, uitgegeven in periode 1887-1931) +- De dagregisters van het kasteel Zeelandia, Taiwan (1629-1662, uitgegeven in periode 1986-2000) +- several relevant books, newpaper articles and periodicals +- a range of available relevant structural data Sources + +### What software and services are involved? + +- NER and entity linking pipeline, based on existing tools of VU ('newsreader pipeline') +- Inception, tool for manual and semi-automatic text annotation, to create ground truth for NER +- TextFabric (DANS), used in experiment concerning Generale Missiven +- custom tooling for data conversions + +## References + +References to related resources and publications and especially links to related use-cases: + +* [CLARIAH](https://clariah.nl)