Skip to content
This repository was archived by the owner on Nov 18, 2021. It is now read-only.
Open
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
52 changes: 52 additions & 0 deletions cases/ner_on_voc_collection_data.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,52 @@
# NLP and NER on VOC related data sets

## Metadata

* **Status:** In Progress
* **Type:** Specific
* **Work Package**: WP6
* **Research Coordinators:** Joris van Zundert (Huygens ING)
* **Coordinators for CLARIAH:**
* **Participating Institutes:** VU, INT, HuC
* **End-users**: Lodewijk Petram, Huygens ING, principal investigator
* **Developers**: Sophie Arnoult, Piek Vossen, Katrien Depuydt, Jesse de Does, Hennie Brugman
* **Interest Groups**: Ann, TP, WF
* **Task IDs**:

## Description
(to be translated to English)

In het CLARIAH+ WP6-overleg van dinsdag 16 april 2019 is besloten een idee voor een gezamenlijke use case verder uit te werken. Het doel van deze use case is de tools en methodes van de verschillende partners in WP6 op elkaar af te stemmen. Als onderwerp is de VOC gekozen, enerzijds vanwege het rijke en veelzijdige bronnenmateriaal dat beschikbaar is over deze onderneming en haar activiteiten, anderzijds vanwege de uitdagende en relevante historische onderzoeksvragen die met deze use case beantwoord kunnen worden.

### What is the research about?

Onderzoeksvragen - Historisch

- Welke verschuivingen traden er op in de aanwezigheid van de VOC in Indië en in de interactie van de compagnie met lokale vorsten en hun onderdanen (1600-1800)?
Op welke manier ontwikkelden de netwerken waar het personeel van de VOC in Azië deel van uitmaakte?
- Hoe ontwikkelde de wijze waarop in officiële documenten van de VOC werd geschreven over de lokale Indische bevolking, en over de interactie tussen het personeel van de VOC en de lokale bevolking?
- Hoe heeft de wijze waarop in secundaire literatuur wordt geschreven over de aanwezigheid van de VOC in Indië, de lokale Indische bevolking en de interactie tussen het personeel van de VOC en de lokale bevolking zich ontwikkeld?
- Hoe heeft de wijze waarop waarop in kranten, populaire tijdschriften en pamfletten wordt geschreven over de aanwezigheid van de VOC in Indië, de lokale Indische bevolking en de interactie tussen het personeel van de VOC en de lokale bevolking zich ontwikkeld?

#### Data

Sources:
- Generale Missiven (text from periods 1610-1767 and 1960-2007)
- Pieter van Dam, Beschryvinge van de Oostindische Compagnie (1692-1701)
- Dagh-register gehouden int Casteel Batavia vant passerende daer ter plaetse als over geheel Nederlandts-India (1624-1682, uitgegeven in periode 1887-1931)
- De dagregisters van het kasteel Zeelandia, Taiwan (1629-1662, uitgegeven in periode 1986-2000)
- several relevant books, newpaper articles and periodicals
- a range of available relevant structural data Sources

### What software and services are involved?

- NER and entity linking pipeline, based on existing tools of VU ('newsreader pipeline')
- Inception, tool for manual and semi-automatic text annotation, to create ground truth for NER
- TextFabric (DANS), used in experiment concerning Generale Missiven
- custom tooling for data conversions

## References

References to related resources and publications and especially links to related use-cases:

* [CLARIAH](https://clariah.nl)