Skip to content

SETAFDH/HTR-SETAF-Jean-Michel

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

372 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

HTR-SETAF-Jean-Michel

characters badge regions badge lines badge files badge

Ce dépôt contient les données OCR des ouvrages publiés par Jean Michel, maître-imprimeur à Genève de 1538 à 1544 qui rachète le matériel typographique de Pierre de Vingle. Les textes sont des imprimés français du XVIe siècle en caractères gothiques et la liste des textes avec plus de détails se trouve dans le tableau CSV du dépôt.

L'édition des Faits de Jésus Christ et du pape imprimée par J. Michel se trouve dans le dépôt HTR-SETAF-LesFaictzJCH.

Projet SETAF

GitHub du projet : https://github.com/SETAFDH

Site du projet : https://www.unige.ch/setaf

Financeur

Ce projet est financé par le Fonds national suisse (FNS). Numéro de projet : 205056.

Données

Les données se trouvent au chemin ‘./data//.xml‘ et sont au format ALTO. Elles suivent les normes de segmentation de SegmOnto et sont cataloguées sur HTR-United. Les fichiers sont corrigés manuellement : la qualité de la segmentation des pages et de la transcription produite par l'OCR est indiqué dans le tableau CSV du dépôt ("gold" ou "en cours").

Le contrôle de la transcription produite par l'OCR se base sur un guide redigé par l'équipe du projet : Solfrini et al., Guide de transcription pour les imprimés français du XVIe siècle en caractères gothiques, Version A, 2023, https://hal.science/hal-04281804.

Notre modèle d'OCR, CATMuS Gothic Print, est disponible en ligne : https://zenodo.org/records/10599911.

Infrastructure

Les données pour l'OCR sont produites à l'aide de l’instance genevoise FoNDUE d'eScriptorium.

Les calculs sont effectués à l'Université de Genève en utilisant le service HPC.

Licence

Les transcriptions sont CC-BY, et les images suivent les règles de différentes bibliothèques numériques : e-rara, ONB, Gallica, BSB, MDZ, Manchester Library Digital Collections, Réro Doc.

Citer le dépôt

  • Version 1.0: Sonia Solfrini, Geneviève Gross, Pierre-Olivier Beaulnes, Aurélia Marques Oliveira, Mylène Dejouy, Simon Gabay et Daniela Solfaroli Camillocci, Données OCR et segmentation des imprimés de Jean Michel (projet SETAF), version 1.0, Genève, université de Genève, 2023-2026, https://github.com/SETAFDH/HTR-SETAF-Jean-Michel.
@misc{solfrini_MichelSETAF_2023,
  author={Solfrini, Sonia and Gross, Geneviève and Beaulnes, Pierre-Olivier and Marques Oliveira, Aurélia and Dejouy, Mylène and Gabay, Simon and Solfaroli Camillocci, Daniela},
  title={Données OCR et segmentation des imprimés de Jean Michel (projet SETAF)},
  version={1.0},
  address={Genève},
  publisher={université de Genève},
  year={2023-2026},
  url={https://github.com/SETAFDH/HTR-SETAF-Jean-Michel},
}

Citer le projet

à venir

About

Données OCR dans le cadre du projet SETAF

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors