Par Emmanuel Chateau-Dutier et Caroline Corbières, texte de la présentation au Colloque annuel de la TEI 2021. Voir aussi le dépôt en ligne https://github.com/publicarchi/objectModel/

En tant que modèle consacré à la représentation du texte, la Text Encoding Initiative (TEI) n’est pas principalement orientée vers la description des objets patrimoniaux. Néanmoins dans différents contextes les éditeurs peuvent avoir à faire avec des manuscrits ou des textes inscrits sur des supports qui présentent des qualités matérielles et physiques. Par ailleurs, la TEI a souvent été mobilisée en histoire de l’art dans des projets pionniers (Château-Dutier 2021). Afin de faciliter la description des objets patrimoniaux, le Consortium de la TEI a récemment introduit un nouvel élément <object> dont la création était réclamée depuis plusieurs années (Cojannot-Leblanc Chateau-Dutier 2015, TEIC/TEI Issue #327, Raybuck et Stanley 2019). Son modèle de contenu s’inspire de celui de l’élément <msDesc>. S’il s’avère très riche et approprié pour la description des manuscrits et de leurs caractéristiques matérielles (support, reliure, écritures, enluminure et ornementation, montage des cahiers, etc.) ce modèle manque de généricité pour couvrir l’ensemble des besoins communs des historiens de l’art. Or, certaines entreprises d’édition numérique peuvent avoir besoin de documenter des œuvres au même titre qu’elles traitent les personnes, les organisations ou les lieux en ayant recours aux entités définies dans le module namesdates de la TEI.

Contexte du projet

Le travail que nous présentons a notamment été réalisé dans le cadre du projet d’édition de L’Architecture considérée sous le rapport de l’Art des mœurs et de la législation de Claude-Nicolas Ledoux qui est l’ouvrage à la fois le plus célèbre et le plus énigmatique de toute l’architecture moderne européenne. L’illustration de l’ouvrage est remarquable tant par l’ambition que la qualité de sa gravure. Des cinq tomes annoncés par le prospectus, seul le premier volume a paru en 1804. Mais Ledoux travailla durant trente années à l’illustration de l’ensemble, ce dont témoignent les deux autres volumes édités par l’architecte Ramée en 1847, et un important recueil factice conservé à la BHVP aujourd’hui numérisé, ainsi que diverses planches isolées souvent restées inédites.

Si la célébrité du texte de 1804 a justifié quelques réimpressions, L’Architecture de Ledoux n’a jamais encore fait l’objet d’une véritable édition scientifique. En outre l’intégralité de son projet éditorial n’a pu être étudiée faute d’avoir rassemblé et analysé de manière systématique l’ensemble des planches (près de 500) et plusieurs manuscrits qui témoignent de la préparation de l’entreprise (prospectus, brouillons pour le développement, correspondance). Nous nous sommes proposés d’entreprendre une édition critique numérique destinée à élucider les différents niveaux de lecture du texte de 1804, en associant l’approche littéraire à l’histoire des idées politiques et artistiques du XVIIIe siècle. Afin de rendre compte de la dialectique nouvelle introduite par Ledoux entre le texte et l’image, le matériel iconographique fait l’objet d’un inventaire systématique qui suppose l’identification des dessins préparatoires et gravures dans les collections publiques et privées, et d’une étude approfondie des différents états des planches afin d’affiner la chronologie de la préparation de l’ouvrage. Il s’agit donc de restituer le travail inachevé de Ledoux et toute sa morale et didactique sur le rôle de l’architecture tant dans la société de l’Ancien régime que pour la nouvelle République.

Le projet présente donc des défis importants en matière de description des gravures puisqu’il s’agit de rendre compte de phénomènes éditoriaux complexes et de documenter les états tout en les mettant en rapport avec l’Œuvre projeté par l’architecte. Dans son état actuel, le modèle de contenu de l’élément <object> ne permet ni de traiter des gravures ni des édifices, dont la description peut reposer sur des modèles documentaires spécialisés en histoire de l’art et en bibliographie. Deux ontologies, compatibles entre elles, dominent ces deux domaines. D’une part le modèle conceptuel de référence du CIDOC pour les objets muséaux (CIDOC-CRM), d’autre part les Fonctionnalités requises des notices bibliographiques (FRBR) et le Modèle de référence des bibliothèques (LRM), dont les déclinaisons orientées objet permettent l’utilisation avec CIDOC-CRM.

Plusieurs formats XML implémentent ces modèles abstraits comme Lido pour l’échange de notices muséales, et RDA pour la description bibliographique notamment. Si Lido couvrait bien les besoins documentaires pour la description des gravures, il réclamait la mise au point de règles internes pour renseigner les états. Surtout, c’est plutôt un format d’échange qu’un format d’édition. Quant à RDA, le format n’est pas ouvert et sa déclinaison dans le domaine français en Intermarc de nouvelle génération pour la description des gravures n’a pas encore été complètement achevée. Quoiqu’il en soit, le projet consistant à proposer une édition de l’œuvre de Ledoux, il nous paraissait plus adéquat de ne pas séparer la description des gravures de l’édition du texte. L’image occupe en effet une place essentielle dans le projet éditorial de l’auteur. C’est la raison pour laquelle nous avons choisi de travailler sur une extension du modèle de contenu de l’élément <object> afin que la TEI puisse mieux être mise à profit en histoire de l’art.

Principes de développements

Depuis les développements introduits par la Proposal 5 de la Text encoding initiative, les chercheurs des disciplines historiques disposent de plusieurs éléments pour décrire de manière détaillée les entités telles que les personnes, les lieux ou les groupes (Driscoll 2006, Wittern, Ciula et Tuohy 2009). Ces additions permettent d’utiliser la TEI pour des travaux prosopographiques ou onomastiques soit dans le cadre de rétroconversion d’ouvrages spécialisés soit pour la préparation de répertoires et d’index qui sont liés à des éditions.

Le modèle de contenu de ces entités historiques est destiné à recevoir un ensemble de déclaration ou d’assertions qui appartiennent à trois groupes conceptuels : les traits, les états et les événements parmi lesquels se classent les sous-éléments. Il s’agit d’un modèle abstrait particulièrement riche et expressif pour prendre en charge l’information historique. Conceptuellement, le modèle est compatible avec l’ontologie CIDOC-CRM qui est une ontologie orientée événement comme l’ont montré les travaux du SIG ontologie.

La personnalisation que nous proposons essaye autant que possible de réutiliser les structures déjà adoptées pour les modèles de contenu des personnes, des lieux ou des organisations afin d’étendre celui de l’élément <objet>. Rien ne justifiait que le nouvel élément ne dispose pas des trois éléments génériques <state>, <event> et <trait> disponibles pour les autres entités. Aussi, lorsque de nouveaux éléments ont été créés, ceux-ci ont suivi des modèles comparables à ceux généralement adoptés dans la TEI pour leur nommage, leur organisation dans le système de classe ou leur modèle de contenu. De la même manière, les nouveaux éléments héritent des classes génériques définies par la TEI pour les attributs.

Afin de garantir la compatibilité du nouveau modèle de contenu de l’élément <object> avec le CIDOC-CRM, les choix de modélisation que nous avons opérés ont été guidés par une modélisation préalable avec cette ontologie en s’inspirant de modèle d’application comme LinkedArt. Ce travail, nous a amené à identifier plusieurs améliorations ponctuelles des sous-éléments disponibles dans <person>, <place> et <org> pour mieux prendre en charge, par exemple, la description des événements.

Description des divergences et des nouveautés

Voici la présentation des principales modifications introduites pour l’élément objet dont certaines peuvent par ailleurs inspirer des adaptations pour les autres entités historiques (person, places, org, msDesc).

Dans le domaine de l’histoire de l’art et du patrimoine culturel, la description des artefacts ne peut pas toujours reposer sur un nom ou un titre. En effet, certains artefacts culturels appartiennent plutôt à des séries ou des ensembles qui sont catalogués par l’utilisation de catégories. Dès lors, les sous-éléments <objectName> forgés sur le même modèle que <placeName>, <persName> et <orgName> ne sont pas suffisants pour rendre compte d’un objet. Le nouvel élément <objectIdentifier> introduit au moment de la création de l’élément <object> ne résout pas complètement la question car il permet seulement de fournir des indications de localisation et d’identification comme on le fait actuellement dans la TEI pour la description des manuscrits à l’intérieur de <msDesc>.

Nous avons donc jugé bon d’introduire un nouvel élément pour regrouper les informations de classification qui suit les pratiques adoptées dans le monde muséal avec Lido ou dans LinkedArt. Lido distingue la catégorie d’un objet de sa classification, toutefois cette distinction n’est pas évidente. Dans LinkedArt, on utilise une description à deux niveaux qui permet de préciser la nomenclature en utilisant un type et une classification. Après avoir dans un premier temps songé à un nouvel élément <objectClassification> qui aurait pu contenir des sous-éléments <classification> et <category>, nous avons finalement opté pour l’utilisation d’un élément générique <classification> contenant des sous-éléments <category> comme cette structure peut également s’avérer utile pour la description des personnes, des lieux et des organisations. Les sous-éléments <category> peuvent au besoin être typés pour répliquer le typage à deux niveaux utilisés par LinkedArt.

Dans sa version actuelle, le modèle de contenu de <object> permet de décrire la reliure, le support ou encore l’écriture mais dans le contexte de la description d’objets culturels, ces modèles de contenus ne sont pas entièrement adaptés à la description des objets architecturaux ou des œuvres d’art. L’introduction d’un nouvel élément <mediumDesc> nous a paru compléter utilement le modèle de contenu de <object>. Cet élément conçu sur le modèle de <physDesc>, <bindDesc> ou <supportDesc>, peut contenir alternativement une description libre ou une description structurée avec un nouveau sous-élément <medium> qui est répétable et qui peut être lié à des vocabulaires.

Les événements résident au cœur du modèle CIDOC-CRM qui considère la vie des objets culturels. Un artefact peut être affecté par divers événements qui conduisent à sa fabrication, sa transformation ou sa restauration, voire sa destruction ou encore son déplacement. Aussi, il nous a paru possible de rendre le modèle de contenu de l’élément <event> beaucoup plus cohérent avec CIDOC-CRM moyennant quelques ajustements simples. Dans l’ontologie CIDOC-CRM, les événements mettent en présence des acteurs, des lieux et des entités temporelles. Pour suivre ce modèle, nous avons créé un sous-élément <participant> pour regrouper des acteurs avec un rôle <role>, et rendu disponible les éléments <placeName> et <date>. Ces ajouts ne changent rien à l’utilisation habituelle de l’élément mais permettent une utilisation plus expressive d’un point de vue historique.

Les choix opérés pour l’extension du modèle de contenu de l’élément <object> que nous proposons ont été directement informés par une modélisation avec CIDOC-CRM. Comme ce modèle conceptuel de référence peut être utilisé de manière différente pour modéliser certains événements, nous avons choisi de nous baser sur deux utilisations récentes dans le domaine de l’histoire de l’art et du patrimoine (LinkedArt et SARI). Ainsi, il était facilement possible de proposer des mapping du nouvel élément objet vers CIDOC-CRM ainsi qu’une conversion vers RDF en XQuery.

En vue de simplifier la conversion vers RDF, nous suggérons l’emploi d’un jeu d’attributs qui s’inspire des exemples mentionnés dans les Guidelines pour la description des relations ou l’utilisation de CIDOC-CRM dans la documentation des éléments pour faire référence à des vocabulaires ou des ontologies (https://tei-c.org/release/doc/tei-p5-doc/en/html/ref-relation.html, https://tei-c.org/release/doc/tei-p5-doc/es/html/TD.html). Notre utilisation diffère par l’emploi de l’attribut @key pour le nom de l’entité.

Conclusion

Comme vous l’aurez compris, nous avons privilégié une personnalisation simple qui respecte généralement le modèle de contenu des entités historiques de la TEI tout en préservant la rétrocompatibilité du modèle. L’ensemble de ces propositions ont fait l’objet d’une spécification en ODD et d’une documentation accessible en ligne. Des scripts de conversion vers CIDOC-CRM ont été rédigés en XQuery. De notre point de vue, cette personnalisation de la TEI nous paraît mieux servir les besoins de la TEI pour l’histoire de l’art mais pourraît aussi plus largement bénéficier aux modèles de contenus destinés à la description des manuscrits. Somme toute, les textes inscrits sont bel et bien des artefacts culturels, et les possibilités actuellement offertes par la TEI restent trop limitées pour la description des enluminures notamment. Nous invitons donc la communauté à engager une réflexion sur le modèle de contenu d’object en lien avec un travail sur la description des manuscrits.

Bibliography

  • Allemang, Dean, James A Hendler, et Fabien Gandon. 2020. Semantic Web for the Working Ontologist: Effective Modeling for Linked Data, RDFS, and OWL.
  • « An Element · Issue #327 · TEIC/TEI ». s. d. GitHub. Consulté le 29 mai 2021. https://github.com/TEIC/TEI/issues/327.
  • Bekiari, Chryssoula, George Bruseker, Martin Doerr, Christian-Emil Ore, Stephen Stead, et Athanasios Velios. 2021. « Definition of the CIDOC Conceptual Reference Model ». version 7.1.1. CIDOC CRM Special Interest Group. http://www.cidoc-crm.org/version/version-7.1.1.
  • Burnard, Lou. 2013. « Resolving the Durand Conundrum ». Journal of the Text Encoding Initiative, no 6 (septembre). https://doi.org/10.4000/jtei.842.
  • ———. 2020. « What Is TEI Conformance, and Why Should You Care? » Journal of the Text Encoding Initiative, no Issue 12 (mai). https://doi.org/10.4000/jtei.1777.
  • Carboni, Nicola. 2017. Documentation sémantique d’objets patrimoniaux à travers des représentations visuelles et iconographiques. https://hal.archives-ouvertes.fr/hal-01526781.
  • Carboni, Nicola, et Livio de Luca. 2017. « Towards a Semantic Documentation of Heritage Objects through Visual and Iconographical Representations ». International Information & Library Review 49 (3): 207‑17. https://doi.org/10.1080/10572317.2017.1353374.
  • Ciotti, Fabio, et Francesca Tomasi. 2016. « Formal Ontologies, Linked Data, and TEI Semantics ». Journal of the Text Encoding Initiative, no 9 (septembre). https://doi.org/10.4000/jtei.1480.
  • Ciula, Arianna, et Øyvind Eide. 2014. « Reflections on cultural heritage and digital humanities: modelling in practice and theory ». In Proceedings of the First International Conference on Digital Access to Textual Cultural Heritage, 35‑41. DATeCH ’14. New York, NY, USA: Association for Computing Machinery. https://doi.org/10.1145/2595188.2595207.
  • Clavel, Thierry. 2019. « FRBR, RDA, BibFrame : comment prendre en compte ces nouveaux standards ? » In Réinformatiser une bibliothèque, édité par Anna Svenbro. La Boîte à outils. Villeurbanne: Presses de l’enssib. http://books.openedition.org/pressesenssib/6742.
  • « DOnnées Patrimoniales HEritage DAta ». 2020. Répertoire canadien d’information sur le patrimoine. https://chin-rcip.github.io/collections-model/.
  • Driscoll, M J. 2006. « XML Markup of Biographical and Prosopographical Data ». In TEI Day in Kyoto 2006, 75‑83. Kyoto Institute for Research in Humanities: Kyoto University. http://coe21.zinbun.kyoto-u.ac.jp/tei-day/TEIDayKyoto2006.pdf.
  • Eide, Øyvind. 2014. « Ontologies, Data Modeling, and TEI ». Journal of the Text Encoding Initiative, no 8 (décembre). https://doi.org/10.4000/jtei.1191.
  • Guillem, Anais, George Bruseker, et Paola Ronzino. 2017. « Process, Concept or Thing? Some Initial Considerations in the Ontological Modelling of Architecture ». International Journal on Digital Libraries 18 (4): 289‑99. https://doi.org/10.1007/s00799-016-0188-0.
  • Heath, Tom, et Christian Bizer. 2011a. Linked Data: Evolving the Web into a Global Data Space. 1. ed. Synthesis Lectures on the Semantic Web: Theory and Technology 1. San Rafael, Calif.: Morgan & Claypool.
  • ———. 2011b. « Linked Data: Evolving the Web into a Global Data Space ». Synthesis Lectures on the Semantic Web: Theory and Technology 1 (1): 1‑136. https://doi.org/10.2200/S00334ED1V01Y201102WBE001.
  • Jones, Ed, et Michele Seikel, éd. 2016. Linked data for cultural heritage. An ALCTS monograph. Chicago: ALA Editions, an imprint of the American Library Association.
  • « Linked Art ». s. d. Consulté le 2 avril 2020. https://linked.art/.
  • Newbury, David. s. d. « LOUD: Linked Open Usable Data and Linked.Art », 11.
  • Ore, Christian-Emil, et Øyvind Eide. 2009. « TEI and cultural heritage ontologies: Exchange of information? » Literary and Linguistic Computing 24 (2): 161‑72. https://doi.org/10.1093/llc/fqp010.
  • Øyvind, Eide. 2019. « Ontologies and Data Modeling ». In Shape of Data in Digital Humanities: Modeling Texts and Text-Based Resources., édité par Julia Flanders et Fotis Jannidis. Routledge.
  • Raybuck, Suzanne Michelle, et Sarah C. Stanley. 2019. « An Exploration of using Antarctic Artifacts ». In . https://gams.uni-graz.at/o:tei2019.113.
  • « Swiss Art Research Infrastructure (SARI) ». s. d. Consulté le 4 mars 2021. https://swissartresearch.net/.
  • TEI Consortium. 2021. « Guidelines for Electronic Text Encoding and Interchange, P5 ». 2021. https://www.tei-c.org/release/doc/tei-p5-doc/en/html/index.html.
  • Wittern, Christian, Arianna Ciula, et Conal Tuohy. 2009. « The making of TEI P5 ». Literary and Linguistic Computing 24 (3): 281‑96. https://doi.org/10.1093/llc/fqp017.
  • Wood, David, Marsha Zaidman, Luke Ruth, et Michael Hausenblas. 2014. Linked data: structured data on the Web. Shelter Island, NY: Manning.