GROBID
Apparence
GROBID
Développé par | Patrice Lopez (d) |
---|---|
Première version | [1] |
Dernière version | 0.8.1 ()[2] |
Dépôt | github.com/kermitt2/grobid |
Formats lus | Portable Document Format |
Formats écrits | ContextObjects in Spans |
Licence | Licence Apache 2.0 |
Documentation | grobid.readthedocs.io |
Site web | github.com/kermitt2/grobid |
GROBID est un logiciel libre d'extraction d'information dans des publications scientifiques.
Le nom GROBID vient de GeneRation Of BIbliographic Data[3].
Le logiciel est développé par Patrice Lopez.
GROBID permet d'extraire des méta-données, des références bibliographiques et des entités dans les publications scientifiques[4].
GROBID est aussi utilisé pour d'autres usages. Par exemple, le logiciel a été utilisé pour identifier des entités nommées dans des journaux personnels de la seconde guerre mondiale[5].
GROBID est utilisé sur la plateforme HAL pour repérer automatiquement les références citées[6].
Notes et références
[modifier | modifier le code]- John W. Maxwell, Leena Desai, Carmen Tiampo, Emma Walter, Ellen Michelle, Melody Sun, Kim O'Donnell, Erik Hanson, Avvai Ketheeswaran, Mind the Gap: A Landscape Analysis of Open Source Publishing Tools and Platforms (texte), PubPub.org, .
- « Release 0.8.1 », (consulté le )
- Patrice Lopez, « GROBID: Combining automatic bibliographic data recognition and term extraction for scholarship publications », International conference on theory and practice of digital libraries,, , p. 473-474
- Laurent Romary et Patrice Lopez, « Grobid-information extraction from scientific publications », ERCIM News, no 100,,
- GROBID for Humanities When engineering meets History Charles Riondet, Luca Foppiano Text as a Resource. Text Mining in Historical Science, 2017
- « Grobid - Observatoire des technologies de l'IST », sur inrae.fr via Wikiwix (consulté le ).