Atlas de Datos es un catálogo sobre colecciones digitales y corpus de textos y documentos en español. Los datos están aquí: https://github.com/morethanbooks/atlas-de-datos/blob/master/atlas%20de%20datos.csv
Debido a la situación de digitalización del español, incluyo casi cualquier tipo de formato digital: PDF, imágenes, web, eBooks, XML, markup vario o TEI. Me he centrado principalmente en colecciones de textos literarios o colecciones que no encajan en la lingüística de corpus. Para saber más sobre corpus lingüísticos en español recomiendo Infoling: http://infoling.org/search/recursos/search.php
Hasta ahora Atlas de Datos da acceso a los datos mediante una tabla CSV en la que cada proyecto es una fila y los campos de descripciones son columnas. Es posible que en el futuro se dé acceso de otras maneras, aunque la principal tarea será la recolección de nuevos recursos.
Si quieres aportar nuevas fuentes o modificaciones a las actuales, puedes crear un Issue en GitHub. Me encantaría contar con colaboradores recurrentes, en cuyo caso podría dar acceso para editar el repositorio.
Agradezco a Carlos Fernández y a Antonio Rojas Castro que me hayan enviado varias fuentes que me eran desconocidas.
Desde luego no he sido el primero al que se la ha ocurrido listar y observar críticamente los rasgos de proyectos de digitalización, aunque hasta ahora no conocía ningún proyecto que recogiese fuentes de textos y datos literarios de manera sistemática para el español. Algunos proyectos interesantes que me han servido de inspiración y complementan en otras áreas, lenguas o con otras metodologías Atlas de Datos son (señalando solo uno de sus principales autores):
- A Catalogue of Digital Editions, Greta Franzini: https://github.com/gfranzini/digEds_cat
- Textdaten Romanistik Home, Annette Gerstenber: http://wikis.fu-berlin.de/display/tdr/Textdaten+Romanistik+Home
- Digital Scholarly Editions, Patrick Sahle: http://www.digitale-edition.de/
- RIDE, Philipp Steinkrüger: http://ride.i-d-e.de/
- Infoling, Carlos Subirats Rüggeberg: http://infoling.org/search/recursos/search.php
Si este recurso te parece interesante y te descubre fuentes de textos con las que investigar, puedes citarlo con los siguientes datos:
- Calvo Tello, José (2016): Atlas de Datos. Würzburg, Universität Würzburg. https://github.com/morethanbooks/atlas-de-datos