- documentazione software: README.md per la parte di mapping; manca quella per la parte di analisi dei risultati. Ne faccio una unica?
- scaricato il dump OpenAlex di dicembre 2023 (grazie Ivan); mandato processo per creare tabelle con gli IDs delle risorse in OpenAlex
- errore nel creare un indice di tabella (
DoiWorks.supported_id
) nel database sqlite per gli OpenAlex ID:
- sqlite3.OperationalError: database or disk is full: limite SQLite3 al numero di pagina? copia del DB nella cartella temporanea eccede memoria? Il secondo caso mi sembra strano visto che ho mandato il processo sul server. Il DB pesa 7.3G sul disco.
- Dipendeva dal fatto che un processo lanciato da Arca saturava la memoria. Lanciato dopo che l’ha sistemato e funziona tutto.
- al momento nel codice ci sono delle features parziali anche per la gestione di venues e reponsible agents: es. il “pre-processing” dei CSV di Meta produce delle tabelle anche per venues e responsible agents, che però non vengono usate nelle fasi successive; nella classe per processare i dati OpenAlex ci sono dei metodi per gestire authors, publishers, e institutions; ecc. Lascio così?
- Ho lasciato anche le features in più e ho scritto nel README che derivano da delle sperimentazioni e che non vengono utilizzate per il processo per mappare le risorse bibliografiche.