162598
È stata scelta la soglia di ____ OAID per OMID per accettare la mappatura. La soglia è stata scelta sulla base di queste osservazioni, differenziate per tipo di risorsa.
Journal article
Sono mappati soltanto attraverso DOI, e — solo in mancanza di questo — attraverso PMID e PMCID. Questo è per limitare i casi di multi-mappatura. Infatti, si sono osservati casi in cui ad uno stesso articolo con più PID associati, OpenAlex ha assegnato più OpenAlex ID, uno per ogni tipo di PID. In particolare, i PID in questione sono DOI e PMID/PMCID. Ad esempio vedi:
- br/0620917842', ['W2030648626', 'W4243408618']: un’entità ha un PMID associato, l’altra no (ma hanno entrambe lo stesso DOI). OpenAlex non “schiaccia” due entità che in realtà sono la stessa, come viene correttamente riconosciuto in OC Meta.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/0690328261',
'openalex_id': ['https://api.openalex.org/W2430944810',
'https://api.openalex.org/W2436631477',
'https://api.openalex.org/W2400069297']}: tutte e tre le entità in OpenAlex hanno lo stesso DOI associato, ma ciascuna ha un suo PMID. Questo errore deriva dalla sorgente, dal fatto che PubMed fa change-tracking attraverso il DOI: per questa ragione, un DOI su PubMed può rimanere collegato a tutti i metadati (diversi, anche al punto di essere appartenenti a distinte entità) che gli vengono associati nel tempo (ad esempio nel caso di errori).
La scelta di accettare la mappatura soltanto gli OMID con al massimo ___ OpenAlex corrispondenti è stata fatta per prevenire l’inserimento di errori nella mappatura. Infatti, nei casi in cui ad un OMID corrispondono più di ___ OpenAlex ID sono stati rilevati errori, incongruenze o anomalie in quantità maggiore.
Sono state osservate le seguenti situazioni:
-
Ci sono più DOI per lo stesso articolo; uno corrisponde alla pubblicazione su rivista, gli altri corrispondono a una versione del preprint (es. finiscono con /v1, /v2, ecc.), dove tutte le versioni sono pubblicate nella stessa repository per pubblicazione di preprints (e.g. Zenodo, ResearchSquare, SSRN, ecc.). Fanno parte di questa categoria anche i casi in cui ci sono solo 2 DOI, uno per la version of record e l’altro per il preprint.
- Nell’esempio che segue, solo un DOI è quello della version of record, gli altri sono DOI di versioni diverse e successive pubblicate tutte sulla stessa piattaforma (in questo caso ResearchSquare).
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/0620144967',
'openalex_id': ['https://api.openalex.org/W4238508794',
'https://api.openalex.org/W4234100852',
'https://api.openalex.org/W3041394773',
'https://api.openalex.org/W4256700501',
'https://api.openalex.org/W4232544893']}
- Esempio con 3 DOI: due per v1 e v2 su ResearchSquare, uno per la version of record.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203844269',
'openalex_id': ['https://api.openalex.org/W4245951410',
'https://api.openalex.org/W4230572514',
'https://api.openalex.org/W3000533881']}
- Altro esempio: 2 DOI per SSRN e 1 per il Journal of the European Economic Association, ma non sono altro che tre versioni (possibilmente anche uguali tra di loro??) dello stesso articolo.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06804290097',
'openalex_id': ['https://api.openalex.org/W2147236817',
'https://api.openalex.org/W3021410747',
'https://api.openalex.org/W3123992341']}
- Altro esempio. L’articolo è pubblicato su una rivista (The Journal of Finance), ma ha anche tre versioni di preprint sulla piattaforma SSRN.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203843715',
'openalex_id': ['https://api.openalex.org/W3125828385',
'https://api.openalex.org/W2891210250',
'https://api.openalex.org/W4299628050',
'https://api.openalex.org/W4300763908']}
- Altro esempio, con DOI pubblicati su piattaforma preprints.org (anche qui le diverse versioni dello stesso preprint sono segnalate come tali e linkano alla version of record).
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06402278118',
'openalex_id': ['https://api.openalex.org/W3048408493',
'https://api.openalex.org/W4245707440',
'https://api.openalex.org/W3125586522']}
- Esempio con 2 DOI: uno per version of record, l’altro per il preprint.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104317053',
'openalex_id': ['https://api.openalex.org/W4230290776',
'https://api.openalex.org/W2135822555']}
-
Ci sono più DOI per lo stesso articolo, poiché uno è associato alla version of record (il DOI della manifestation che consiste nella pubblicazione nella venue) e ciascuno degli altri è associato ad un preprint, dove i preprint (indipendentemente dal fatto che siano uguali tra loro o no) sono pubblicati in repository diverse.
- Ad esempio nel caso seguente, c’è un DOI (10.1111/1755-0998.13666) che è quello della version of record su Molecular Ecology Resources edito da Wiley-Blackwell, mentre gli altri sono tutti DOI di preprint dello stesso articolo, pubblicate su diversi servizi di hosting/repository/archivi (ETH, Authorea, BioArXiv). Meta ha 4 DOI, mentre OpenAlex, si vede, ne ha soltanto 3 (manca quello di ETC).
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06804288498',
'openalex_id': ['https://api.openalex.org/W4200217795',
'https://api.openalex.org/W4200577479',
'https://api.openalex.org/W4282926185']}
-
Ci sono più DOI per lo stesso articolo, dei quali uno è assegnato dal publisher, mentre gli altri sono assegnati da servizi di hosting o da biblioteche (anche se la versione/edizione è esattamente la stessa, cioè se le entità coincidono a livello di manifestation(?)).
- Nell’esempio seguente, con 2 OAID, lo stesso articolo ha un DOI per la venue in cui è stato pubblicato e un DOI “emanato” dalla Carolina Digital Repository (University of North Carolina at Chapel Hill): nella pagina dell’articolo nella repository sono addirittura distinti e visibili entrambi i DOIs.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062201549812',
'openalex_id': ['https://api.openalex.org/W2507587390',
'https://api.openalex.org/W4300812420']}
- Altro esempio uguale a quello sopra:
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203842648',
'openalex_id': ['https://api.openalex.org/W4238723245',
'https://api.openalex.org/W2109264569']}
- Esempio con DOI dell’editore e DOI della online library spagnola “SciELO”.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104317790',
'openalex_id': ['https://api.openalex.org/W2087916104',
'https://api.openalex.org/W4238410444']}
-
Ci sono più DOI erroneamente associati allo stesso articolo. Non è sempre possibile spiegare perché questo accada, e più sono i DOI coinvolti, più diventa difficile raggiungere una spiegazione. Un caso come questo si osserva anche con mapping 1:2 (per quanto, in teoria, dovrebbe essere piuttosto raro).
- DOIs ASSEGNATI ALLE NOTE DI CORREZIONE. Nella fattispecie degli esempi che seguono, un DOI è associato correttamente all’articolo, gli altri sono associati a una nota di rettifica degli errori (alla quale è stato associato un DOI a sua volta!). N.b.: questo DOI, ad esempio, non è associato all’articolo emendato, ma al documento che segnala che degli errori sono stati individuati e corretti; in altre parole, anche l’errata corrige ha un DOI 😒.
-
{'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203842870',
'openalex_id': ['https://api.openalex.org/W2756226120',
'https://api.openalex.org/W4240268123']}
-
{'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203842260',
'openalex_id': ['https://api.openalex.org/W2096123821',
'https://api.openalex.org/W2113238336']}
-
{'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/0640208495',
'openalex_id': ['https://api.openalex.org/W4241934070',
'https://api.openalex.org/W4233337713',
'https://api.openalex.org/W2126871957']}
-
In questo caso ci sono 2 DOI, uno per l’articolo e uno per l’erratum. Tuttavia, in OpenAlex, i 2 DOI sono entrambi collegati allo stesso PMID, che è quello dell’erratum.
{'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104317811',
'openalex_id': ['https://api.openalex.org/W2759335451',
'https://api.openalex.org/W4244299023']}
-
Ci possono essere più DOI tutti corrispondenti a delle versions of record, o meglio tutti per articoli pubblicati in riviste peer-reviewed. Vedi anche concetto di reprint.
- Questa pubblicazione (sono delle guidelines) è stata pubblicata su almeno tre journals diversi a distanza di pochi mesi (non si tratta quindi, verosimilmente di diverse versioni, ma solo di diverse venue). Immagino che casi come questo siano più frequenti quando la pubblicazione non è propriamente un journal article, ma qualcosa tipo guidelines (tanto che nei siti dei journals viene taggato come “special article”, “reviews and features article”, ecc.).
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203841832',
'openalex_id': ['https://api.openalex.org/W3022235427',
'https://api.openalex.org/W2069780509',
'https://api.openalex.org/W2140545719']}
- In questo esempio, quello che sembra essere lo stesso articolo (titolo ad autori sono uguali) è pubblicato su due riviste diverse, di cui una è open access e l’altra no.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062201558049',
'openalex_id': ['https://api.openalex.org/W3011091366',
'https://api.openalex.org/W2145685810']}
- Questo è chiaramente un caso di reprint (come viene anche menzionato nel sito della rivista che pubblica l’articolo la seconda volta): lo stesso articolo prima viene pubblicato su “BMC Family Practice”, poi è re-printed su “Focus” un anno dopo. Casi simili sono un problema? Andrebbero gestiti diversamente in Meta? Tecnicamente si tratta dello stessa entità a livello di expression, ma di manifestations diverse (?). Il problema maggiore sarebbe, immagino, associare degli attributi tipici del livello manifestation (data di pubblicazione, editore) alla stessa entità: ad esempio, se la venue è sempre solo una, qual è la venue dell’articolo nell’esempio sottostante?
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104323485',
'openalex_id': ['https://api.openalex.org/W2736347343',
'https://api.openalex.org/W2410862180']}
- Il caso limite, anche se per una risorsa “Unspecified” che in realtà è un journal article, è di 32 (!) OAID, tutti per reprints/e-prints tranne uno che non c’entra.
- {'omid': '\ref',
'openalex_id': ['https://api.openalex.org/W2790709064',
'https://api.openalex.org/W2791397194',
'https://api.openalex.org/W4230246895',
'https://api.openalex.org/W2797094253',
'https://api.openalex.org/W2895883338',
'https://api.openalex.org/W2965690162',
'https://api.openalex.org/W2789144167',
…}
-
C’è un solo DOI per più OAID (cioè lo stesso DOI è riportato per più records in OpenAlex).
- In questo esempio, alle due entità in OA è associato lo stesso DOI. Cambiano data di pubblicazione e titolo (che è quello originale in tedesco in un caso, e la sua traduzione/adattamento in inglese nell’altro). Con ogni probabilità, i metadati di una risorsa sono stati presi da Crossref (quelli in tedesco) e gli altri da PubMed (i metadati in inglese).
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06201769409',
'openalex_id': ['https://api.openalex.org/W2420651258',
'https://api.openalex.org/W1544114672']}
- Altro esempio uguale a quello sopra: titolo in inglese e tedesco, PMID solo su un record.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06201769034',
'openalex_id': ['https://api.openalex.org/W2399372185',
'https://api.openalex.org/W3190189202']}
- Ancora un altro esempio esattamente uguale
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06201769739',
'openalex_id': ['https://api.openalex.org/W101017206',
'https://api.openalex.org/W2162606342']}
- Esempi come quelli elencati qui sopra sono molto numerosi, e hanno tutti delle caratteristiche comuni: data di pubblicazione con pochi giorni/mesi di differenza (anche se a volte è la stessa), un titolo in tedesco e uno in inglese, un record con PMID (quello col titolo in inglese) e uno senza (quello col titolo originale in tedesco). Il MAG ID è sempre (?) diverso.
- In quest’altro esempio, lo stesso DOI è associato a due OAID distinti, cui però sono associati anche gli stessi metadati, con l’unica differenza che un record ha il PMID e l’altro no; inoltre hanno due MAG distinti.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06201769612',
'openalex_id': ['https://api.openalex.org/W87612716',
'https://api.openalex.org/W1498837339']}
-
Casi con moltissimi OAID.
- DOI di articoli distinti, pubblicati tutti all’interno della stessa rivista, unificati in Meta. Alcuni hanno tutti lo stesso titolo, ma sono pubblicati in issue e volumi diversi (si tratta, in tutti i casi analizzati, di rubriche fisse).
-
31 OAID, tutti per la rubrica “Ethics briefings” in diversi volumi e issues della rivista Journal of Medical Ethics (gli autori cambiano ma non sempre).
{'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203823624',
'openalex_id': ['https://api.openalex.org/W4235464468',
'https://api.openalex.org/W4231504487',
'https://api.openalex.org/W2237530610',
'https://api.openalex.org/W4251094650',
'https://api.openalex.org/W2190566305',
'https://api.openalex.org/W4234925118',
…}
-
31 OAID, tutti per la rubrica “Dissertations of note” (in cui sempre lo stesso autore riassume, periodicamente, i contenuti di tesi notevoli recenti) all’interno di diversi volumi e issues della rivista “Children’s literature”.
{'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104286503',
'openalex_id': ['https://api.openalex.org/W4214676096',
'https://api.openalex.org/W4252235458',
'https://api.openalex.org/W4237481885',
'https://api.openalex.org/W4250191279',
'https://api.openalex.org/W4240197524',
…}
-
47 OAID. Entrambi gli esempi sottostanti sono rubriche (tutti gli articoli hanno lo stesso titolo e lo stesso autore).
-
197 OAID. Anche in questo caso, che è quello con il maggior numero di OAID per uno stesso OMID, si tratta di un rubrica, nello specifico “Cardiovascular News” all’interno della rivista “Circulation”.
-
Altri casi:
- Su OC Meta abbiamo solo un PMID per questo articolo, mentre OpenAlex ha 2 records, uno con soltanto il PMID, l’altro con il PMID e il DOI. In questo caso l’articolo è multi-mapped a causa del PMID, non del DOI (che non viene proprio considerato nel processo di mapping, non essendo presente in Meta per questa risorsa). I due PMID sono associati esattamente allo stesso articolo (stessi autori, data di pubblicazione, venue/issue e abstract) → l’errore è su PubMed
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203842050',
'openalex_id': ['https://api.openalex.org/W4290298464',
'https://api.openalex.org/W34186816']}
- Caso simile (ma completamente senza DOI). 2 PMID per lo stesso articolo, che però qui è pubblicato su due venue diverse a distanza di un anno (caso di reprint?) → qui non c’è per forza un errore in PubMed (che forse ammette di associare PMID diversi allo stesso articolo, quando esso sia pubblicato su riviste diverse?).
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104317158',
'openalex_id': ['https://api.openalex.org/W3025821853',
'https://api.openalex.org/W2443871661']}
- Questo non me lo spiego. Tre “articoli” di tre autori diversi (ma con lo stesso titolo), sono stati schiacciati in un’unica entità. Chiaramente un errore in Meta.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06402245385',
'openalex_id': ['https://api.openalex.org/W1991855040',
'https://api.openalex.org/W2052431985',
'https://api.openalex.org/W3045319486']}
- 2 DOI, di due pubblicazioni completamente distinte, ma esattamente con lo stesso titolo, unificate in Meta (chiaramente errore nostro). Non sembra essere un caso isolato quello per cui i PID di articoli distinti ma con lo stesso titolo vengono associati ad una stessa entità in Meta: questo accade perché è stata fatta una scelta programmatica nel processo di curatela di OC Meta, oppure deriva da errori delle sorgenti?
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104323830',
'openalex_id': ['https://api.openalex.org/W1619222600',
'https://api.openalex.org/W2023056611']}
- Due articoli diversi, ma molto simili: oltre allo stesso titolo, anche gli autori sono gli stessi e scrivono dello stesso tema, su due riviste diverse, rispettivamente 2012 27th Annual IEEE Symposium e ACM Transactions on Computational Logic. Da una pubblicazione all’altra, però, i contenuti sono leggermente cambiati (ad esempio, tra quello che si può vedere senza paywall, le references): si tratta di due expressions diverse dello stesso work? di due works distinti? In ogni caso, penso che sia sbagliato che abbiano lo stesso OMID.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104323657',
'openalex_id': ['https://api.openalex.org/W1987738956',
'https://api.openalex.org/W2048183302']}
- Due DOI, ma non c’è modo di sapere, essendo gli articoli dietro paywall, se si tratta di due expressions diverse (ovvero se ci sono state modifiche) o se si tratta semplicemente di un reprint (a distanza di qualche mese). Chiaramente entrambe le versioni sono versions of record e pubblicate su rivista. [questo esempio potrebbe dover andare nella categoria dei reprint].
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104323588',
'openalex_id': ['https://api.openalex.org/W2258096070',
'https://api.openalex.org/W1991995476']}
- Due DOI. Uno è quello dell’articolo, l’altro è quello di un “Invited commentary”, pubblicato in associazione all’articolo, ma chiaramente con autore e diverso tipo di contenuto (è appunto un commento al tema trattato dall’articolo) e quindi con il suo proprio DOI.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06230215767',
'openalex_id': ['https://api.openalex.org/W2912727803',
'https://api.openalex.org/W2017459344']}
- Tre DOI: due sono effettivamente della stessa entità (uno del publisher e uno della Carolina Digital Repository), l’altro rimanda sempre al sito del publisher ma fa riferimento ad un’altra pubblicazione.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062201143803',
'openalex_id': ['https://api.openalex.org/W1994362400',
'https://api.openalex.org/W2066338296',
'https://api.openalex.org/W4299414329']}
- 3 DOI: due sono associati agli stessi metadati, ma uno di questi (presente comunque anche in Crossref) è un link morto al sito dell’editore (pagina 404); il terzo è di un articolo sempre dello stesso journal ma completamente distinto (altri autori e titolo solo simile).
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203841461',
'openalex_id': ['https://api.openalex.org/W2081024653',
'https://api.openalex.org/W4236718611',
'https://api.openalex.org/W2006278415']}
- DOI non linkano a nulla.
- {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104323116',
'openalex_id': ['https://api.openalex.org/W1983889724',
'https://api.openalex.org/W4255140970']}