162598

È stata scelta la soglia di ____ OAID per OMID per accettare la mappatura. La soglia è stata scelta sulla base di queste osservazioni, differenziate per tipo di risorsa.

Journal article

Sono mappati soltanto attraverso DOI, e — solo in mancanza di questo — attraverso PMID e PMCID. Questo è per limitare i casi di multi-mappatura. Infatti, si sono osservati casi in cui ad uno stesso articolo con più PID associati, OpenAlex ha assegnato più OpenAlex ID, uno per ogni tipo di PID. In particolare, i PID in questione sono DOI e PMID/PMCID. Ad esempio vedi:

La scelta di accettare la mappatura soltanto gli OMID con al massimo ___ OpenAlex corrispondenti è stata fatta per prevenire l’inserimento di errori nella mappatura. Infatti, nei casi in cui ad un OMID corrispondono più di ___ OpenAlex ID sono stati rilevati errori, incongruenze o anomalie in quantità maggiore.

Sono state osservate le seguenti situazioni:

  1. Ci sono più DOI per lo stesso articolo; uno corrisponde alla pubblicazione su rivista, gli altri corrispondono a una versione del preprint (es. finiscono con /v1, /v2, ecc.), dove tutte le versioni sono pubblicate nella stessa repository per pubblicazione di preprints (e.g. Zenodo, ResearchSquare, SSRN, ecc.). Fanno parte di questa categoria anche i casi in cui ci sono solo 2 DOI, uno per la version of record e l’altro per il preprint.

    1. Nell’esempio che segue, solo un DOI è quello della version of record, gli altri sono DOI di versioni diverse e successive pubblicate tutte sulla stessa piattaforma (in questo caso ResearchSquare).
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/0620144967', 'openalex_id': ['https://api.openalex.org/W4238508794', 'https://api.openalex.org/W4234100852', 'https://api.openalex.org/W3041394773', 'https://api.openalex.org/W4256700501', 'https://api.openalex.org/W4232544893']}
    2. Esempio con 3 DOI: due per v1 e v2 su ResearchSquare, uno per la version of record.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203844269', 'openalex_id': ['https://api.openalex.org/W4245951410', 'https://api.openalex.org/W4230572514', 'https://api.openalex.org/W3000533881']}
    3. Altro esempio: 2 DOI per SSRN e 1 per il Journal of the European Economic Association, ma non sono altro che tre versioni (possibilmente anche uguali tra di loro??) dello stesso articolo.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06804290097', 'openalex_id': ['https://api.openalex.org/W2147236817', 'https://api.openalex.org/W3021410747', 'https://api.openalex.org/W3123992341']}
    4. Altro esempio. L’articolo è pubblicato su una rivista (The Journal of Finance), ma ha anche tre versioni di preprint sulla piattaforma SSRN.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203843715', 'openalex_id': ['https://api.openalex.org/W3125828385', 'https://api.openalex.org/W2891210250', 'https://api.openalex.org/W4299628050', 'https://api.openalex.org/W4300763908']}
    5. Altro esempio, con DOI pubblicati su piattaforma preprints.org (anche qui le diverse versioni dello stesso preprint sono segnalate come tali e linkano alla version of record).
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06402278118', 'openalex_id': ['https://api.openalex.org/W3048408493', 'https://api.openalex.org/W4245707440', 'https://api.openalex.org/W3125586522']}
    6. Esempio con 2 DOI: uno per version of record, l’altro per il preprint.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104317053', 'openalex_id': ['https://api.openalex.org/W4230290776', 'https://api.openalex.org/W2135822555']}
  2. Ci sono più DOI per lo stesso articolo, poiché uno è associato alla version of record (il DOI della manifestation che consiste nella pubblicazione nella venue) e ciascuno degli altri è associato ad un preprint, dove i preprint (indipendentemente dal fatto che siano uguali tra loro o no) sono pubblicati in repository diverse.

    1. Ad esempio nel caso seguente, c’è un DOI (10.1111/1755-0998.13666) che è quello della version of record su Molecular Ecology Resources edito da Wiley-Blackwell, mentre gli altri sono tutti DOI di preprint dello stesso articolo, pubblicate su diversi servizi di hosting/repository/archivi (ETH, Authorea, BioArXiv). Meta ha 4 DOI, mentre OpenAlex, si vede, ne ha soltanto 3 (manca quello di ETC).
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06804288498', 'openalex_id': ['https://api.openalex.org/W4200217795', 'https://api.openalex.org/W4200577479', 'https://api.openalex.org/W4282926185']}
  3. Ci sono più DOI per lo stesso articolo, dei quali uno è assegnato dal publisher, mentre gli altri sono assegnati da servizi di hosting o da biblioteche (anche se la versione/edizione è esattamente la stessa, cioè se le entità coincidono a livello di manifestation(?)).

    1. Nell’esempio seguente, con 2 OAID, lo stesso articolo ha un DOI per la venue in cui è stato pubblicato e un DOI “emanato” dalla Carolina Digital Repository (University of North Carolina at Chapel Hill): nella pagina dell’articolo nella repository sono addirittura distinti e visibili entrambi i DOIs.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062201549812', 'openalex_id': ['https://api.openalex.org/W2507587390', 'https://api.openalex.org/W4300812420']}
    2. Altro esempio uguale a quello sopra:
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203842648', 'openalex_id': ['https://api.openalex.org/W4238723245', 'https://api.openalex.org/W2109264569']}
    3. Esempio con DOI dell’editore e DOI della online library spagnola “SciELO”.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104317790', 'openalex_id': ['https://api.openalex.org/W2087916104', 'https://api.openalex.org/W4238410444']}
  4. Ci sono più DOI erroneamente associati allo stesso articolo. Non è sempre possibile spiegare perché questo accada, e più sono i DOI coinvolti, più diventa difficile raggiungere una spiegazione. Un caso come questo si osserva anche con mapping 1:2 (per quanto, in teoria, dovrebbe essere piuttosto raro).

    1. DOIs ASSEGNATI ALLE NOTE DI CORREZIONE. Nella fattispecie degli esempi che seguono, un DOI è associato correttamente all’articolo, gli altri sono associati a una nota di rettifica degli errori (alla quale è stato associato un DOI a sua volta!). N.b.: questo DOI, ad esempio, non è associato all’articolo emendato, ma al documento che segnala che degli errori sono stati individuati e corretti; in altre parole, anche l’errata corrige ha un DOI 😒.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203842870', 'openalex_id': ['https://api.openalex.org/W2756226120', 'https://api.openalex.org/W4240268123']}

      2. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203842260', 'openalex_id': ['https://api.openalex.org/W2096123821', 'https://api.openalex.org/W2113238336']}

      3. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/0640208495', 'openalex_id': ['https://api.openalex.org/W4241934070', 'https://api.openalex.org/W4233337713', 'https://api.openalex.org/W2126871957']}

      4. In questo caso ci sono 2 DOI, uno per l’articolo e uno per l’erratum. Tuttavia, in OpenAlex, i 2 DOI sono entrambi collegati allo stesso PMID, che è quello dell’erratum.

        {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104317811', 'openalex_id': ['https://api.openalex.org/W2759335451', 'https://api.openalex.org/W4244299023']}

  5. Ci possono essere più DOI tutti corrispondenti a delle versions of record, o meglio tutti per articoli pubblicati in riviste peer-reviewed. Vedi anche concetto di reprint.

    1. Questa pubblicazione (sono delle guidelines) è stata pubblicata su almeno tre journals diversi a distanza di pochi mesi (non si tratta quindi, verosimilmente di diverse versioni, ma solo di diverse venue). Immagino che casi come questo siano più frequenti quando la pubblicazione non è propriamente un journal article, ma qualcosa tipo guidelines (tanto che nei siti dei journals viene taggato come “special article”, “reviews and features article”, ecc.).
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203841832', 'openalex_id': ['https://api.openalex.org/W3022235427', 'https://api.openalex.org/W2069780509', 'https://api.openalex.org/W2140545719']}
    2. In questo esempio, quello che sembra essere lo stesso articolo (titolo ad autori sono uguali) è pubblicato su due riviste diverse, di cui una è open access e l’altra no.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062201558049', 'openalex_id': ['https://api.openalex.org/W3011091366', 'https://api.openalex.org/W2145685810']}
    3. Questo è chiaramente un caso di reprint (come viene anche menzionato nel sito della rivista che pubblica l’articolo la seconda volta): lo stesso articolo prima viene pubblicato su “BMC Family Practice”, poi è re-printed su “Focus” un anno dopo. Casi simili sono un problema? Andrebbero gestiti diversamente in Meta? Tecnicamente si tratta dello stessa entità a livello di expression, ma di manifestations diverse (?). Il problema maggiore sarebbe, immagino, associare degli attributi tipici del livello manifestation (data di pubblicazione, editore) alla stessa entità: ad esempio, se la venue è sempre solo una, qual è la venue dell’articolo nell’esempio sottostante?
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104323485', 'openalex_id': ['https://api.openalex.org/W2736347343', 'https://api.openalex.org/W2410862180']}
    4. Il caso limite, anche se per una risorsa “Unspecified” che in realtà è un journal article, è di 32 (!) OAID, tutti per reprints/e-prints tranne uno che non c’entra.
      1. {'omid': '\ref', 'openalex_id': ['https://api.openalex.org/W2790709064', 'https://api.openalex.org/W2791397194', 'https://api.openalex.org/W4230246895', 'https://api.openalex.org/W2797094253', 'https://api.openalex.org/W2895883338', 'https://api.openalex.org/W2965690162', 'https://api.openalex.org/W2789144167', …}
  6. C’è un solo DOI per più OAID (cioè lo stesso DOI è riportato per più records in OpenAlex).

    1. In questo esempio, alle due entità in OA è associato lo stesso DOI. Cambiano data di pubblicazione e titolo (che è quello originale in tedesco in un caso, e la sua traduzione/adattamento in inglese nell’altro). Con ogni probabilità, i metadati di una risorsa sono stati presi da Crossref (quelli in tedesco) e gli altri da PubMed (i metadati in inglese).
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06201769409', 'openalex_id': ['https://api.openalex.org/W2420651258', 'https://api.openalex.org/W1544114672']}
    2. Altro esempio uguale a quello sopra: titolo in inglese e tedesco, PMID solo su un record.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06201769034', 'openalex_id': ['https://api.openalex.org/W2399372185', 'https://api.openalex.org/W3190189202']}
    3. Ancora un altro esempio esattamente uguale
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06201769739', 'openalex_id': ['https://api.openalex.org/W101017206', 'https://api.openalex.org/W2162606342']}
    4. Esempi come quelli elencati qui sopra sono molto numerosi, e hanno tutti delle caratteristiche comuni: data di pubblicazione con pochi giorni/mesi di differenza (anche se a volte è la stessa), un titolo in tedesco e uno in inglese, un record con PMID (quello col titolo in inglese) e uno senza (quello col titolo originale in tedesco). Il MAG ID è sempre (?) diverso.
    5. In quest’altro esempio, lo stesso DOI è associato a due OAID distinti, cui però sono associati anche gli stessi metadati, con l’unica differenza che un record ha il PMID e l’altro no; inoltre hanno due MAG distinti.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06201769612', 'openalex_id': ['https://api.openalex.org/W87612716', 'https://api.openalex.org/W1498837339']}
  7. Casi con moltissimi OAID.

    1. DOI di articoli distinti, pubblicati tutti all’interno della stessa rivista, unificati in Meta. Alcuni hanno tutti lo stesso titolo, ma sono pubblicati in issue e volumi diversi (si tratta, in tutti i casi analizzati, di rubriche fisse).
      1. 31 OAID, tutti per la rubrica “Ethics briefings” in diversi volumi e issues della rivista Journal of Medical Ethics (gli autori cambiano ma non sempre).

        {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203823624', 'openalex_id': ['https://api.openalex.org/W4235464468', 'https://api.openalex.org/W4231504487', 'https://api.openalex.org/W2237530610', 'https://api.openalex.org/W4251094650', 'https://api.openalex.org/W2190566305', 'https://api.openalex.org/W4234925118', …}

      2. 31 OAID, tutti per la rubrica “Dissertations of note” (in cui sempre lo stesso autore riassume, periodicamente, i contenuti di tesi notevoli recenti) all’interno di diversi volumi e issues della rivista “Children’s literature”.

        {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104286503', 'openalex_id': ['https://api.openalex.org/W4214676096', 'https://api.openalex.org/W4252235458', 'https://api.openalex.org/W4237481885', 'https://api.openalex.org/W4250191279', 'https://api.openalex.org/W4240197524', …}

      3. 47 OAID. Entrambi gli esempi sottostanti sono rubriche (tutti gli articoli hanno lo stesso titolo e lo stesso autore).

      4. 197 OAID. Anche in questo caso, che è quello con il maggior numero di OAID per uno stesso OMID, si tratta di un rubrica, nello specifico “Cardiovascular News” all’interno della rivista “Circulation”.

  8. Altri casi:

    1. Su OC Meta abbiamo solo un PMID per questo articolo, mentre OpenAlex ha 2 records, uno con soltanto il PMID, l’altro con il PMID e il DOI. In questo caso l’articolo è multi-mapped a causa del PMID, non del DOI (che non viene proprio considerato nel processo di mapping, non essendo presente in Meta per questa risorsa). I due PMID sono associati esattamente allo stesso articolo (stessi autori, data di pubblicazione, venue/issue e abstract) → l’errore è su PubMed
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203842050', 'openalex_id': ['https://api.openalex.org/W4290298464', 'https://api.openalex.org/W34186816']}
    2. Caso simile (ma completamente senza DOI). 2 PMID per lo stesso articolo, che però qui è pubblicato su due venue diverse a distanza di un anno (caso di reprint?) → qui non c’è per forza un errore in PubMed (che forse ammette di associare PMID diversi allo stesso articolo, quando esso sia pubblicato su riviste diverse?).
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104317158', 'openalex_id': ['https://api.openalex.org/W3025821853', 'https://api.openalex.org/W2443871661']}
    3. Questo non me lo spiego. Tre “articoli” di tre autori diversi (ma con lo stesso titolo), sono stati schiacciati in un’unica entità. Chiaramente un errore in Meta.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06402245385', 'openalex_id': ['https://api.openalex.org/W1991855040', 'https://api.openalex.org/W2052431985', 'https://api.openalex.org/W3045319486']}
    4. 2 DOI, di due pubblicazioni completamente distinte, ma esattamente con lo stesso titolo, unificate in Meta (chiaramente errore nostro). Non sembra essere un caso isolato quello per cui i PID di articoli distinti ma con lo stesso titolo vengono associati ad una stessa entità in Meta: questo accade perché è stata fatta una scelta programmatica nel processo di curatela di OC Meta, oppure deriva da errori delle sorgenti?
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104323830', 'openalex_id': ['https://api.openalex.org/W1619222600', 'https://api.openalex.org/W2023056611']}
    5. Due articoli diversi, ma molto simili: oltre allo stesso titolo, anche gli autori sono gli stessi e scrivono dello stesso tema, su due riviste diverse, rispettivamente 2012 27th Annual IEEE Symposium e ACM Transactions on Computational Logic. Da una pubblicazione all’altra, però, i contenuti sono leggermente cambiati (ad esempio, tra quello che si può vedere senza paywall, le references): si tratta di due expressions diverse dello stesso work? di due works distinti? In ogni caso, penso che sia sbagliato che abbiano lo stesso OMID.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104323657', 'openalex_id': ['https://api.openalex.org/W1987738956', 'https://api.openalex.org/W2048183302']}
    6. Due DOI, ma non c’è modo di sapere, essendo gli articoli dietro paywall, se si tratta di due expressions diverse (ovvero se ci sono state modifiche) o se si tratta semplicemente di un reprint (a distanza di qualche mese). Chiaramente entrambe le versioni sono versions of record e pubblicate su rivista. [questo esempio potrebbe dover andare nella categoria dei reprint].
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104323588', 'openalex_id': ['https://api.openalex.org/W2258096070', 'https://api.openalex.org/W1991995476']}
    7. Due DOI. Uno è quello dell’articolo, l’altro è quello di un “Invited commentary”, pubblicato in associazione all’articolo, ma chiaramente con autore e diverso tipo di contenuto (è appunto un commento al tema trattato dall’articolo) e quindi con il suo proprio DOI.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06230215767', 'openalex_id': ['https://api.openalex.org/W2912727803', 'https://api.openalex.org/W2017459344']}
    8. Tre DOI: due sono effettivamente della stessa entità (uno del publisher e uno della Carolina Digital Repository), l’altro rimanda sempre al sito del publisher ma fa riferimento ad un’altra pubblicazione.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062201143803', 'openalex_id': ['https://api.openalex.org/W1994362400', 'https://api.openalex.org/W2066338296', 'https://api.openalex.org/W4299414329']}
    9. 3 DOI: due sono associati agli stessi metadati, ma uno di questi (presente comunque anche in Crossref) è un link morto al sito dell’editore (pagina 404); il terzo è di un articolo sempre dello stesso journal ma completamente distinto (altri autori e titolo solo simile).
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/062203841461', 'openalex_id': ['https://api.openalex.org/W2081024653', 'https://api.openalex.org/W4236718611', 'https://api.openalex.org/W2006278415']}
    10. DOI non linkano a nulla.
      1. {'omid': 'https://opencitations.net/meta/api/v1/metadata/omid:br/06104323116', 'openalex_id': ['https://api.openalex.org/W1983889724', 'https://api.openalex.org/W4255140970']}