Meeting con ERC (Mike + Vladan Arsenjevic)

  1. Bisogna spiegare perché il 19% di risorse bibliografiche di Meta non viene allineato a niente
    1. visto che ho considerato come totale tutte le br in Meta, compresi issues e volumes, probabilmente si spiega con il fatto che la maggior parte di queste risorse non ha ID esterni, ma soltanto OMID
      1. count di volumes e issues, in particolare quelli che non hanno altri ID esterni (questo già fornirebbe una spiegazione)
    2. potremmo capire meglio attraverso la provenance → serve il dump della provenance in CSV
  2. Quantificare le tipologie di errore/problema emerse dall’analisi sui multi-mapped, ottenendo la frequenza di ciascuna categoria e/o di macro-categorie, pesando i vari casi.
    1. Pensare e applicare euristiche per recuperare i tipi che sono individuabili in maniera automatica (es. i journals con più di due ISSNs)
      1. Anche il numero di OpenAlex ID a cui viene allineata la risorsa come possibile criterio
    2. I casi che si possono individuare solo manualmente verranno inseriti in una macro-categoria, specificando quali casi sono inclusi in questo insieme
  3. Il materiale sulle analisi fatte finora è il punto di partenza per una pubblicazione, incoraggiata anche da Mike.
    1. Submission per IRCDL entro 4 dicembre: research paper (10-12 pp.), short paper (6-7 pp.) o extended abstract (5 pp.)
    2. Ad articolo pronto lo si pubblica su ArXiv, successivamente si possono comunicare risultati e osservazioni ad OpenAlex
  4. Mail a Mike sui nuovi dataset pubblicati

graphenricher

omid_openalex

Meeting