Blog de la Biblioteca de Matemàtiques i Informàtica


2 comentaris

Cerques guiades: arXiv

arXivArXiv és un repositori autogestionat de preprints en accés obert especialitzat en física, matemàtiques, informàtica, biologia, estadística i matemàtica financera, accessible en línia. Treballa amb format d’arxiu TeX, tot i que també ofereix l’arxiu en PDF. El juny de 2016, 25 anys després de la seva creació, incloïa més d’1.200.000 preprints, descarregats prop de 139 milions de vegades.

S’hi accedeix per la pàgina principal (arXiv.org) o a través de diferents rèpliques (mirror sites) que permeten fer cerques per subcamps, sindicar continguts, etc.

El seu model de finançament es basa en les subvencions rebudes de la Cornell University Library —que n’és la responsable administrativa i financera—, la Simons Foundation i la quota voluntària anual de les institucions membres, basada normalment en la quantitat de preprints descarregats des de la institució.

Com funciona?

Arxiv compta amb moderadors especialistes en cada àrea de coneixement, que s’encarreguen de garantir que els articles siguin de caràcter científic —no s’accepten els de caràcter divulgatiu—, i que estiguin correctament classificats per matèria. Els moderadors no fan avaluació d’experts, no revisen els possibles errors dels articles, sinó que comproven que són adequats per a l’àrea temàtica suggerida per l’autor, mitjançant un sistema de recolzament o suport (endorsement), i així assegurar que la investigació acceptada és rellevant per a la disciplina especificada. En escollir una categoria de la llista de matèries es recomana no fer-ne servir més de dues de secundàries, i no utilitzar els conceptes que descriuen el treball sinó els termes que ajudaran al possible lector a decidir-se per consultar-lo.

Per poder enviar treballs per primer cop —i poder revisar els dels altres autors— cal ser acceptat per un autor aprovat (endorsed). L’excepció a aquest procediment és l’acceptació automàtica d’autors i investigadors d’institucions reconegudes. Per això és recomanable identificar-se amb una adreça de correu electrònic institucional.

La gestió dels drets

Gestió de dretsEls preprints acceptats admeten diverses proteccions de drets: des del domini públic, passant per totes les llicències Creative Commons, al copyright de l’editor d’una revista, tot i que els autors tenen dret a distribuir els preprints i donen a arXiv una llicència irrevocable, no exclusiva, per distribuir-los. Elsevier, per exemple, afirma: «creiem que els autors han de poder distribuir els seus manuscrits per necessitats i interessos personals; així com publicar-los als seus llocs web o repositoris institucionals, o enviar-los per correu electrònic als seus col·legues. Per tant, els autors també es reserven el dret de publicar la seva pròpia versió del manuscrit acceptat en el repositori temàtic arXiv».

Els administradors afegeixen una nota indicant quan hi ha un solapament entre preprints, però en cap cas és sinònim de plagi. La nota indica que hi ha múltiples paraules consecutives en comú amb treballs anteriors. En carregar un article els autors poden anticipar-se a l’addició d’aquesta nota afegint al camp de comentaris aquest solapament: per exemple, “aquest article es basa en gran mesura de arXiv: x, arXiv: i “, o” aquest article reemplaça arXiv: z “. En cas de detectar-se plagi el preprint és retirat immediatament.

La cortesia recomana que en citar un article localitzat a arXiv s’inclogui el número d’arxiu precedit del prefix “arXiv”, i es prioritzi l’enllaç al preprint abans que a la versió publicada en una revista. Ex.: Dmitry Kleinbock, Gregory Margulis. Flows on homogeneous spaces and Diophantine approximation on manifolds, Ann. of Math. (2) 148 (1998), 339-360, arXiv:math.NT/9810036.

Punts forts

  1. Referència. Amb el temps ha esdevingut el lloc de referència de la comunitat matemàtica; l’espai on publicar les versions preliminars dels articles que permet, alhora, estar al cas dels avenços dels col·legues
  2. El preu. La quota és voluntària, però encara que la institució la pagui, sempre és molt més econòmica que la subscripció a qualsevol publicació.
  3. Immediatesa. Publicar l’article a arXiv evita el retard entre l’acceptació de l’article i la publicació, que augmenta encara més si la publicació no s’edita en línia.
  4. ORCID. Permet la interconnexió entre les dues plataformes: des d’arXiv s’inclou l’identificador ORCID i a ORCID s’inclou l’enllaç als preprints inclosos a arXiv.
  5. Retirada. Hi ha la possibilitat de retirar un article contemplant dos estats:
    • Si l’article encara no es troba disponible públicament es pot eliminar o retardar la seva inclusió a ArXiv.
    • Si l’article es troba disponible públicament no es pot esborrar, però sí que es pot anul·lar la disponibilitat pública. Cal estar al cas de demanar que les versions anteriors de l’article es retirin també, per tal que aquestes no estiguin disponibles públicament.
  6. Autogestió. És el propi autor qui gestiona la seva producció a la plataforma i és el responsable de fer-ne el seguiment, d’assegurar-se que la informació és correcta, completa i pertinent.

Punts a millorar

  1. En no revisar-se el contingut dels preprints, de vegades se n’accepten de controvertits o poc fiables. Aquesta manca de mesures de control de qualitat també afecta la detecció d’autoplagi; així com la responsabilitat d’esborrar dades confidencials incloses a l’article.
  2. Encara no està adaptat a dispositius mòbils.
  3. Pot ser que la versió inclosa a arXiv no contingui tots els gràfics inclosos al preprint perquè no accepta més fitxers addicionals que els estrictament necessaris.
  4. Manca de consistència en l’actualització d’informació sobre la publicació de la versió definitiva: no incorpora un enllaç a la revista que publica l’article.
  5. En enllaçar preprints a través del camp de citacions o el de bibliografia has de sortir d’arXiv. De vegades, les fonts d’informació incloses en aquests camps no són enllaçables.
  6. Manca d’interoperabilitat per poder enviar arxius directament des d’altres plataformes d’edició en línia, com Overleaf o Authorea, en format PDF, i sense límit de pes en els arxius d’acompanyament.
  7. Pel que fa als arxius de suport dels preprints com poden ser les dades de recerca, codi, etc. (ancillary files), arXiv va col·laborar del 2010 al 2013 en un projecte pilot per a la conservació de dades. El projecte de repositori Data Conservancy va ser finançat inicialment per la National Science Foundation, però es va abandonar el 2015. Les dades bolcades en aquest repositori s’han fusionat amb el cos dels preprints d’arXiv.

La cerca

  • Cerca simple. Es fa sobre totalitat dels preprints. Per autor, per títol, per vocabulari lliure inclòs al camp del resum o a tot el cos del preprint o per codi identificatiu del preprint. Les paraules es busquen amb l’operador booleà AND per defecte.
  • Cerca avançada. Afegeix la possibilitat de seleccionar àrees temàtiques per restringir la cerca. Per buscar un autor determinat és millor fer servir la cerca avançada: per exemple nom cognom (Laura Costa vs Laura AND Costa). Inclou suggeriments d’ajuda per cercar informació: cerca booleana, etc.

Els resultats

La pantalla de resultats inclou la URL permanent de la cerca i el llistat de coincidències. A més, arXiv ofereix la possibilitat d’activar i desactivar Mathsjax per tal de visualitzar les fórmules matemàtiques amb LaTeX o MathML. Quant a les cerques en el camp de la informàtica, ofereix la possibilitat d’ampliar-les amb SemanticScholar, un cercador especialitzat en publicacions de recerca en els camps de la informàtica i la neurologia, que analitza i extreu la informació utilitzant tècniques d’aprenentatge automàtic. Els resultats inclouen gràfics en format PNG i en arxius independents al cos de l’article.

Pantalla de resultats

Cada registre inclou la següent informació:

  • Enllaços als altres repositoris que inclouen l’article.
  • Historial d’acceptació del document.
  • Adreça electrònica de l’autor.
  • Possibilitat de descàrrega en diferents formats: PDF, PostScript, etc., amb informació del tipus de llicència signada pels autors i l’historial de la tramesa.
  • Nom de la matèria i submatèria , i el codi numèric que la representa. Possibilitat de cercar pel terme genèric de matèria, o d’altres submatèries suggerides .
  • Referències i citacions: enllaç al repositori NASA ADS (servei de resums que permet trobar-ne de relacionats –els que coincideixin amb les preferències establertes-, referències bibliogràfiques incloses als articles, cites a l’article, cites revisades a l’article, articles suggerits i historial de lectures. Ofereix l’abstract en format Bibtex, i la possibilitat d’enviar correccions del registre).
  • Enllaç a d’altres repositoris on es troba el preprint (DBLP, per exemple), i a d’altres formats per crear llistes de referències.
  • Possibilitat de compartir el registre a diversos serveis web: reddit, Mendeley, scienceWISE, CiteULike, BibSonomy.

Bibliografia