Blog de la Biblioteca de Matemàtiques i Informàtica


1 comentari

Com i per què s’hauria de citar el programari?

Imatge de NeKoKaWaii-chan, sota llicència CC-BY-SA
Imatge de NeKoKaWaii-chan, sota llicència CC-BY-SA
En no existir un estàndard europeu que normalitzi la forma de construir cites bibliogràfiques de llenguatges de programació, codi font, programari, biblioteques, etc. ―l’equivalent a la UNE-ISO 690:2010― algunes organitzacions relacionades amb programari de recerca, com el Software Sustainability Institute o Force11, han començat a definir les bases del que hauria d’observar aquest estàndard. Col·laboren en la detecció, comunicació i recollida de propostes que permetin descriure i citar el producte utilitzat en la investigació, de manera objectiva i útil. Presentem tres articles que marquen les recomanacions més acceptades entre els professionals del sector.

Jackson, Mike. How to cite and describe software. A: Software Sustainability Institute. [201?]. URL: https://www.software.ac.uk/how-cite-software. [Consultat el 17/09/2018]

Existeix una gran diferència entre descriure quines font d’informació i de referència s’han fet servir per elaborar un projecte i citar-les adequadament. Si parlem de codi, programari, biblioteques, llenguatge, etc. com a font d’informació, aquesta diferència marca la possibilitat de poder accedir a la versió de programari correcta i a les eines i components adequats, que permetran reproduir i/o desenvolupar el projecte al que donen crèdit i, d’aquesta manera, validar-lo. Tota cita normalitzada hauria d’observar la inclusió de camps que ajudin a accedir i descarregar o obtenir tot aquell producte que juga un paper bàsic en un projecte o n’ha proporcionat una novetat substancial. 10 consells per descriure el programari utilitzat en la recerca:
  1. Descriure de forma detallada qualsevol producte informàtic que hagi contribuït a quelcom exclusiu, per tal de poder fer entendre el que s’ha fet, donar la possibilitat de repetir el projecte, i validar i reutilitzar la recerca.
  2. Escollir, entre les diferents opcions, la més adient per descriure el programari que heu utilitzat: notes a peu de pàgina, agraïments, seccions de mètodes i apèndixs…
  3. Tenir en compte si el producte té algun tipus de llicència que obligui a atribuir l’ús del programari a la vostra publicació.
  4. Citar documents que descriguin el programari com a complement, i no com a substitutiu, citant el propi programari.
  5. En el primer esborrany d’un document, posar sempre les cites del programari en referències o bibliografies.
  6. Estar preparats per debatre amb els revisors per què heu citat el programari: voleu reconèixer la contribució dels autors del programari i el valor del programari com a resultat legítim de la recerca.
  7. Informar als revisors si s’està obligat legalment a citar el programari a causa d’una clàusula a la llicència del programari.
  8. Si un avaluador no està d’acord amb una cita de programari formal, es pot fer una referència general al programari del document.
  9. És possible que les cites recomanades no tinguin prou informació per descriure amb precisió el programari que s’ha utilitzat, és possible que calgui afegir més detalls.
  10. Si el programari té un DOI (identificador d’objecte digital), utilitzar-lo per citar el programari. Si el programari té el seu propi lloc web, referenciar l’URL del lloc web per a la cita.

Daniel S. Katz, Neil P. Chue Hong . Software Citation in Theory and Practice. A: Arxiv.org. Publicat el 21 de juliol de 2018. URL: https://arxiv.org/abs/1807.08149. DOI: arXiv:1807.08149. [Consultat el 17/09/2018]

Force11 és un col·lectiu format per professors, bibliotecaris, investigadors i editors, organitzat per facilitar la millora en la creació i la transferència de coneixement mitjançant l’ús efectiu de la tecnologia de la informació. Force11 s’organitza en diferents comunitats, una de les quals treballa per desenvolupar un paquet de principis que permeti citar correctament codi font, programa i programari, per tal de poder incloure les cites dins del sistema demanat per les publicacions. Els seus objectius són:
  • Promoure la idea de la importància de citar aquests recursos entre els desenvolupadors i els usuaris.
  • Col·laborar amb els editors per assegurar que aquest sistema reculli les metadades necessàries perquè puguin ser indexades.
  • Treballar de forma comunitària per tal d’enfortir el paper del codi font, programa i programari, com a font d’informació equivalent a les bibliogràfiques (inclús aquell producte que no està publicat).
  • Garantir la qualitat de la informació acreditant el programari mitjançant cites.
La base per poder dur a terme aquesta tasca és desenvolupar un sistema de citació que serveixi per a tot tipus de producte. Aquesta és la raó per la qual el grup “Software Citation” ha treballat produint una infraestructura en forma de directriu. Són els Principis de Citació (Citation Principles), que abasten sis estàndards, contemplats com a punts imprescindibles de tota citació:
  1. Importància: el producte citat ha de ser considerat un producte legítim en la investigació.
  2. Crèdit i Atribució: les cites han de facilitar el crèdit acadèmic i l’atribució normativa. Ha de ser legal de cara a tots els contribuents: inclou autors, contribuïdors o el nom del projecte si aquests es desconeixen.
  3. Identificació unívoca. Per exemple, un DOI o URL: mètodes identificadors interoperables, llegibles per màquina i universals.
  4. Persistència: els identificadors únics i les metadades que descriguin el producte han de ser persistents.
  5. Accessibilitat: les cites han de servir per facilitar l’accés al producte i a les metadades associades.
  6. Especificitat: les cites han d’indicar quina versió del producte s’ha utilitzat. Han d’incloure el nom del producte, el número de versió o la data d’alliberament.
Consulteu a l’article com construir cites que respectin aquests 6 principis.

Wilson, Robin. Encouraging citation of software – introducing CITATION files. A: Robin’s Blog, 30 d’agost de 2013. URL: http://blog.rtwilson.com/encouraging-citation-of-software-introducing-citation-files/. [Consultat el 17/09/2018]

Sobre la importància d’incloure al projecte un fitxer que contingui les indicacions per saber com citar el codi que s’ha creat. L’arxiu CITATION no conté altra cosa que les indicacions a seguir per què d’altres citin codi inclòs: autor original, títol del projecte associat, nom del codi, versió, data, i el nom i URL del repositori on està emmagatzemat. Per què s’haurien de perdre dos minuts en incloure un arxiu CITATION? Perquè un cop elaborat el codi pel projecte i dipositat al DD (o no), potser cal tornar-lo a fer servir per a un altre projecte, o una altra persona el vol treballar. Potser l’has dipositat a GitHub i des d’aquí és fàcil obtenir una cita al teu codi), però afegir un arxiu CITATION facilita que obtinguis el crèdit i reconeixement a la teva feina.


2 comentaris

Cerques guiades: arXiv

arXivArXiv és un repositori autogestionat de preprints en accés obert especialitzat en física, matemàtiques, informàtica, biologia, estadística i matemàtica financera, accessible en línia. Treballa amb format d’arxiu TeX, tot i que també ofereix l’arxiu en PDF. El juny de 2016, 25 anys després de la seva creació, incloïa més d’1.200.000 preprints, descarregats prop de 139 milions de vegades.

S’hi accedeix per la pàgina principal (arXiv.org) o a través de diferents rèpliques (mirror sites) que permeten fer cerques per subcamps, sindicar continguts, etc.

El seu model de finançament es basa en les subvencions rebudes de la Cornell University Library —que n’és la responsable administrativa i financera—, la Simons Foundation i la quota voluntària anual de les institucions membres, basada normalment en la quantitat de preprints descarregats des de la institució.

Com funciona?

Arxiv compta amb moderadors especialistes en cada àrea de coneixement, que s’encarreguen de garantir que els articles siguin de caràcter científic —no s’accepten els de caràcter divulgatiu—, i que estiguin correctament classificats per matèria. Els moderadors no fan avaluació d’experts, no revisen els possibles errors dels articles, sinó que comproven que són adequats per a l’àrea temàtica suggerida per l’autor, mitjançant un sistema de recolzament o suport (endorsement), i així assegurar que la investigació acceptada és rellevant per a la disciplina especificada. En escollir una categoria de la llista de matèries es recomana no fer-ne servir més de dues de secundàries, i no utilitzar els conceptes que descriuen el treball sinó els termes que ajudaran al possible lector a decidir-se per consultar-lo.

Per poder enviar treballs per primer cop —i poder revisar els dels altres autors— cal ser acceptat per un autor aprovat (endorsed). L’excepció a aquest procediment és l’acceptació automàtica d’autors i investigadors d’institucions reconegudes. Per això és recomanable identificar-se amb una adreça de correu electrònic institucional.

La gestió dels drets

Gestió de dretsEls preprints acceptats admeten diverses proteccions de drets: des del domini públic, passant per totes les llicències Creative Commons, al copyright de l’editor d’una revista, tot i que els autors tenen dret a distribuir els preprints i donen a arXiv una llicència irrevocable, no exclusiva, per distribuir-los. Elsevier, per exemple, afirma: «creiem que els autors han de poder distribuir els seus manuscrits per necessitats i interessos personals; així com publicar-los als seus llocs web o repositoris institucionals, o enviar-los per correu electrònic als seus col·legues. Per tant, els autors també es reserven el dret de publicar la seva pròpia versió del manuscrit acceptat en el repositori temàtic arXiv».

Els administradors afegeixen una nota indicant quan hi ha un solapament entre preprints, però en cap cas és sinònim de plagi. La nota indica que hi ha múltiples paraules consecutives en comú amb treballs anteriors. En carregar un article els autors poden anticipar-se a l’addició d’aquesta nota afegint al camp de comentaris aquest solapament: per exemple, “aquest article es basa en gran mesura de arXiv: x, arXiv: i “, o” aquest article reemplaça arXiv: z “. En cas de detectar-se plagi el preprint és retirat immediatament.

La cortesia recomana que en citar un article localitzat a arXiv s’inclogui el número d’arxiu precedit del prefix “arXiv”, i es prioritzi l’enllaç al preprint abans que a la versió publicada en una revista. Ex.: Dmitry Kleinbock, Gregory Margulis. Flows on homogeneous spaces and Diophantine approximation on manifolds, Ann. of Math. (2) 148 (1998), 339-360, arXiv:math.NT/9810036.

Punts forts

  1. Referència. Amb el temps ha esdevingut el lloc de referència de la comunitat matemàtica; l’espai on publicar les versions preliminars dels articles que permet, alhora, estar al cas dels avenços dels col·legues
  2. El preu. La quota és voluntària, però encara que la institució la pagui, sempre és molt més econòmica que la subscripció a qualsevol publicació.
  3. Immediatesa. Publicar l’article a arXiv evita el retard entre l’acceptació de l’article i la publicació, que augmenta encara més si la publicació no s’edita en línia.
  4. ORCID. Permet la interconnexió entre les dues plataformes: des d’arXiv s’inclou l’identificador ORCID i a ORCID s’inclou l’enllaç als preprints inclosos a arXiv.
  5. Retirada. Hi ha la possibilitat de retirar un article contemplant dos estats:
    • Si l’article encara no es troba disponible públicament es pot eliminar o retardar la seva inclusió a ArXiv.
    • Si l’article es troba disponible públicament no es pot esborrar, però sí que es pot anul·lar la disponibilitat pública. Cal estar al cas de demanar que les versions anteriors de l’article es retirin també, per tal que aquestes no estiguin disponibles públicament.
  6. Autogestió. És el propi autor qui gestiona la seva producció a la plataforma i és el responsable de fer-ne el seguiment, d’assegurar-se que la informació és correcta, completa i pertinent.

Punts a millorar

  1. En no revisar-se el contingut dels preprints, de vegades se n’accepten de controvertits o poc fiables. Aquesta manca de mesures de control de qualitat també afecta la detecció d’autoplagi; així com la responsabilitat d’esborrar dades confidencials incloses a l’article.
  2. Encara no està adaptat a dispositius mòbils.
  3. Pot ser que la versió inclosa a arXiv no contingui tots els gràfics inclosos al preprint perquè no accepta més fitxers addicionals que els estrictament necessaris.
  4. Manca de consistència en l’actualització d’informació sobre la publicació de la versió definitiva: no incorpora un enllaç a la revista que publica l’article.
  5. En enllaçar preprints a través del camp de citacions o el de bibliografia has de sortir d’arXiv. De vegades, les fonts d’informació incloses en aquests camps no són enllaçables.
  6. Manca d’interoperabilitat per poder enviar arxius directament des d’altres plataformes d’edició en línia, com Overleaf o Authorea, en format PDF, i sense límit de pes en els arxius d’acompanyament.
  7. Pel que fa als arxius de suport dels preprints com poden ser les dades de recerca, codi, etc. (ancillary files), arXiv va col·laborar del 2010 al 2013 en un projecte pilot per a la conservació de dades. El projecte de repositori Data Conservancy va ser finançat inicialment per la National Science Foundation, però es va abandonar el 2015. Les dades bolcades en aquest repositori s’han fusionat amb el cos dels preprints d’arXiv.

La cerca

  • Cerca simple. Es fa sobre totalitat dels preprints. Per autor, per títol, per vocabulari lliure inclòs al camp del resum o a tot el cos del preprint o per codi identificatiu del preprint. Les paraules es busquen amb l’operador booleà AND per defecte.
  • Cerca avançada. Afegeix la possibilitat de seleccionar àrees temàtiques per restringir la cerca. Per buscar un autor determinat és millor fer servir la cerca avançada: per exemple nom cognom (Laura Costa vs Laura AND Costa). Inclou suggeriments d’ajuda per cercar informació: cerca booleana, etc.

Els resultats

La pantalla de resultats inclou la URL permanent de la cerca i el llistat de coincidències. A més, arXiv ofereix la possibilitat d’activar i desactivar Mathsjax per tal de visualitzar les fórmules matemàtiques amb LaTeX o MathML. Quant a les cerques en el camp de la informàtica, ofereix la possibilitat d’ampliar-les amb SemanticScholar, un cercador especialitzat en publicacions de recerca en els camps de la informàtica i la neurologia, que analitza i extreu la informació utilitzant tècniques d’aprenentatge automàtic. Els resultats inclouen gràfics en format PNG i en arxius independents al cos de l’article.

Pantalla de resultats

Cada registre inclou la següent informació:

  • Enllaços als altres repositoris que inclouen l’article.
  • Historial d’acceptació del document.
  • Adreça electrònica de l’autor.
  • Possibilitat de descàrrega en diferents formats: PDF, PostScript, etc., amb informació del tipus de llicència signada pels autors i l’historial de la tramesa.
  • Nom de la matèria i submatèria , i el codi numèric que la representa. Possibilitat de cercar pel terme genèric de matèria, o d’altres submatèries suggerides .
  • Referències i citacions: enllaç al repositori NASA ADS (servei de resums que permet trobar-ne de relacionats –els que coincideixin amb les preferències establertes-, referències bibliogràfiques incloses als articles, cites a l’article, cites revisades a l’article, articles suggerits i historial de lectures. Ofereix l’abstract en format Bibtex, i la possibilitat d’enviar correccions del registre).
  • Enllaç a d’altres repositoris on es troba el preprint (DBLP, per exemple), i a d’altres formats per crear llistes de referències.
  • Possibilitat de compartir el registre a diversos serveis web: reddit, Mendeley, scienceWISE, CiteULike, BibSonomy.

Bibliografia