El software en la ciencia es omnipresente, pero pasa desapercibido, dicen los investigadores
El software es omnipresente en la ciencia, y sin embargo, pasa desapercibido en todas partes. En un momento en que los científicos (y muchos otros) hablan de código, algoritmos o inteligencia artificial, el software aparece en el discurso como una sutileza semántica más. Muchos aspectos del software, como las cuestiones sobre licencias de usuario o formatos de archivo, no forman parte de la definición de código o algoritmo.
Ahora, catorce científicos, la mayoría de los cuales trabajan o han trabajado en el Käte Hamburger Kolleg: Cultures of Research (c
/re) en la Universidad RWTH Aachen, han publicado un artículo sobre la falta de atención que se le presta al software. El trabajo ha sido publicado en la revista Nature Computational Science.
El equipo de c
/re es un grupo interdisciplinario de formación en investigación que nombra cada año a diez becarios internacionales de las humanidades y ciencias sociales, ciencias naturales y técnicas, así como del arte e historia del arte, para trabajar en Aquisgrán. Es un Centro Internacional de Estudios Avanzados en historia, filosofía y sociología de la ciencia y la tecnología. Está dirigido por la profesora de filosofía Gabriele Gramelsberger (Cátedra de Filosofía de la Ciencia y Filosofía de la Tecnología) y el profesor de sociología Stefan Böschen (Cátedra de Tecnología y Sociedad). El centro analiza las transformaciones de la ciencia y la tecnología y discute cuestiones como la reproducibilidad de la investigación o el acceso abierto al software.
En su contribución, los autores piden reunir perspectivas sobre el software desde diferentes campos de la ciencia aplicada (por ejemplo, ciencias basadas en computadoras, así como humanidades y ciencias sociales) y la informática (desarrollo, uso, soporte, etc.) para descubrir los diferentes significados que el software puede tener. Estudios de caso en diversos campos científicos, incluyendo desarrollos de software más antiguos, están destinados a ayudar a mejorar la comprensión del software.
Un ejemplo simple: autocorrección de Microsoft Excel
Un ejemplo de la bioinformática: en los «materiales complementarios» de las publicaciones de bioinformática, el formato preferido para listas largas de genes, sorprendentemente, es el formato .xls de Microsoft. Sin embargo, Excel convierte automáticamente la designación MARCH1 para el gen «Membrane Associated Ring-CH-type finger 1» en una fecha, lo que distorsiona los datos listados. Una publicación de 2021 nos recuerda que el problema se reconoció (y publicó) ya en 2004, pero nunca desapareció. Una quinta parte de las publicaciones que tratan con listas de genes contienen estos errores.
Los investigadores podrían usar texto simple tabulado (archivos .csv), pero no lo hacen porque están acostumbrados a las hojas de cálculo. Sin embargo, las hojas de cálculo no están diseñadas para este tipo de procesamiento de grandes conjuntos de datos. Otra razón es la dependencia del software ampliamente utilizado de Microsoft, que caracteriza muchas prácticas científicas. A los investigadores les llevó 20 años finalmente renombrar los genes en cuestión. Recientemente, Microsoft Excel, un software con treinta años de antigüedad, permitió que la conversión de una cadena en una fecha dejara de ser automática.
Investigación sobre prácticas y transformaciones en los campos de la ciencia y la tecnología
Los autores del artículo abordan el tema del software en la investigación científica desde disciplinas como las ciencias asistidas por computadora, la historia, la filosofía de la ciencia, la semiótica, los estudios de ciencia y tecnología (STS) y los estudios de medios. Trabajan en varias universidades alrededor del mundo.
La mayoría de ellos fueron becarios en el Käte Hamburger Center for Advanced Study in the Humanities: Cultures of Research (c
/re), donde la idea de la publicación conjunta surgió del taller «Engineering Practices: New Horizons in the Social Study of Science and Software.»