3 errores causados por la gestión de los datos de descubrimiento de fármacos en una hoja de cálculo

28 de enero de 2019
Por qué las hojas de cálculo y la informática no combinan
"Teníamos hojas de Excel por todas partes y datos de diferentes proyectos que estaban separados en diferentes carpetas", me dijo un científico hace poco. No es la primera vez que oigo estas palabras. Este científico continuó diciendo lo siguiente: "Después de un tiempo, llegó a un punto en el que era difícil de manejar".

Este es un error común que cometen muchos científicos: almacenar y gestionar sus datos en hojas de cálculo inseguras y difíciles de encontrar.
Si bien este método puede estar bien para un científico solitario que trabaja en el vacío, no es un protocolo inteligente para los científicos que colaboran en el descubrimiento de fármacos o en otros campos químicos o biológicos que dependen del almacenamiento, la recuperación y el intercambio de grandes cantidades de datos. Compartir documentos con tus compañeros de laboratorio y/o de trabajo a través de Excel o Google Docs es conveniente, pero puede ser muy inseguro.
En la ciencia, especialmente en el campo del descubrimiento de fármacos, una gestión de datos errónea puede ser catastrófica.
Si cometes un pequeño error tipográfico al enviar el archivo de Excel por correo electrónico, o al compartirlo con alguien en Google Drive, estás en problemas. Si compartes datos de una forma que infringe la normativa gubernamental, no haces una copia de seguridad de los datos críticos o cometes peligrosos errores de introducción de datos, tu carrera podría estar acabada.
3 razones por las que las hojas de cálculo hacen fracasar a los científicos
En el mejor de los casos, los científicos que confían en los archivos de Excel para gestionar los datos científicos y comunicar los resultados corren el riesgo de funcionar de forma ineficiente y desperdiciar recursos.
En el peor de los casos, los datos críticos se ven comprometidos, la innovación científica se estanca y la identificación de nuevos candidatos al desarrollo se resiente.
Otros resultados negativos del uso de hojas de cálculo para almacenar y gestionar sus datos son...
- Acceso restringido a sus datos
- Menor control sobre sus datos y menor seguridad
- Colaboraciones menos productivas y ciclos de diseño más largos
El New York Times informó recientemente de que compartir datos en plataformas generales basadas en la nube como Google Drive es excepcionalmente arriesgado.
Larevista Wired también confirmó que almacenar los datos en un servidor local seguro no siempre es lo ideal, porque incluso los servidores locales más seguros del mundo pueden dejar de serlo sin que nadie lo sepa.
Pero si no puedes confiar en las plataformas generales basadas en la nube o en los servidores locales "seguros" para almacenar tus datos, ¿en qué puedes confiar?
Antes de responder a esta pregunta, hay que entender hasta qué punto el uso de Excel u otras hojas de cálculo te limita científicamente...
Acceso restringido a tus datos.
¿Qué es una hoja de cálculo y por qué la utiliza usted o cualquier científico?
Puede que no lo hayas pensado antes, pero las hojas de cálculo son archivos que permiten almacenar y gestionar datos. Esto suena como algo positivo, ¿verdad? ¿Y si lo lees de esta manera? Las hojas de cálculo son archivos que te permiten almacenar y gestionar datos.
En otras palabras, ¿las hojas de cálculo le exigen más trabajo del necesario?
Por ejemplo, si utilizas hojas de cálculo para almacenar tus datos, debes llevar siempre contigo una copia actualizada de tu archivo de hoja de cálculo, y debes mantener el archivo actualizado, y debes mantenerlo almacenado en un lugar en el que no sólo tú, sino también tus colegas puedan acceder a él rápida y fácilmente.
¿Qué significa esto?
Significa que las hojas de cálculo no son fácilmente accesibles porque eres tú quien tiene que gestionar manualmente su accesibilidad.
Pregúntate a ti mismo: ¿Se pueden buscar en las hojas de cálculo?
No, en realidad no. No se pueden buscar rangos de valores, estructuras químicas o similitudes, y desde luego no se pueden buscar múltiples criterios complejos.
Mientras que los archivos de hojas de cálculo pueden contener datos tabulares simples para experimentos individuales, no pueden revelar las relaciones en los datos que cruzan múltiples experimentos, es decir, la reactividad cruzada en múltiples ensayos, el inventario de lotes restantes, los compuestos duplicados, etc.
¿Pueden sus archivos de hoja de cálculo proporcionar curvas dosis-respuesta o estadísticas Z? Lo más probable es que la respuesta sea "no".
Menor control sobre sus datos y menor seguridad.
Cuanto más pueda controlar sus datos, más seguros estarán.
Cuando se trata de seguridad, las hojas de cálculo fallan. Esto se debe a que los archivos de las hojas de cálculo pueden ser fácilmente reenviados a personas no autorizadas (intencional o accidentalmente).
Además, las actualizaciones de los datos de tu archivo de hoja de cálculo no se propagan a todos tus compañeros de laboratorio, o a todos los "usuarios" de los datos. Y, como ya se ha mencionado, no siempre es fácil seguir manualmente la pista de qué hoja de cálculo es su versión más actual.
Puede que no te des cuenta, pero pasar archivos de datos de un lado a otro por correo electrónico es inseguro, al igual que compartir archivos en la nube. Esto es cierto incluso si tu universidad o institución utiliza un servidor local con sólo sus protecciones estándar. De hecho, según Computer World, sólo este grupo afirmó haber hackeado más de 100 servidores universitarios, entre ellos los de Harvard, Stanford y Penn.
Lo peor de todo es que los archivos de las hojas de cálculo pueden perderse o borrarse accidentalmente.
Si usted es un científico y le ha sucedido esto en el pasado, entonces sabe lo devastador que puede ser una pérdida así.
Las hojas de cálculo, incluso las basadas en la nube, aportan muy pocas ventajas cuando se trata de colaborar con otros laboratorios, especialmente con los de fuera de tu institución.
En la ciencia, el tiempo es importante.
Esto es especialmente cierto cuando se participa en la colaboración científica. El problema es que si eres un científico que comparte datos con sus colaboradores a través de hojas de cálculo, tendrás que esperar constantemente a que éstos envíen datos actualizados, y viceversa. Toda esta espera retrasará el progreso de tu colaboración.
Los científicos se enfrentan a una serie de problemas a la hora de utilizar hojas de cálculo para las colaboraciones. Por ejemplo, los colaboradores pueden utilizar accidentalmente datos obsoletos, desperdiciando recursos en hipótesis antiguas.
Lo más importante es que los científicos no pueden colaborar con un archivo de hoja de cálculo en tiempo real.
Incluso las hojas de cálculo basadas en la nube (suponiendo que fueran seguras, que la mayoría no lo son) hacen que el proceso de compartir en tiempo real sea, en el mejor de los casos, engorroso. Una hoja de cálculo sólo contiene los datos experimentales, por lo que no fomenta la colaboración en tiempo real sobre su análisis. No ayuda a los científicos a compartir y explorar sus conclusiones en tiempo real.
El uso de archivos de hojas de cálculo crea cuellos de botella en la comunicación que ralentizan el progreso. Esto se debe a que es casi imposible mantener a todo el mundo sincronizado con los datos más recientes cuando se comparten varias hojas de cálculo con varios científicos. Compartir hojas de cálculo por correo electrónico o a través de una plataforma básica de intercambio de datos en la nube es inseguro, incluso si tu universidad o institución utiliza un servidor local con sólo sus protecciones estándar.
Por último, las hojas de cálculo no permiten realizar búsquedas. No puede buscar en una ventana de búsqueda de su ordenador rangos de valores, estructuras químicas, similitudes u otros criterios. Y, desde luego, no se puede buscar en el ordenador por múltiples criterios complejos. En consecuencia, los científicos inteligentes deben pensar más allá del uso de hojas de cálculo para asegurar sus datos, garantizar su accesibilidad y compartirlos de forma productiva y segura.
¿Sigue utilizando hojas de cálculo para gestionar sus datos científicos?
Si es así, es posible que se enfrente a retos similares a los expuestos anteriormente.
Colaboraciones menos productivas y ciclos de diseño más largos.
Las hojas de cálculo, incluso las basadas en la nube, aportan muy pocas ventajas cuando se trata de colaborar con otros laboratorios, especialmente con los de fuera de tu institución.En la ciencia, el tiempo es importante.
Esto es especialmente cierto cuando se participa en la colaboración científica. El problema es que si eres un científico que comparte datos con sus colaboradores a través de hojas de cálculo, tendrás que esperar constantemente a que éstos envíen datos actualizados, y viceversa. Toda esta espera retrasará el progreso de tu colaboración.
Los científicos se enfrentan a una serie de problemas a la hora de utilizar hojas de cálculo para las colaboraciones. Por ejemplo, los colaboradores pueden utilizar accidentalmente datos obsoletos, desperdiciando recursos en hipótesis antiguas.
Lo más importante es que los científicos no pueden colaborar con un archivo de hoja de cálculo en tiempo real.
Incluso las hojas de cálculo basadas en la nube (suponiendo que fueran seguras, que la mayoría no lo son) hacen que el proceso de compartir en tiempo real sea, en el mejor de los casos, engorroso. Una hoja de cálculo sólo contiene los datos experimentales, por lo que no fomenta la colaboración en tiempo real sobre su análisis. No ayuda a los científicos a compartir y explorar sus conclusiones en tiempo real.
El uso de archivos de hojas de cálculo crea cuellos de botella en la comunicación que ralentizan el progreso. Esto se debe a que es casi imposible mantener a todo el mundo sincronizado con los datos más recientes cuando se comparten varias hojas de cálculo con varios científicos. Compartir hojas de cálculo por correo electrónico o a través de una plataforma básica de intercambio de datos en la nube es inseguro, incluso si tu universidad o institución utiliza un servidor local con sólo sus protecciones estándar.
Por último, las hojas de cálculo no permiten realizar búsquedas. No puede buscar en una ventana de búsqueda de su ordenador rangos de valores, estructuras químicas, similitudes u otros criterios. Y, desde luego, no se puede buscar en el ordenador por múltiples criterios complejos. En consecuencia, los científicos inteligentes deben pensar más allá del uso de hojas de cálculo para asegurar sus datos, garantizar su accesibilidad y compartirlos de forma productiva y segura.
¿Sigue utilizando hojas de cálculo para gestionar sus datos científicos?
Si es así, es posible que se enfrente a retos similares a los expuestos anteriormente.
CDD Vault de Collaborative Drug Discovery es una plataforma de gestión de datos sencilla y 100% segura que se aloja a través de una interfaz web intuitiva.
CDD Vault ayuda a su equipo de proyecto a gestionar, analizar y presentar estructuras químicas, ensayos biológicos y otros datos científicos.
Haga clic aquí para ver una demostración CDD Vault gratis ahora mismo...
Este blog está escrito por miembros de la comunidad de CDD Vault . CDD Vault es una plataforma informática de descubrimiento de fármacos alojada que gestiona de forma segura datos biológicos y químicos tanto privados como externos. Ofrece una funcionalidad básica que incluye el registro químico, la relación estructura-actividad, el inventario químico y las capacidades del cuaderno de laboratorio electrónico.
