스프레드시트에서 약물 발견 데이터를 관리하여 발생하는 3가지 함정

CDD Vault 인사이트 로고
2019년 1월 28일

스프레드시트와 정보학이 섞여 있지 않는 이유

"우리는 여기저기 Excel 시트를 가지고 있었고 다른 폴더로 분리 된 다른 프로젝트의 데이터를 모두 가지고 있었습니다." 한 과학자가 최근에 저와 공유했습니다. 이런 감정을 들은 것은 이번이 처음이 아니다. 이 과학자는 다음과 같은 말을 계속: "잠시 후, 그것은 단지 관리하기 어렵다지점에 도착했다."

스프레드시트에서 약물 발견 데이터 관리로 인한 3가지 함정

 

이것은 많은 과학자들이 하는 일반적인 실수입니다 - 스프레드시트를 찾기 가 어렵고 안전하지 않은 곳에서 데이터를 저장하고 관리합니다.

이 방법은 진공 상태에서 일하는 고독한 과학자에게는 괜찮을 지 모르지만, 신약 발견이나 많은 양의 데이터를 저장, 리콜 및 공유하는 데 의존하는 다른 화학 물질 또는 생물학적 분야에서 심층적인 작업을 수행하는 협력 과학자들을 위한 스마트 프로토콜은 아닙니다. Excel 또는 Google 문서를 통해 랩 메이트 및/또는 동료와 문서를 공유하는 것은 편리하지만 매우 안전할 수 있습니다.

과학, 특히 약물 발견 분야에서 결함이 있는 데이터 관리는 치명적일 수 있습니다.

Excel 파일을 이메일로 보낼 때 작은 오타를 만들거나 Google 드라이브의 다른 사용자와 공유할 때 문제가 발생합니다. 정부 규정을 위반하거나 중요한 데이터를 백업하지 못하거나 위험한 데이터 입력 실수를 저지르는 방식으로 데이터를 공유하는 경우 경력이 끝날 수 있습니다.

스프레드시트가 과학자에 실패한 3가지 이유

기껏해야 Excel 파일에 의존하여 과학적 데이터를 관리하고 결과를 전달하는 과학자들은 비효율적으로 작동하고 자원을 낭비할 위험이 있습니다.

최악의 경우 중요한 데이터가 손상되고 과학 혁신이 지연되고 새로운 개발 후보자를 식별하면 어려움을 겪습니다.

스프레드시트를 사용하여 데이터를 저장하고 관리하는 다른 부정적인 결과는 다음과 같습니다...

  • 데이터에 대한 액세스 제한
  • 데이터에 대한 제어 감소 및 보안 감소
  • 생산성이 떨어지는 협업 및 설계 주기 연장

뉴욕 타임즈는 최근 구글 드라이브와 같은 일반 클라우드 기반 플랫폼에서 데이터를 공유하는 것은 매우 위험하다고 보도했다.

유선 매거진은 또한 세계에서 가장 안전한 로컬 서버조차도 모르는 없이는 안전하지 않을 수 있기 때문에 안전한 로컬 서버에 데이터를 저장하는 것이 항상 이상적이지는 않다는 것을 확인했습니다.

그러나 일반 클라우드 기반 플랫폼을 신뢰하거나 데이터를 저장하기 위해 로컬 서버를 "보안"할 수 없다면 신뢰할 수 있습니까?

이 질문에 대답하기 전에 Excel 또는 기타 스프레드시트를 사용하여 과학적으로 얼마나 극적으로 제한되는지 이해해야 합니다...

  • "1" 목록 아이콘용 CDD Vault ELN 블로그 게시물

    데이터에 대한 제한된 액세스.

    스프레드시트란 무엇이며, 왜 당신 또는 어떤 과학자가 스프레드시트를 사용합니까?

    이전에는 생각하지 않았을 수도 있지만 스프레드시트는 데이터를 저장하고 관리할 수 있는 파일입니다. 이것은 긍정적 인 것 같아요, 맞죠? 스프레드시트는 데이터를 저장하고 관리해야 하는 파일입니다.

    즉, 스프레드시트는 필요한 것보다 더 많은 작업을 수행해야 합니까?

    예를 들어 스프레드시트를 사용하여 데이터를 저장하는 경우 항상 스프레드시트 파일의 현재 복사본을 보관해야 하며 파일을 업데이트해야 하며, 사용자뿐만 아니라 동료가 빠르고 쉽게 액세스할 수있는 위치에 보관해야 합니다.

    이것은 무엇을 의미합니까?

    이는 스프레드시트에 쉽게 액세스할 수 없습니다.

    자신에게 물어보십시오: 스프레드시트를 검색할 수 있습니까?

    아니 별로. 값 범위, 화학 구조 또는 유사성을 검색할 수 없으며 여러 가지 복잡한 기준을 검색할 수 없습니다.

    스프레드시트 파일은 개별 실험에 대한 간단한 표 데이터를 보유할 수 있지만 여러 실험(예: 여러 분석기의 상호 반응성, 나머지 배치 인벤토리, 복제 화합물 등)을 교차하는 데이터에서 관계를 드러낼 수 없습니다.

    스프레드시트 파일이 용량 응답 곡선 또는 Z 통계를제공할 수 있습니까? 대답은 대부분 "아니오"입니다.

  • "2" 목록 아이콘용 CDD Vault ELN 블로그 게시물

    데이터에 대한 제어가 감소하고 보안이 줄어듭니다.

    데이터를 제어할 수록 데이터가 더 안전할 수 있습니다.

    보안과 관련하여 스프레드시트가 실패합니다. 스프레드시트 파일은 승인되지 않은 사용자(의도적으로 또는 실수로)에게 쉽게 전달될 수 있기 때문입니다.

    또한 스프레드시트 파일에 대한 데이터 업데이트는 모든 랩메이트 또는 데이터의 모든 "사용자"에게 전파되지 않습니다. 위에서 언급했듯이 스프레드시트가 가장 최신 버전인지 수동으로 추적하는 것이 항상 쉬운 것은 아닙니다.

    이를 인식하지 못할 수도 있지만 클라우드 파일 공유와 마찬가지로 전자 메일을 통해 데이터 파일을 앞뒤로 전달하는 것은 안전하지 않습니다. 이는 교육기관의 대학이 표준 안전 장치만 있는 로컬 서버를 사용하는 경우에도 마찬가지입니다. 사실, 컴퓨터 세계에 따르면,이그룹은 혼자 해킹 주장했다 100 대학 서버, 하버드를 포함, 스탠포드, 펜.

    최악의 경우 스프레드시트 파일을 분실하거나 실수로 삭제할 수 있습니다.

    만약 당신이 과학자이고 이것이 과거에 당신에게 일어났다면, 그러한 손실이 얼마나 파괴적일 수 있는지 알 수 있습니다.

    스프레드시트, 심지어 클라우드 기반 의 스프레드시트는 다른 랩, 특히 교육 기관 외부와의 협업에 있어 거의 이점을 제공하지 않습니다.

    과학에서는 시간이 중요합니다.

    이것은 과학적 협력에 관여 할 때 특히 사실이다. 문제는 스프레드시트를 통해 공동 작업자와 데이터를 공유하는 과학자라면 공동 작업자가 업데이트된 데이터를 보낼 때까지 지속적으로 기다려야 하며 그 반대의 경우도 마찬가지라는 것입니다. 이 모든 대기 대기는 공동 작업의 진행 진행을 지연시합니다.

    과학자들이 협업을 위해 스프레드시트를 사용할 때 직면하는 다양한 문제가 있습니다. 예를 들어 공동 작업자는 오래된 데이터를 실수로 사용하여 오래된 가설에 리소스를 낭비할 수 있습니다.

    가장 중요한 것은 과학자들은 스프레드시트 파일과 실시간으로 협업할 수 없다는 것입니다.

    클라우드 기반 스프레드시트조차도(대부분 안전하지 않다고 가정)로 인해 실시간으로 공유하는 프로세스가 가장 번거롭습니다.   스프레드시트는 실험 데이터만 보유하므로 분석에 대한 실시간 협업을 촉진하지 않습니다. 과학자들이 실시간으로 자신의 결론을 공유하고 탐구하는 데 도움이되지 않습니다.

    스프레드시트 파일을 사용하면 진행 속도가 느린 통신 병목 현상이 생성됩니다. 여러 과학자와 여러 스프레드시트를 공유할 때 모든 사람이 최신 데이터와 동기화되는 것은 거의 불가능하기 때문입니다. 대학이나 교육기관이 표준 안전 장치만 있는 로컬 서버를 사용하더라도 이메일 이나 기본 클라우드 공유 플랫폼을 통해 스프레드시트를 공유하는 것은 안전하지 않습니다.

    마지막으로 스프레드시트를 검색할 수 없습니다. 컴퓨터의 파인더 창을 검색하여 값 범위, 화학 구조, 유사성 또는 기타 기준을 검색할 수 없습니다. 당신은 확실히 여러 복잡한 기준에 대 한 컴퓨터를 검색할 수 없습니다. 따라서 스마트 과학자들은 스프레드시트를 사용하는 것 이상으로 데이터를 보호하고, 데이터에 액세스할 수 있는지 확인하고, 생산적이고 안전하게 공유해야 합니다.

    여전히 스프레드시트를 사용하여 과학적 데이터를 관리하고 있습니까?

    그렇다면 위에서 설명한 것과 유사한 문제에 직면할 수 있습니다.

  • "3" 목록 아이콘용 CDD Vault ELN 블로그 게시물

    덜 생산적인 협업과 더 긴 설계 주기.

    스프레드시트, 심지어 클라우드 기반 의 스프레드시트는 다른 랩, 특히 교육 기관 외부와의 협업에 있어 거의 이점을 제공하지 않습니다.

    과학에서는 시간이 중요합니다.

    이것은 과학적 협력에 관여 할 때 특히 사실이다. 문제는 스프레드시트를 통해 공동 작업자와 데이터를 공유하는 과학자라면 공동 작업자가 업데이트된 데이터를 보낼 때까지 지속적으로 기다려야 하며 그 반대의 경우도 마찬가지라는 것입니다. 이 모든 대기 대기는 공동 작업의 진행 진행을 지연시합니다.

    과학자들이 협업을 위해 스프레드시트를 사용할 때 직면하는 다양한 문제가 있습니다. 예를 들어 공동 작업자는 오래된 데이터를 실수로 사용하여 오래된 가설에 리소스를 낭비할 수 있습니다.

    가장 중요한 것은 과학자들은 스프레드시트 파일과 실시간으로 협업할 수 없다는 것입니다.

    클라우드 기반 스프레드시트조차도(대부분 안전하지 않다고 가정)로 인해 실시간으로 공유하는 프로세스가 가장 번거롭습니다.   스프레드시트는 실험 데이터만 보유하므로 분석에 대한 실시간 협업을 촉진하지 않습니다. 과학자들이 실시간으로 자신의 결론을 공유하고 탐구하는 데 도움이되지 않습니다.

    스프레드시트 파일을 사용하면 진행 속도가 느린 통신 병목 현상이 생성됩니다. 여러 과학자와 여러 스프레드시트를 공유할 때 모든 사람이 최신 데이터와 동기화되는 것은 거의 불가능하기 때문입니다. 대학이나 교육기관이 표준 안전 장치만 있는 로컬 서버를 사용하더라도 이메일 이나 기본 클라우드 공유 플랫폼을 통해 스프레드시트를 공유하는 것은 안전하지 않습니다.

    마지막으로 스프레드시트를 검색할 수 없습니다. 컴퓨터의 파인더 창을 검색하여 값 범위, 화학 구조, 유사성 또는 기타 기준을 검색할 수 없습니다. 당신은 확실히 여러 복잡한 기준에 대 한 컴퓨터를 검색할 수 없습니다. 따라서 스마트 과학자들은 스프레드시트를 사용하는 것 이상으로 데이터를 보호하고, 데이터에 액세스할 수 있는지 확인하고, 생산적이고 안전하게 공유해야 합니다.

여전히 스프레드시트를 사용하여 과학적 데이터를 관리하고 있습니까?

그렇다면 위에서 설명한 것과 유사한 문제에 직면할 수 있습니다.

CDD Vault 협업 약물 발견은 직관적인 웹 인터페이스를 통해 호스팅되는 간단하고 100% 안전한 데이터 관리 플랫폼입니다.

CDD Vault 프로젝트 팀이 화학 구조, 생물학적 분석 및 기타 과학적 데이터를 관리, 분석 및 제시하는 데 도움을 줍니다.

데모하려면 여기를 클릭하십시오. CDD Vault 지금 무료로...

이 블로그는 회원에 의해 작성되었습니다. CDD Vault 커뮤니티. CDD Vault 개인 및 외부 생물학적 및 화학 데이터를 안전하게 관리하는 호스팅 약물 발견 정보학 플랫폼입니다. 화학 등록, 구조 활동 관계, 화학 재고전자 실험실 노트북 기능을 포함한 핵심 기능을 제공합니다.

협력 약물 발견 (CDD) Vault 로고