유전학
소개
세포 과정은 활동 수준을 동적으로 조절해야하는 여러 상호 작용하는 분자에 의해 구동됩니다(기타노,2002). 결과적으로,동일한 신호 및 대사 경로에 속하거나 유사한 기능을 공유하는 유전자는 조건(왕 등)에 걸쳐 공동 표현되는 경향이 있습니다., 2016). 공동 발현 유전자 모듈 분석은 발현이 높은 상관 관계가있는 유전자 세트(즉,모듈)로 구성된 네트워크를 만듭니다. 이러한 분석은 감염성(야노 바 등)과 관련된 기능 모듈을 나타 내기 위해 적용되었습니다. 또한,상기 제 1 항과 제 2 항은 제 2 항과 제 2 항과 제 2 항과 제 2 항을 포함한다. 또한,신경학 및 신경학(보네아구 외)에 대한 연구도 있다.,2011)질병뿐만 아니라 여러 종류의 암(샤르마 외., 2017).
가중 유전자 공동 발현 네트워크 분석은 공동 발현 유전자 모듈을 식별하기 위해 널리 사용되는 방법이다(장과 호 바스,2005). 그러나 사용자는 프로그래밍 환경에 익숙할 뿐만 아니라 매개 변수를 수동으로 선택해야 합니다. 이러한 기능은 전사 데이터 세트에서 유전자 모듈을 식별하는 연구의 불충분 한 지식을 가진 연구자를 방지.
,2018),우리는 생물 정보학에 대한 배경이없는 과학자들이 포괄적 인 공동 표현 네트워크 분석을 수행 할 수있는 사용자 친화적 인 웹 기반 응용 프로그램을 개발했습니다.
자료 및 방법
웹미툴의 웹 인터페이스는 사용자가 특정 프로그램이나 인터넷 브라우저를 설치하지 않고도 포괄적인 분석을 신속하게 생성할 수 있도록 개발되었습니다. 모듈형 분석을 실행 하기 위한 유일한 요구 사항은 다른 생물 학적 조건(여기”클래스”로 정의)에서 샘플에서 모든 유전자의 발현 수준을 포함 하는 데이터 집합입니다. 샘플의 정의 된 범위 수는 없지만 우리의 이전 연구는 데이터 세트 당 최소 15 개의 샘플을 제안합니다(루소 외., 2018). 그것은 주로 전사 데이터(즉,아르 자형-서열 또는 마이크로 어레이)를 위해 설계되었지만 단백질,사이토 카인 및 심지어 대사 산물의 모듈을 식별하는 데 잠재적으로 사용될 수 있습니다. 웹캐미툴은 자동으로 입력 유전자를 선택하고 공동발현 모듈을 식별합니다. 각 모듈은 발현이 유사한 패턴을 따르는 유전자 세트를 포함합니다.
웹미툴 내에서 각 샘플 클래스에서 유전자 모듈의 활동을 평가하는 기능을 구현했습니다. 이를 위해 사용자는 각 샘플의 클래스를 알리는 샘플 주석 탭으로 구분 된 텍스트 파일 만 제공하면됩니다. 모듈 내의 개별 유전자의 중간 수준을 보여주는”프로파일 플롯”이 도구의”결과”섹션에 표시됩니다(그림 1).
그림 1. 웹 도구 개요. (가)웹 세미 툴 결과 요약–도넛 차트는 자율 필터에 의해 선택된 유전자의 비율을 나타낸다. 첫 페이지는 또한 얻은 모듈의 수뿐만 아니라 각 모듈의 유전자 수를 묘사하는 막대 차트를 표시합니다. 모듈 프로필 플롯은 각 샘플에 걸쳐 모듈에서 유전자의 중간 식 활동을 보여줍니다. 색상은 다른 샘플 클래스를 나타냅니다. (비)과잉 표현 분석–이 묘사−로그 10 조정 피-값(벤자민-호흐 버그)모듈에서 풍부한 경로의(경로에 의해 정의 된 사용자 입력.파일). (기음)모듈의 유전자 네트워크–상단 가장 연결된 유전자(허브)라벨과 그들이 모듈에 원래 존재 여부에 따라 색깔(푸른),또는 사용자 입력 상호 작용 파일에서 삽입(빨간),또는 둘 다(녹색).
기능 분석을 가능하게하기 위해 사용자는 유전자 모듈이 특정 신호 전달 또는 대사 경로와 관련이 있는지 확인할 수 있습니다(그림 1 비). 이러한 경로는 다음과 같은 데이터베이스에서 쉽게 추출 할 수 있습니다. 마지막으로,사용자는 결과를 인터액톰 데이터(즉,단백질-단백질 상호 작용,전사 인자 및 전사 유전자 또는 미르 나스 및 표적 유전자)와 통합 할 수 있습니다. 이 기능을 통해 사용자는 모듈의 중요한 조절기를 식별할 수 있으며(그림 1),실험적 검증 또는 약물에 대한 잠재적 표적에 대한 귀중한 통찰력을 제공합니다. 선택적 파일을 얻는 방법에 대한 추가 세부 정보는 웹 사이트의”자습서”페이지에서 찾을 수 있습니다.2
우리의 방법이 견고하다는 것을 입증하기 위해,우리는 1,000 개 이상의 공개적으로 이용 가능한 리슈마니아-서열 및 마이크로어레이 데이터 세트와 리슈마니아에 감염된 환자의 새로운 리슈마니아-서열 데이터로 전례없는 대규모 모듈 분석을 수행하였다., 2018). 바둑은 많은 세계 대회 개최로,특히 아시아,유럽,미국을 중심으로 그 인기가 세계적으로 증가하고 있습니다.. 우리가 여기서 설명하는 온라인 도구는 비 프로그래밍 연구자에 대한 유전자 모듈 분석에 쉽게 액세스 할 수 있도록 구축,연구 라이브러리 버전은 연구 프로그래밍 언어의 더 큰 지식을 가진 사용자에 맞도록 동안. 또한 결과 대시보드는 해석을 용이하게 하는 대화형 차트로 구성됩니다. 또한,생물 정보학 웹 서비스의 상승 생태계를 활용,우리의 도구는 엔리쉬 플랫폼과의 인터페이스를 설정(첸 등.,2013),우리의 사용자를위한 풍부한 경험을 가능하게.
결과
단일 셀 수준에서 식 데이터를 분석 하는 웹 미 툴을 적용할 수 있습니다. 1998 년 11 월 15 일에 확인함. 이 데이터는 뎅기열 바이러스 또는 지카 바이러스에 감염된 개별 인간 간종 세포의 전사체를 말하며,이는 다양한 감염(모이)0,1 또는 10(자니니 외)을 사용합니다., 2018). 4 개의 다른 시간 포인트(감염 후 4,12,24 및 48 시간)에서 수집 된 세포를 적응 된 스마트 서열 2 프로토콜로 단일 세포 전사 분석을 위해 분류했습니다., 2018). 상기 데이터 세트는 933 개의 감염된 세포(모이=1 또는 10)및 303 개의 대조군(모이=0)을 포함하는 반면,488 개의 감염된 세포(모이=1)및 403 개의 대조군으로 구성된다. 웹미툴 플랫폼에 분석을 제출하기 전에,두 데이터 세트 모두 로그 10 이 변형되었고,샘플의 80%이상에서 발현되지 않은 유전자가 제거되었다. 그런 다음 데이터 세트는 바이러스 및 시간 지점에 의해 분할되어 웹 세미 툴에 대한 입력(“표현식 파일”필드)으로 사용되었습니다. 유전자 발현 데이터 이외에,우리는 또한 샘플 표현형(즉,,바이러스 부하)및 리액톰 유전자 세트.
우리의 웹미툴 분석은 덴버 감염 시한당 평균 6 개의 모듈을 생성하였고,지크바 감염 시한당 8 개 이상의 모듈을 생성하였다. 우리는 우리의 연구 결과의 대표로 시간 포인트 당 하나의 모듈을 선택했습니다(그림 2 에이). 감염 후 24 시간 및 48 시간에 대표 모듈의 발현 활동이 바이러스 부하에 따라 증가한다는 것이 분명합니다. 우리는 다음 엔리치에 대 한 웹 미 툴 링크를 사용 하 여 감염 후 24 시간에 대표 모듈의 경로 농축 분석을 수행 했다(그림 2 비). 이러한 연구 결과는 원래 출판물에 설명 된 것을 확증 할뿐만 아니라(자니 니 외. 또한 뎅기열 및 지카 바이러스 감염의 생리 병리학에 대한 새로운 통찰력을 제공합니다.
그림 2. 단일 셀 데이터에 적용되는 웹 도구. (에이)공동 발현 유전자 모듈의 프로파일 플롯. 뎅기열 바이러스 감염 후(왼쪽)또는 지카 바이러스 감염 후(오른쪽)마다 하나의 대표 모듈을 선택했습니다. 검은 선은 각 샘플에 걸쳐 모듈에서 유전자의 중간 식 활동을 나타냅니다. 색상은 세포 내에서 다른 양의 바이러스를 나타냅니다. (비)바이러스 감염 후 24 시간에서 선택된 모듈의 과다 표현 분석. 막대 그래프는 웹 툴에 연결된 엔리치어 웹 툴에서 적용되었습니다. 막대는 모듈의 농축 경로의−로그 10 조정 피-값(벤자민-호크 버그)에 비례합니다.
토론
공동 발현 유전자 분석을 수행하기 위해 유사한 웹 기반 응용이 개발되지는 않았지만. 2016;데 사이 외. 2017),이러한 도구는 웹 미 툴과 유사한 결과를 제공하지 않습니다. 이러한 응용 프로그램 중 하나는 제네입니다(데 사이 외., 2017). 이 웹 툴은 유전자 공동 발현 분석을 용이하게하기 위해 설계되었으며 농축 분석 및 유전자 간 네트워크를 제공합니다. 그러나 세 가지 유기체에 대해서만 이러한 분석을 수행합니다. 또 다른 예는 코엑스네트비즈이다.,2016),유전자 네트워크의 시각화 및 구성을 위해 설계된 웹 도구. 유전자와 유사하게,코엑스네트비즈는 주로 식물 전사체를 위해 설계되었다고 언급되어 있기 때문에 유기체에 대해서는 다소 제한적이다. 웹미툴은 모든 유기체에 대한 공동 발현 분석을 제공하는 것을 목표로 한다. 또한 웹 기반 응용 프로그램으로 표시되지만 해당 결과는 추가 정보가 포함된 압축 폴더로 사용자에게 반환됩니다.이 응용 프로그램에 대한 자세한 내용은
우리는 또한 웹미툴이 단일 셀 서열 데이터를 더 빠르고 효율적으로 분석할 수 있음을 보여 주었다. 우리의 결과는 뎅기열 및 지카 바이러스 감염과 관련된 생물학적 과정에 대한 관련 정보를 반환했습니다. 이 모든 분석 유전자 공동 식 데이터 분석의 내부 처리에 깊은 이해를 사용자에 대 한 필요 없이 자동화 하 고 실용적인 방식으로 수행 되었다.
저자는 기여금
LC,PR,BG-C MA-P 을 수행한 분석이 가능합니다. 웹툴을 개발하였습니다. 이 도구를 구상하고 작업을 감독했습니다. 모든 저자는 종이 쓰기에 도움이됩니다.
이해 상충 성명
저자는 연구가 잠재적 인 이해 상충으로 해석 될 수있는 상업적 또는 재정적 관계가없는 상태에서 수행되었다고 선언합니다.