Notice
Recent Posts
Recent Comments
Link
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Tags
more
Archives
Today
Total
관리 메뉴

유(유용하게)쓰(쓰이는)정보

생물정보학 본문

카테고리 없음

생물정보학

유쓰거니 2023. 7. 10. 14:39
반응형

생물정보학이란?

생물정보학은 컴퓨터를 사용하여 연구자들이 현재 생물에서 수집할 수 있는 방대한 양의 데이터를 이해합니다. 이러한 것들은 단일 세포처럼 단순해 보일 수도 있고 인간의 면역 반응처럼 복잡해 보일 수도 있습니다. 생물정보학은 연구자들이 인간 게놈을 해독하고, 생물학적 시스템의 글로벌 그림을 보고, 새로운 생명 공학을 개발하거나, 새로운 법률 및 법의학 기술을 완성하는 데 도움이 되는 도구이며, 미래의 개인화된 의학을 만드는 데 사용될 것입니다. 생물정보학은 인간이 수동으로 인식하기 어렵거나 불가능한 거대한 데이터 세트의 패턴을 인식할 수 있는 잠재력을 가지고 있습니다. 향상된 관측 도구와 컴퓨터의 속도 및 용량 증가로 인해 가능합니다. 연구자들은 계산과 분석을 적용하여 현대 생물학 및 의학의 생물학적 데이터를 더 잘 캡처, 관리 및 해석할 수 있습니다. 생물 정보학 이전에는 생물학적 실험을 수행하는 두 가지 방법, 즉 살아있는 유기체 내(생체 내) 또는 인공 환경만 있었습니다. 이제 몇 시간의 컴퓨터 실험은 끝없는 자원을 가진 박사 후 연구원 군대가 근무하는 값비싼 최첨단 장비를 갖춘 전체 실험실과 비교할 수 있습니다. 생물정보학 연구자들은 또한 이전에 숨겨져 있던 의미 있는 발견을 하기 위해 정교한 도구로 생물학적 데이터베이스를 샅샅이 뒤집니다. 생물정보학의 기원은 1960년대 초 연구자들이 단백질의 분자 서열을 해독하기 위해 노력하는 동안 이루어졌습니다. 연구자들이 단백질의 서열을 알면 단백질의 구조를 더 잘 식별하고 세포 과정에서 어떻게 작용하는지 이해할 수 있습니다. 서열이 알려지면 서열을 암호화하는 유전자에도 연결될 수 있습니다. 현대 컴퓨터가 출현하기 전에 단백질 서열은 나란히 테이프로 붙인 종이에 수동으로 조립, 분석 및 비교되었습니다. 초기 컴퓨터를 사용할 수 있게 되자마자 오늘날 생물정보학자의 선구자들은 분자 서열을 조작하고 분석하는 방법을 처음부터 만들었습니다. 이 과정을 통해 컴퓨터를 이용한 단백질 염기서열 분석의 새로운 연구 분야가 탄생했다. 최초의 대규모 생물 정보학 노력은 1990 년 2003 월부터 3 년 1 월까지 진행된 인간 게놈 프로젝트였습니다. 이 프로젝트에서 국제 연구팀은 인간 게놈을 구성하는 유전자의 억 개의 단백질 염기쌍을 모두 시퀀싱 하고 매핑했습니다. 많은 수명의 기간을 감안할 때 인간은 이 방대한 양의 데이터를 수동으로 선별할 수 없었습니다. 따라서 생물 정보학은 인간 게놈 프로젝트를 더 빠르게 만들지 못했습니다. 그것은 그것을 가능하게 했습니다. 이제 실험은 너무나 많은 생물학적 데이터를 생산하기 때문에 컴퓨터의 도움 없이는 의미 있는 이해를 할 수 없습니다. 생물정보학은 생물학적 데이터를 분석 및 해석하고, 생물학적 정보에 효율적으로 액세스, 관리 및 사용하기 위한 컴퓨터 프로그램을 개발하고, 대규모 데이터 세트의 관계를 평가하기 위한 수학 공식 및 통계적 접근 방식을 만드는 데 사용됩니다. 생물정보학을 통해 연구자들은 한 사람의 일생에 중요한 타임라인에서 실험을 수행할 수 있습니다. 예를 들어, 코로나바이러스 팬데믹 기간 동안 연구자들은 바이러스의 게놈을 시퀀싱 하고, 바이러스가 세포에 들어갈 가능성이 있는 원인을 식별하고, 발견된 게놈을 기반으로 몇 달 안에 백신을 개발할 수 있었습니다. 연구자들이 의미 있는 연결을 찾기 위해 손으로 쓴 코드를 조작했다면 이것은 달성되지 않았을 것입니다. 당뇨병 및 암과 같은 다른 질병을 식별하고 치료하기 위해 추가적인 생물 정보학적 접근법이 사용되고 있습니다. 생물학적 데이터에서 중요한 결과를 수집하기 위해 생물정보학은 데이터 마이닝, 패턴 인식, 시각화 및 기계 학습과 같은 컴퓨터 도구를 사용합니다. 생물정보학 연구자들은 도메인 과학 지식, 통계 및 데이터 과학을 결합하여 신약 개발과 같은 특정 연구 영역에 보다 신속하게 집중할 수 있는 보다 표적화된 웹 실험실 실험을 만들 수 있습니다. 또한 기존 데이터베이스의 정보를 샅샅이 뒤져 질병의 원인이 되는 유전자를 발견하거나 일반적인 면역 반응을 발견하여 알려지지 않은 병원체를 평가할 수 있습니다. 생물정보학 연구자들은 DNA 염기서열을 염기서열 데이터베이스와 비교하여 유사성 영역을 찾는 NCBI의 BLAST와 같은 컴퓨터 소프트웨어 프로그램을 사용합니다. NCBI's BLASTP와 같은 다른 소프트웨어 프로그램은 단백질 서열 데이터를 정렬, 검색, 예측, 저장 및 분석합니다. NCBI의 GENBANK 및 Protein과 같은 인터넷 데이터베이스도 생물 정보학 연구에 중요합니다. 여기에는 주 데이터베이스와 보조 데이터베이스가 모두 포함되며 그중 다수는 공개적으로 사용할 수 있습니다. 기본 데이터베이스에는 실험에서 파생되고 연구원이 제출한 보관 데이터가 보관됩니다. 보조 데이터베이스는 이전 실험에서 더 많은 이해를 얻는 데 사용할 수 있는 기본 데이터의 분석 결과로 구성됩니다. 이러한 2차 데이터베이스는 생물정보학 도구를 적용하여 새로운 발견을 할 수 있는 엄청난 잠재력을 가지고 있습니다. 통계 기법 및 이론과 함께 생물 정보학 소프트웨어 및 데이터베이스는 생물 데이터를 관리하고 분석하여 생물 시스템 및 인간 건강에 중요한 문제를 해결할 수 있습니다. 생물정보학은 데이터 관리 및 분석을 통해 이전에는 생각할 수 없었던 연구 영역을 가능하게 합니다. 생물정보학 도구는 여러 연구에서 방대한 양의 데이터를 선별하는 데 사용할 수 있기 때문에 연구자가 새로운 연결을 만들기 위해 정보를 마이닝함에 따라 과거 데이터의 유용성을 기하급수적으로 증가시킵니다. 이것은 전 세계 여러 지역의 데이터를 사용하여 수행할 수 있으며 한 번도 만난 적이 없는 연구원이 생성하거나 분석할 수 있습니다. 이 도구는 현재 실험을 개선하는 데에도 사용할 수 있습니다. 인실리코 실험은 상대적으로 쉽기 때문에 연구자들은 데이터 분석을 사용하여 연구 대상 또는 통계적으로 유효한 발견을 위해 필요한 샘플 수를 결정함으로써 실험 설계를 반복할 수 있습니다. 또한 이 도구는 부족한 데이터를 분류하여 연구자가 해석을 하거나 이전에 볼 수 없었던 단백질 서열을 식별할 때 더 나은 정보를 제공할 수 있습니다. 또한 기능적 생물정보학을 통해 연구자들은 이러한 가능한 단백질 구조를 모델링하여 세포 내 잠재적인 상호 작용을 결정할 수 있습니다. 기술이 정교해짐에 따라 더 복잡한 실험이 가능하지만 생물정보학이 도달할 수 있는 정도에는 한계가 있습니다. 생물정보학은 엄청난 양의 생물학적 데이터를 인간이 읽고 이해할 수 있는 패턴으로 변환할 수 있지만 관련 분야를 전문으로 하는 생물학자는 여전히 이러한 패턴을 해석해야 합니다. 실제로, 한 분야로서의 생물 정보학은 종종 실험 체인의 모든 부분을 따라 의사 소통하기 위해 다양한 영역의 연구자들을 모아야 합니다. 그리고 계산 자원은 생물 정보학이 얼마나 빨리, 그리고 얼마나 많이 해독할 수 있는지를 항상 제한합니다. 현재 프로젝트는 쿼리를 완료하기 위해 개인에게 컴퓨팅 성능을 요청한 초기 노력과는 거리가 멀지만 대부분의 도구는 여전히 클라우드에 있어야 하는 대형 컴퓨터와 서버에서 실행되어야 합니다.