1. Tuyển Mod quản lý diễn đàn. Các thành viên xem chi tiết tại đây

Numerical methods of phylogency inference (NMOPI)

Chủ đề trong 'Công nghệ Sinh học' bởi Odonata, 11/07/2003.

  1. 0 người đang xem box này (Thành viên: 0, Khách: 0)
  1. Odonata

    Odonata Thành viên quen thuộc

    Tham gia ngày:
    29/07/2002
    Bài viết:
    175
    Đã được thích:
    1
    Tôi đang đề cập tới một vấn đề được khai thác và nhắc tới lần đầu từ những năm 1972 và sau này được phát triển và hoàn thiện bởi Sober năm 1988. Đây là một phương pháp toán học nhằm giải quyết những vấn đề của những người làm về hệ thống học sinh vật. Bản thân câu chuyện về phân loại học cũng làm nhiều người ngán ngẩm và dường như buồn tẻ, vậy nên sử dụng toán học để phân tách sinh vật theo hệ thống còn là vấn đề không hấp dẫn hơn, ngay cả với những nhà phân loại học chuyên nghiệp. Tại sao lại vậy? Câu hỏi sẽ được trả lời khi bạn đọc hết bài viết này. Và vì phương pháp này còn nhiều khúc mắc cũng như hứa hẹn những ứng dụng khác nên chủ đề này chưa chắc đã được nhiều người đọc và hiểu một cách thấu đáo. Bản thân tôi cũng mới tiếp xúc với vấn đề này nên đôi khi việc hiểu và diễn dải cũng không lưu loát, thậm chí có khi không đúng (trước đây tôi chỉ biết sơ sơ về nguyên lý, cho đến giờ mới thật sự ứng dụng cho công việc) nên có thể sẽ gây sự hiểu lầm và tâm trạng hỗn loạn cho người đọc, tôi quyết đinh viết về chủ đề này để mong rằng tự mình có thể tư duy cẩn thận và chắc chắn hơn.
    Vậy người ta đã bắt đầu suy nghĩ đến việc tính toán để so sánh sự khác biệt giữa các nhóm sinh vật từ khi nào? Và tại sao lại xuất hiện ý tưởng đó? Tôi lại xin nhắc lại một chút về công việc của những người làm hệ thống học sinh vật, hay gần chính xác là công việc của các nhà sinh học đầu tiên (bắt đầu bằng phân loại học), kể từ khi có sự xuất hiện của ngành sinh học. Tôi xin phép bỏ qua việc nhắc lại phần lịch sử của phân loại nhân tạo và phân loại tự nhiên mà đi thẳng tới việc xây dựng cây phát sinh chủng loại. Bắt đầu bằng việc người ta di tìm những đặc điểm hình thái để chứng minh về nguồn gốc của một nhóm sinh vật và những mối quan hệ của nhòm này với những nhóm khác trong sinh giới. Một vấn đề gặp phải đối với những nhà động vật và thực vật cả thời bấy giời lẫn hiện tại, đó là họ bị tràn ngập trong một mới hỗn độn các đặc điểm sinh vật, và cũng vì sự đa dạng khinh khủng của các nhóm loài, hơn nữa, về mặt chắt lượng của các đặc điểm lại không hề giống nhau, rồi hàng loạt các hiện tượng thứ sinh, giảm thiểu cơ quan khiến cho xuất hiện rất nhiều những sai lầm trong hệ thống học được xây dựng. Rồi phải kể tới sự phản đối và chỉ trích của tính "nhân tạo" không thể tránh khỏi trong công tác xây dựng hệ thống phát sinh, không chỉ có thế tính không rõ ràng về "chất" của các đặc điểm phân loại đã khiến nhiều nhà sinh vật trở nên lúng túng khi bị chất vấn về các hệ thống mà họ đưa ra. Thực ra, ở đây chúng ta cần nhìn nhận vấn đề một cách khách quan hơn, các hệ thống đã được xây dựng cho đến nay thì hầu hết vẫn còn nguyên giá trị của nó, và công sức của những nhà phân loại học là không hề bị lãng phí (đa số là như vậy), những lý luận của họ về việc hình thành các nhóm loài có đa số bằng chứng xác đáng và không thể phủ nhận. Điểm yếu mà các nhà hệ thống học hay bị tấn công nhất chính là những nguyên tắc của họ không tổng quát, rất khó có thể áp dụng cho đồng nhất tất cả các nhóm sinh vật và việc xây dựng ranh giới giữa các nhóm cũng là rất mong manh. Chính điều này khiến họ bị coi là những nhà khoa học lỗi thời và đáng bị lãng quên (thực ra quan điểm này là cực kỳ sai lầm và chắc chắn sẽ dẫn đến những thất bại lớn với cái gọi là "tư tưởng bảo thủ" và bị loá mắt trước những cái được coi là mới hơn}.
    Tạm gác chuyện khinh miệt và coi thường những học thuyết cũ, chúng ta sẽ tiếp tục câu truyện, khi mà toán học bắt đầu tham gia vào công việc xây dựng hệ thống sinh vật. Không phải các phương thức tính toán, xây dựng mô hình cây phát sinh chủng loại chỉ được dùng khi người ta phân tích bộ gen của sinh vật, không phải khi người ta bắt đầu tiến hành so sánh DNA của các sinh vật với nhau người ta mới nghĩ đến việc sử dụng các phương pháp toán học để phân tích chúng. Việc sử dụng toán học để so sánh và phân tích về khoảng cách giữa các sinh vật đã bắt đầu với các đặc điểm phân loại hình thái bên ngoài. Khởi điểm là phương pháp tính khoảng cách (distance method) mà ngưởi ta ứng dụng cho macrotaxonomy. Vậy công việc đó hiển nhiên phải bắt đầu bằng những tính toán sơ khai với việc hình thành một list các đặc điểm, cho điểm và đánh giá các đặc điểm, xây dựng ma trận cơ sở dữ liệu, thiết lập ma trận khoảng cách và cuối cùng là phân tích, đưa ra các cây phát sinh có thể, rồi lại phân tích và chọn khả năng có thể nhất. Đây là công việc sơ khai nhất của NMOPI, và sau này các phương pháp tính hiện đại hơn đều dựa trên nguyên lý của nó (tôi xin phép không trình bày cụ thể ở đây vì phải đưa ra ví dụ rất dài và nhất là không thể type một matrix làm ví dụ được, nếu ai đó quan tâm thì có thể tìm đọc ở những cuốn về nguyên lý phân loại, ở đây tôi xin khẳng định với Concay là không nhất thiết phải đọc những cuốn về Molecular Evolution mới hiểu được, vì trước kia, nó dùng cho những nghiên cúu Evolution không phải Molecular). Sau này phương pháp tính đơn giản dựa trên các số liệu đặc điểm đã được cái tiến nhiều hơn và đưa ra công thức tổng quát (tôi không thể type được ở đây vì không có bộ gõ công thức, xin xem thêm ở các tài liệu). Phương pháp này chỉ cải tiến phần tính toán, cũng đưa ra kết quả gần giống với xây dựng ma trận, nhưng giữ nguyên các bước phân tích và chọn lữa các tree có thể.
    Nguyên lý của các phần mềm máy tính hiện nay dùng cho việc phân tích khoảng cách giữa các sinh vật cho đến nay vẫn dựa trên các phương pháp trước đó, hoàn toàn không có gì thay đổi, chỉ có điều nó nhanh hơn rất nhiều, nó giống như việc người ta giải phương trình thông qua một máy tính và việc giải thủ công bằng tay vậy.
    Trên đây tôi trình bày sơ lược về NMOPI, tiếp theo tôi xin lý giải tại sao NMOPI ít được các nhà phân loại theo phương thức cổ điển quan tâm và tại sao nó lại trở thành công cụ hữu dụng với những người làm về tiến hoá dưới góc độ phân tử học đến thế (mặc dù đầu tiên người ta dùng nó cho các đặc điểm hình thái).
    Thứ nhất, mặc dù NMOPI có rất nhiều tính ưu việt và dường như có vẻ rất rõ ràng nhưng thực ra nó lại không được các nhà phân loại học chú ý và quan tâm nhiều (tôi bỏ qua trường hợp của những nhà sinh vật học không yêu toán, hay chính xác hơn là dốt toán, tôi chỉ nói tới những nhà sinh học nghiêm túc sé không ngần ngại tiếp xúc với bất cứ khoa học nào để giải quyết vấn đề của mình). Vậy đâu là lý lẽ và nguyên nhân của việc bài trừ phương pháp này? Dựa trên những lý luận về tính không đông nhất về mặt chất của các đặc điểm của các nhóm sinh vật, và vì các đặc điểm có vai trò khác nhau và việc đánh giá, cho điểm chúng cũng sẽ không khác gì việc đánh giá các đặc điểm quan trọng dùng trong phân loại học trước đó. Chính vì vậy họ không chấp nhận một phương pháp mới mà vẫn phải dựa trên các nguyên lý cũ của họ (chỉ có thể cho điểm chính xác nếu đánh giá được tính quan trọng hay không của đặc điểm). Hơn nữa việc số hoá các đặc điểm dẫn đế sự đánh đồng tất cả các đặc điểm, điều này cũng là không thể chấp nhận nổi và các nhà toán học ứng dụng dùng phương pháp này cho việc phân loại sinh vật cũng phải thừa nhận. Vậy tại sao trong sinh học phân tử, NMOPI lại được chấp nhận và sử dụng rộng rãi. Có một điều mà không thể phủ nhận được đó là NMOPI dùng rất tốt cho việc tính toán khoảng cách ở các taxon gần, điều đó cũng có nghĩa nó rất hữu dụng nếu người ta đánh giá chính xác được giá trị các đặc điểm, và với khoảng cách gần thì sự nhầm lẫn về giá trị các đặc điểm là rất nhỏ. Vì vậy phương pháp này rất có chỗ đứng trong phân loại các nhóm cây trồng, vật nuôi, những nhóm tương đối rõ ràng và là những taxon dưới loài (như các chủng ong là một ví dụ). Chính vì vậy phương pháp này rất được ưa chuộng để phân tích ở cấp độ phân tử về độ khác biệt DNA của các nhóm loài. Và quan điểm của những người làm phân loại học hiện đại đều đồng ý rằng, việc xây dựng cây phát sinh chủng loại không thể có cách nào khác đi được là vẫn phải tiến hành theo hướng khảo sát tự nhiên cổ điển mà các nhà phân loại từ trước đến nay vẫn hay làm, sau đó sử dụng phương pháp phân tích sinh học phân tử để fix và khẳng định lại các nhóm nhỏ, chứ không thể thay thế công việc khảo sát cơ bản được, chính vì vậy, khi người nghiên cứu tiến hành các thí nghiệm về xây dựng hệ thống phát sinh và tiến hoá dựa trên những nguyên tắc của sinh học phân tử thì họ phải tiến hành các nghiên cứu về khảo sát thành phần khu hệ trước. Và những nhà phân loại cổ điển muốn xây dựng cây phát sinh chi tiết hơn thì họ lại phải tiến hành những thí nghiệm của sinh học phân tử.
    Quay lại vấn đề của NMOPI, mặc dù có không được sự đồng tính (bởi tính thiếu chính xác) khi người ta phân tách các nhóm sinh vật dựa trên hình thái và những suy luận từ các bằng chứng đặc điểm, NMOPI lại là một công cụ rất hữu dụng trong việc khảo sát và so sánh các khu hệ, có thể dùng phương pháp này kèm với các nghiên cứu cơ bản nhằm phân biệt hai môi trường. Tính ứng dụng của phương pháp này rất cao khi người ta dùng nó trong các phân tích chất lượng nước sử dụng các sinh vật chỉ thị, hay đánh giá tác động của chất độc đến môi trường khi so sánh giữa hệ sinh thái bị độc và hệ sinh thái đối chứng... Có nghĩa là phương pháp này là một phương pháp hay cho nhưng so sánh không phải là phân loại học theo hình thái ngoài, và nó có tính ứng dụng thực tế rất cao (chứ không phải chỉ được dùng trong những phân tích của sinh học phân tử). Cũng chính vì điều này mà tôi mới hỏi xin ông Concay phần mềm mà ông đã quảng cáo ở một bài viết khác. Và cũng vì ít người biết đến và hiểu thấu đáo tính ứng dụng của phương pháp toán học dùng trong phân loại (các bác làm trong Lab thì cứ nghĩ rằng chỉ có các bác mới dùng đến nó và chỉ có thể dùng để so sánh sự khác biệt về mặt phân tử mà thôi, còn những bác làm khảo sát thực địa thì lại không động đến nó, phần vì ngại làm toán, phần khác vì cứ tưởng nó là phương pháp dành riêng cho giới nghiên cứu sinh học phân tử, hay cũng chưa biết đến những ứng dụng rất hay của phương pháp này) nên tôi viết bài này.
    Tôi hỏi xin ông Concay phần mềm có tính năng tương tự là vì những phần mềm tôi được giới thiệu bị cũ quá (NTSYS là phần mềm chay trên MSDOS), và vì ông cũng hay sưu tập (vì dùng nhiều hơn tôi, ít ra là như vậy) nên ông hãy chia sẽ với mọi người đi. Ông có thể upload lên trên này rồi mọi người load về cũng được.


    Odonata

Chia sẻ trang này