1. Tuyển Mod quản lý diễn đàn. Các thành viên xem chi tiết tại đây

Alignment và dự đoán cấu trúc bậc hai

Chủ đề trong 'Công nghệ Sinh học' bởi epitope, 28/10/2004.

  1. 1 người đang xem box này (Thành viên: 0, Khách: 1)
  1. epitope

    epitope Thành viên mới

    Tham gia ngày:
    24/06/2003
    Bài viết:
    16
    Đã được thích:
    0
    Alignment và dự đoán cấu trúc bậc hai

    Chào mọi người, cho tôi hỏi chút
    Để dự đoán cấu trúc của proteine, một trong 2 cách là aligning để tìm các homology đã biết cấu trúc. Nhưng khi align thì có nhiều Tools quá (như Jpred hay blast) , và tuỳ vào các thông số như gap penalty hay matrix mà kết quả alignment sẽ khác nhau. Vậy:
    - Trong các thông số ảnh hưởng đến alignment, thông số nào có ảnh hưởng lớn nhất, và
    - Trên cơ sở nào để có thể dự đoán chính xác nhất cấu trúc (bậc hai) của trình tự cần tìm (dựa vào identity, gap frequency... hay các thông số khác).
    Cám ơn trước những ai sẽ trả lời
  2. ConCay

    ConCay Thành viên mới

    Tham gia ngày:
    18/02/2003
    Bài viết:
    950
    Đã được thích:
    0
    cách tôi hay dùng nhất lđể algmnet à xài SeaView và alignment bằng dot-blot sau đó tự hiệu chỉnh bằng mắt và tay.
    Cách thứ hai tôi hay dùng nhất là Vector NTI, nó tự alignt cho mình, khỏe ru.
    Phần dự đoán cấu trúc bậc 2, tôi chưa làm bao giờ, có 1 người tôi biết cũng khá rành vấn đề này, tiếc là chị này không sinh hoạt ở đây và sắp đi Đức nên chắc kô giúp cho bạn được.
  3. epitope

    epitope Thành viên mới

    Tham gia ngày:
    24/06/2003
    Bài viết:
    16
    Đã được thích:
    0
    Xin chào,
    Vậy khi concay align thì chọn các thông số ra sao, dù các software có làm cho mình thì vẫn phải chọn các thông số, mà cái này thì không phải ai cũng làm đúng. Có phương pháp nào để một cách tương đối có thể chọn ''đúng'' x_dropoff, expect, open... Mà trong đó chọn gap là quan trong nhất thì phải, với mỗi gap thì có một chỉ số identities khác nhau, chẳng biết chọn gap nào.
    Đọc sách thì chỉ thấy bảo:
    - align using multiple parameters, go with the one that yields the most significant alignment
    - always check what the computer gives you, and look at it to see if it is reasonable, combine with some human insight to give a consensus prediction.
    - avoid leaving isolated residues (with a gap on each side), rather, group gaps together.
    Thôi cứ cho là đã align được rồi đi, khi đã tìm được cái homology thì làm sao dự đoán cấu trúc đây. Trước đây thì hay dùng phương pháp thủ công là tính toán theo Chou and Fasman, hiện đã có nhiều phương pháp web-based cũng như software nhưng càng so sánh nhiều trình tự lại càng thấy các phương pháp khác nhau cho kết quả rất khác nhau, nên chẳng biết theo thằng nào
  4. aigu

    aigu Thành viên mới

    Tham gia ngày:
    16/09/2004
    Bài viết:
    386
    Đã được thích:
    1
    Mình nghĩ là khó mà có thể xác định được tool nào chính xác hơn, chắc bạn phải thử từng cái một xem cái nào hợp với bạn hơn thì dùng. Còn nếu bận muốn xem cái nào chính xác với thực tế thì bạn predict bằng tool sau đó tinh sạch protein của bạn rồi xác định cấu trúc bậc 2 bằng CD spectroscopy, tuy nhiên cái này cũng chỉ cho bạn thông tin về bao nhiêu % thuộc alpha hay beta hay mix . . .
    Mình thấy có nhiều tool để predict cấu trúc bậc 2 cho biết thông tin về phần trăm cấu trúc bậc 2, và cũng có nhiều cái cho biết thông tin rõ ràng là đoạn nào cấu trúc gì. tức là khi bạn chạy alignment sẽ có thêm hàng để chỉ thông tin về cấu trúc bậc 2.
    Bạn thử search với "structure aligment" xem sao.
    Set thông số cho alignment: mình thường dùng mặc định gap initial penalty la 8, gap extension penalty la 2.
    Matrix thường là PAM250, mình đã thử dùng các matrix khác và thấy PAM250 cho nhiều identity hơn, tuy nhiên chưa hẳn điều này đã đúng với protein của bạn. Còn một điều nữa là (minh chưa kiểm chứng) matrix chỉ anh hưởng nhiều đến kết quả aligment nếu đó là pair-wise aligment còn nếu bạn align một lúc nhiều trình tự (multiple sequence alignment) thì sẽ không ảnh hưởng nhiều lắm. Mình dùng convenient với BIOE***, phần alignment la 1 module của Clustal W.
  5. epitope

    epitope Thành viên mới

    Tham gia ngày:
    24/06/2003
    Bài viết:
    16
    Đã được thích:
    0
    Đúng là để biết tools nào dự đoán chính xác thì chỉ có cách tiến hành thí nghiệm thôi vì dự đoán mãi vẫn là dự đoán :), tuy nhiên để biết cấu trúc thật thì cũng tốn nhiều thời gian, hiện mình đang học thêm cái course crystallography , hy vọng sau học kì này biết thêm chút ít kiến thức để tìm ra cái cấu trúc của protein đang nghiên cứu.
    Mình đã thử nhiều tools, trong trường hợp của mình thấy thang JPRED co vẻ được vì nó xem xét đến cả hiệu ứng của môi trường folding, chức năng của protein và cả tiến hoá protein. Nó sẽ tìm các trình tự consensus sử dụng cùng một lúc 6 phương pháp dự đoán cấu trúc khác nhau và the sequence set is clustered using a 75% identity cutoff value. Tuy nhiên, kết quả của jpred cũng chỉ là kết quả ban đầu cho các phương pháp phân tích khác sâu hơn.
    Mình đang ngâm cứu tiếp, cuối tháng sẽ reply xem nên làm theo hướng nào.
    Ah, còn về các thông số alignment, tuỳ trường hợp mà các thông số này khác nhau, các thông của của mình khác với của aigu, và trong trường hợp của mình thì matrix BLOSM62 cho identity khoảng 23%, còn PAM30 va PAM250 cho kết quả tương tự nhau, khoảng 69%. Nhưng khi identity càng cao thì chiều dài đoạn trình tự được so sánh càng ngắn và như vậy chỉ dự đoán được cấu trúc của một đoạn nhỏ trong cấu trúc của cả trình tự protein.
  6. aigu

    aigu Thành viên mới

    Tham gia ngày:
    16/09/2004
    Bài viết:
    386
    Đã được thích:
    1
    Có một cách nữa để align cấu trúc bậc 2 đó là bạn dùng chương trình Swiss-PDB Viewer (http://swissmodel.expasy.org) và input trình tự của bạn vào rồi search xem có protein nào có cấu trúc tương đồng với protein của bạn mà nguời ta đã xác định cấu trúc bậc 3/4 hay chưa, nếu có bạn download file PDB về, mở ra trong Swiss-PDB Viewer rồi load sequence của bạn vào. Sau đó bạn dùng chức năng align (fitting) của chương trình rồi mở cửa sổ alignment ra bạn sẽ có kết quả alignment giữa trình tự của bạn và protein tamplate kia kèm theo alignment về cấu trúc bậc 2.
    Nếu bạn post trình tự của bạn lên đây thì mình có thể test giúp bạn được!
    DEMO
    Cheers!
    Được aigu sửa chữa / chuyển vào 02:23 ngày 07/11/2004
    Được aigu sửa chữa / chuyển vào 02:26 ngày 07/11/2004
  7. Moony

    Moony Thành viên mới

    Tham gia ngày:
    30/10/2001
    Bài viết:
    93
    Đã được thích:
    0
    Cái SwissModel này moony cũng có thử rồi, nếu nó chấp nhận trình tự bạn gửi có nghĩa là trình tự bạn có hơn 30% giống với những trình tự người ta đã có trong ngân hàng, cụ thể là cái protein template.
    Cái này moony nghĩ là cách tiện lợi nhất vì có thể nhìn thấy protein của mình một cách rất trực quan và có thể xem vị trí các a.a. mình quan tâm trên protein cũng như hình dáng chung chung của nó, globular hay không bla bla.. từ đó suy ra nó dễ tinh sạch hay không, dễ xác định cấu trúc hay không và có thêm cơ sở để dự đoán những domain của nó có function gì...
    Cheers!
  8. bluekite

    bluekite Thành viên mới

    Tham gia ngày:
    17/11/2004
    Bài viết:
    79
    Đã được thích:
    0
    Deep View đúng là chương trình dễ sử dụng và miễn phí (download tại http://www.expasy.org/spdbv/text/download.htm), tuy nhiên chương trình không cho biết thông số về mức độ homology, cái này mới là điều quan trọng, vì một khi có nhiều cấu trúc tương đồng đã biết cấu trúc bậc 3 thì việc quết định xây dựng model dựa trên cấu trúc nào là yếu tố quyết định, bạn nên sử dụng các chương trình so sánh các homologous sequences để tự quyết định, trong trường hợp này JPREP có vẻ là một ứng cử viên. Sau khi tìm được cấu trúc tương đồng tốt rồi thì lúc đó mới nên dùng Deep View, chú ý các thông số trong Ramachandran Plot.
  9. aigu

    aigu Thành viên mới

    Tham gia ngày:
    16/09/2004
    Bài viết:
    386
    Đã được thích:
    1
    Nếu bạn dùng Deep View thì sẽ thấy chức năng "find appropriate template" Khi nó trả kết quả cho bạn sẽ có một cột là "Blast Score", as far as I know, cái này sẽ cho bạn biết về mức độ tương đồng giữa target sequence và templates.
    Ramachandran plot cho bạn biết chất lượng của cái cấu trúc bạn sẽ dùng đó (how good the conformation is, ect)
    Nên dùng cả multiple sequence alignment để check cụ thể cả full sequence phòng trường hợp có template cho high blast score nhưng cái đoạn quan trọng (active site hay ligand-binding site . . .) lại có mức tương đồng thấp hoặc null. Kết hợp với kết quả này bạn sẽ có đử thông tin để chọn template phù hợp.

Chia sẻ trang này