1. Tuyển Mod quản lý diễn đàn. Các thành viên xem chi tiết tại đây

BLAST, giúp em với !

Chủ đề trong 'Công nghệ Sinh học' bởi thht, 04/07/2004.

  1. 1 người đang xem box này (Thành viên: 0, Khách: 1)
  1. te_quiero_vn

    te_quiero_vn Thành viên mới

    Tham gia ngày:
    17/03/2002
    Bài viết:
    84
    Đã được thích:
    0
    May quá, bác ConCay và mọi người có thể chỉ giúp tôi web nào cho phép align 2 sequences và cho kết quả homologous% được không. Tôi đang sử dụng phần mềm Genetyx nhưng không có chức năng tính % homology. Dùng bl2seq trong BLAST của NCBI thì nó lại cắt sequences của mình thành từng đoạn nhỏ, so sánh và cho kết quả identities trong đoạn đó mà thôi (nhiều gap, các đoạn cắt cũng trùng lặp linh tinh, nếu dựa vào đó tính rất mất thời gian). Cuối cùng toàn phải align trong Genetyx, crreat picture cho dễ nhìn rồi ngồi tự đếm số nu giống nhau.
    Bác Concay đèn giời soi xét giùm 1 vấn đề nữa. Để silence 1 gene groups, tôi tìm đoạn high conserved nusequence, cắt riêng đoạn đó của từng gene, xác định phelogenic tree của đoạn đó để chọn gene có mức độ tương đồng cao nhất với các gene khác (sau đó nếu thấy identities với các đoạn gen khác đều >70% thì chọn gene này để thiết kế primer và làm các bước tiếp theo). Vấn đề là tại sao gene nằm giữa evolution tree lại không phải gen có tỷ lệ homologous tương đối nhất với các gene còn lại ???(tôi lập bảng tính % identities của từng cặp gene thì chọn được 1 gene nằm ngoài rìa tree cơ)
    Hiện tôi đang cần làm gấp RNAi constructs cho 1 gene family gồm 14 genes, lúc bắt đầu chủ quan nghĩ khoảng 1 tháng là ok, ai ngờ gần 1 tháng loay hoay với đống dữ liệu này rồi mà chưa thiết kế nổi primer cho PCR nữa . Help me, plzzzzzzzz
    Được te_quiero_vn sửa chữa / chuyển vào 14:46 ngày 18/07/2004
  2. ConCay

    ConCay Thành viên mới

    Tham gia ngày:
    18/02/2003
    Bài viết:
    950
    Đã được thích:
    0
    Nếu làm đúng pp thì chỉ mất vài ngày là ra primer
    01. Tôi dùng phần mềm SeaView chạy trên Mac, kô biết bản chạy trên Window thế nào, nhưng cái này free, cứ lên google đánh chữ SeaView là ra. Phần mềm này cho phép aligne toàn bộ chứ không cắt tỉa gì cả. Nếu không cạy được SeaView thì dùng Vector NTI 9, cho phép aligne, chỉ định % identical, phylogeny tree, ... nếu ở SG thì đến HyNguyễn để chép; nếu ở HN thì tự load bản demo sau đó tôi sẽ gửi phần Patch cho chạy.
    Bằng SeaView tôi align khoảng hơn 80 cái sequens trong 3 ngày và ra được primer

    02- Tôi không hiểu khái niệm gene nằm giữa phlogeny tree là gì nên ý thứ 2 tôi không hiểu gì cả và vì vậy cũng không trả lời được.
    03- Với 14 trình tự thì nhanh thôi, tại bạn kô có cái Software đúng standar để xài nên cứ loay hoay. Theo như bạn nói, thì đâu cần phải tính toán làm gì cho nó phức tạp đâu
    - Đưa 14 trình tự này lên SeaView hay VectorNTI
    - Aligmen chúng
    - Nếu các gene này cùng 1 họ (bạn thử cho biết họ nào) thì chắc chắc chúng sẽ có gap; bằng kinh nghiệm sẽ thấy gap ở đâu để điều chỉnh alignment bằng tay, SeaView không làm cho mình chuyện này nhưng VectoNTI thì lại làm
    - Trong trường hợp của tôi, primers khoảng 20-25 nu NHƯNG tôi không thể cầu toàn mà phải chấp nhận primer có ambiquous base, là vì không thể tìm ra conservered region 100% nên phải chấp nhận chuyện này. Tôi nghĩ trường hợp của bạn cũng vậy.
    -Cho primer hoặt động và điều chỉnh PCR cho phù hợp
    - Cũng với primer, bạn nên thiết kế nhiều primers khác nhau để chọn cái tối ưu nhất.
    - Trong trường hợp của bạn không cần làm đến Phylogeny tree đâu, nhìn kết quả alignment của SeaView là thấy rồi, Phylogeny Tree không có ý nghĩa trong trường hợp này
    Good luck
  3. te_quiero_vn

    te_quiero_vn Thành viên mới

    Tham gia ngày:
    17/03/2002
    Bài viết:
    84
    Đã được thích:
    0
    Cảm ơn bác rất nhiều, tôi sử dụng Window nên không chạy được 1 số soft trong Mac, nếu không dùng GeneWork là đã dễ dàng hơn nhiều rồi. Sẽ search thử ngay SeaView như bác bày xem có cài được vào Win không.
    Mất thời gian là vì tôi không thể align nguyên nusequence của cả gene family này ( heat shock protein 70) mà phải mò mẫm chia thành nhiều group, mỗi group dựa trên alignment lại có 1 số conservered region khác nhau. Yêu cầu tối thiểu để chọn được 1 đoạn gene dùng cho silencing cả 1 group là phải >300nu, identities >70% với từng gene khác (chính xác là conservered region tương ứng của các gen khác) trong group. Không có soft thích hợp nên tôi không đoán trước được đoạn nào đáp ứng tiêu chuẩn 70% này (không có region nào có identities cao rõ rệt để nhìn nhận ra ngay cả). Cứ phải lọ mọ thử từng region thôi, mỗi region chừng 300-800nu. Các group ít gene khác thì đơn giản, nhưng có 1 group 14 gen -> 14! alignment, mỗi cái lại ngồi tự đếm số nu giống nhau rồi chia chia, bác thử nghĩ xem có lâu không. Cái group này thử đến region thứ 3 rồi mà chưa ok.
    Ngay cả primer tôi cũng không dùng ctrình thiết kế được mà tự chọn primer ở sát 2 đầu region đã chọn thôi để đảm bảo độ dài của region được amplyfied > 300nu và sau đó còn thiết kế overlap primer. Lúc trước tưởng chọn được 1 region chừng 350nu ok rồi, đến khi đặt primer mới ngã ngửa là GC content 2 đầu sequence quá cao, không thiết kế nổi primer. À, bác nói primer có ambiquous base nghĩa là gì ạ?
    Bác và mọi người trong forums có ý kiến nào thì giúp giùm nhé, cảm ơn nhiều nhiều.
  4. ConCay

    ConCay Thành viên mới

    Tham gia ngày:
    18/02/2003
    Bài viết:
    950
    Đã được thích:
    0
    xin lỗi bạn, nhưng quả thật tôi cực kỳ ngạc nhiên là lần đầu tiên tôi nghe có người phải cắt vụn gene ra để đi alignment và làm theo kiểu thủ công mỹ nghệ như bạn.Hơn nữa tại sao kô có ai đó chỉ cho bạn biết là phải dùng phần mềm tương thích nào hay sao? Kinh nghiệm của những người đi trước trong lab đâu?
    01- Ngoài 14 trình tự mà bạn đã có, nên load thêm Hsp của những loài khác để tham khảo, trên NCBI bạn sẽ thấy rất nhiều. Cứ đưa tất cả trình tự càng nhiêu càng tốt lên alignment
    02- Trong bước này, kô có gì là phức tạp phải tính toán tỷ lệ % homologous hay identity gì cả, việc alignment chính xác sẽ cho thấy ngay vùng nào bảo tồn vùng nào không và bằng trực giác ta sẽ thấy ngay là sẽ chọn vùng nào để làm primer. Bạn kô cần phải tính toán tỷ lệ % tương đồng tương ứng gì cả. Và đương nhiên ở bước này chẳng có lý do gì để chạy phylogenic analysis cả (tức là đi kiếm phylogenic tree). Hoàn toàn thừa. Như tôi nói nếu làm đúng pp thì với người mới bắt đầu chỉ mất khoảng 3 ngày là xong; còn làm quen thì 1 ngày là ra ngay primer.
    03- ít có phần mềm chạy trên Mac, chứ chạy trên Win thì có hằng hà sa số; các sofware dùng cho alignments hay đại loại như thế thì có rất nhiều.
    Bạn nên đọc
    Introduction to Bioinformatics, Arthur M. Lesk, Oxford, 2002; vấn đề của bạn nằm ở trang 20-30
    Sequence date anaylysis guidebook, in Methods in Molecular Biology V70, Humana press, 1997 sẽ chỉ cho bạn những software nào cần thiết để sử dụng cho công việc của bạn.
    Good luck
  5. ires

    ires Thành viên mới

    Tham gia ngày:
    29/10/2003
    Bài viết:
    27
    Đã được thích:
    0
    Tôi vào chủ đề này hơi trể nhưng hy vọng là các bạn đã tìm được giải đáp cho câu hỏi của mình.
    Rất thích lời giải thích của bác Weird về cách dùng BLAST, NCBI hiện giờ đang có nhiều công cụ để giúp bạn tìm hiểu thêm về genome, và rất hữu ích cho nhiều người.
    To te-quiero-vn:
    Hy vọng bạn đã có giải pháp cho câu hỏi của bạn.
    Nếu bạn dùng được những chương trình của conCầy chỉ được thì tốt, nếu không thì nên dùng một chương trình ở dạng brower, tức là xài ở máy nào cũng được. Một chương trình mà tôi hay dùng khi cần làm multiple alignment thì ở địa chỉ sau:
    http://searchlauncher.bcm.tmc.edu/multi-align/multi-align.html
    Sở dỉ Blast hay cắt gene của bạn ra từng phần nhỏ trong phần kết quả vì Blast chỉ tìm và so sánh sự tương đồng ở những đoạn ngắn mà thôi. BLAST = Basic Local Alignment Search Tool
    Còn về việc bạn tính dùng đoạn bảo tồn giữa 14 genes để thiết kế một RNAi construct thì có vẻ hay đấy. Bạn có thể cho biết thêm công việc này đang tiến triển khả quan? Theo tôi biết thì thiết kế một RNAi construct thì rất phụ thuộc vào điều kiện thí nghiệm và có thể phải thiết kế nhiều RNAi với nhiều trình tự khác nhau để hy vọng có một trình tự đem lại kết quả tốt nhất. Nếu bạn cần thêm chi tiết về việc thiết kế RNAi cho gene của bạn, tôi có thể có vài ý kiến đóng góp nhỏ.
  6. ConCay

    ConCay Thành viên mới

    Tham gia ngày:
    18/02/2003
    Bài viết:
    950
    Đã được thích:
    0
    Phân biệt Homology (homologous) và similarity (similar) thì tôi có viết rồi, nay nhắc lại
    Similarity (sự đồng dạng) để chỉ sự quan sát hay quá trình tính toán đo đạc 2 hay nhiều trình tự gene/protein bất kỳ để tìm ra sự giống nhau và khác nhau, từ đó có thể tính luôn hệ số đồng dạng (%). Similarity không cho biết quan hệ chủng loài của 2 hay nhiều trình tự.
    Homology (sự tương đồng, đồng đẳng) để chỉ hai trình tự protein hay nucleotide xuất phát từ 1 tổ tiên trực tiếp.
    Có thể tạm hiểu thế này: nhóm các đường 6 C là similarity với nhau. Nhưng chỉ có đường L-glucose và đường D-glucose là 2 chất homology vì tổ tiên chung trực tiếp của nó là glucose.
    Như vậy 2 gene/protein homologous thì rõ ràng có hệ số similarity cao; nhưng 2 gen/protein có hệ số similarity cao chưa chắc là homologous.
    Mặc dù thế, không phải nhà sinh học nào trên tg cũng phân biệt được hai khái niêm này, nên nhiều người vẫn viết two protein are 95% homologous, thật ra ý ông/bà đó muốn nói là 2 protein đó giống nhau 95%. Vì 95% giống nhau quả thật có thể là do cùng 1 tổ tiên chung đưa đến nhưng 5% còn lại thì không chắc là do tổ tiên trực tiếp gây ra. Chì khi người ta nhìn lên phylogenetic tree thì mới biết ai là homologous với nhau.
  7. thht

    thht Thành viên quen thuộc

    Tham gia ngày:
    12/05/2002
    Bài viết:
    557
    Đã được thích:
    0
    Em có một câu hỏi rất cần được sự giải đáp của các anh chị:
    _Khi em thiết kế một cặp primer để nhân một đoạn đặc hiệu đã biết, em dùng phần mềm thiết kế primer, đã tìm được một cặp primer tối ưu. Nhưng khi dùng BlastN (nucleotide) kiểm tra lại thì đáng tiếc, em thấy có rất rất nhiều đoạn tương tự giống với một trong hai primer trên (giống ở dạng Plus/Plus chứ không chỉ có ở dạng Plus/Minus). Và đáng buồn nhất là đối tượng em làm là Homo sapiens thì có tới hàng chục trường hợp trùng lặp hoàn toàn cũng ở đối tượng này.
    Em cực kỳ băn khoăn, vì lỡ mình PCR bằng đoạn mồi nói trên thì sẽ tạo ra nhiều sản phẩm không đặc hiệu, sẽ làm giảm hiệu suất PCR và ... nói chung là rất không hài lòng.
    Dưới đây là đoạn Forward primer của em, Request ID của nó là:
    1096035364-7527-26846895915.BLASTQ1
    các anh chị copy rồi paste vào khung """The request ID is """để nhìn thấy sự trùng lặp khi alignment xảy ra như thế nào.
    Ai có kinh nghiệm về chuyện này giúp em với. Ngày trước nghe bác Concay bảo rằng để tìm được một đoạn có trình tự tương đồng với query khoảng 20 nucleotide là khá hiếm, thì nay em thấy sự thật đảo lộn hoàn toàn.
    Đây là Request ID của toàn bộ đoạn em quan tâm
    1096035844-16971-196659540909.BLASTQ4
    Giúp em với, đang rất hoang mang !
    Anh weirdhobbit đâu rồi !
    Được thht sửa chữa / chuyển vào 21:24 ngày 24/09/2004
  8. aigu

    aigu Thành viên mới

    Tham gia ngày:
    16/09/2004
    Bài viết:
    386
    Đã được thích:
    1
    các bác chạy WIN có thể thử cái BIOE*** để chạy alignment, tạo phylogeneric tree. Có thể dl miễn phí bằng google search với key BIOE***. Tôi đã dùng và thấy rất tiện.
    ==> Việc thiết kế mồi chạy trên genomic DNA để được kết quả highly specific theo tôi là không dễ. Nếu bạn thấy mồi của bạn có khả năng bắt cặp với nhiều đoạn khác, trong khi cái đoạn bạn cần ko thể xê dịch được thì theo tôi bạn có thể thiết kế thêm 1 cặp mồi nữa (habour cái đoạn bạn cần) rồi sau đó bạn dùng sản phẩm PCR này làm làm khuôn chạy 1 bước PCR nữa với cặp mồi hiện có (hình như được gọi là Nested PCR), hy vọng sẽ khá hơn!
  9. weirdhobbit

    weirdhobbit Thành viên quen thuộc

    Tham gia ngày:
    19/05/2002
    Bài viết:
    165
    Đã được thích:
    0
    Chào bạn, lâu ngày bận bịu không lên tự dưng thấy tên mình bị/được réo gọi thảm thiết làm tôi cũng hoảng quá. Rất tiếc là tôi đọc bài của bạn hơi chậm nên không xem được kết quả BLAST của bạn. Bạn cung cấp thông tin như vậy thì tôi cũng không thể có lời khuyên gì tốt hơn là bạn hãy design lại primers khác... Thực ra sự trùng lắp này có thể là do bạn chọn primers có trình tự nằm trong những vùng lặp lại của bộ gene, cũng có thể do bạn đọc chưa kĩ kết quả BLAST của bạn, nó có thể đưa ra cả trăm kết quả có trình tự giống với primers là do có nhiều người đã làm trên cùng gene đó và submit nhiều trình tự lên... và nhiều "có thể" khác... Nested PCR cũng là một gỉai pháp hay, nhưng bản thân tôi thì không thích cách này lắm vì rất dễ bị nhiễm chéo giữa các mẫu, có lẽ tại bản thân tôi làm việc vụng về :)
    Nếu đến bữa nay bạn vẫn còn hoang mang và nghĩ tôi có thể giúp được nhiều hơn thì có thể pm cho tôi chi tiết về trình tự của bạn làm, hoặc nhắn offline YIM weirdhobbit81.
    Hi vọng là bạn đã thành công!
  10. thht

    thht Thành viên quen thuộc

    Tham gia ngày:
    12/05/2002
    Bài viết:
    557
    Đã được thích:
    0
    Đáng tiếc, em không thể dùng nested PCR được.
    Nếu anh sợ across contamination thì chạy Non-stop nested PCR đi. Cứ thiết kế sao cho cặp phía ngoài có Tm khoảng 65 còn cặp trong khoảng 55 là được, sao cho nồng độ cặp ngoài khoảng 1/5 so với cặp trong. Vậy là khỏi lo nhiễm lung tung nữa vì đâu có cần mở tube ra đâu mà lo.
    Nếu nhiều người cùng submit cùng một trình tự lên thì tối thiểu trình tự đó cũng phải ở cùng một NST. Đằng này em blast được nó nằm ở nst 1, 3, 5, ... chán ...
    Đoạn trình tự đó cũng không nằm trong vùng lặp lại, em kiểm tra kỹ rồi, đáng tiếc.
    Anh còn cách nào không, cho em một lời khuyên đi

Chia sẻ trang này