1. Tuyển Mod quản lý diễn đàn. Các thành viên xem chi tiết tại đây

"Nhật <->Việt từ điển online" project: HELP!

Chủ đề trong 'Nhật (Japan Club)' bởi xsa, 07/01/2003.

  1. 0 người đang xem box này (Thành viên: 0, Khách: 0)
  1. xsa

    xsa Thành viên quen thuộc

    Tham gia ngày:
    02/10/2001
    Bài viết:
    249
    Đã được thích:
    0
    "Nhật Việt từ điển online" project: HELP!

    Hi JC! A bright day desune!

    Có vấn đề này muốn JC chỉ dạy.
    XSA muốn làm 1 từ điển N-V online, nhưng mà đang gặp vấn đề về phần dữ liệu.
    Xsa đang nghĩ tới 3 hướng:
    1. Mua lại dữ liệu của cuốn "Từ điển Nhật Việt, Việt Nhật" (màu đen, đỏ) của Nhà xuất bản Văn Hoá. Không biết liên hề với NXB kiểu gì?
    2. Thuê, người gõ dữ liệu từ 1 cuốn từ điển nào đó (hic, copyright problem???)
    3. Tìm những thành viên JC có thể hợp tác! COOL!

    Mong các JCer cho thông tin và lời khuyên về 3 hướng trên, hay nếu có ý tưởng nào khác thì thật tuyệt.
    Mọi đóng góp XSA vô cùng cảm tạ.


    --------------------------------
    "Help!" is an error message.
  2. Stinger

    Stinger Thành viên quen thuộc

    Tham gia ngày:
    11/02/2002
    Bài viết:
    817
    Đã được thích:
    0
    Phương án 1, mua lại dữ liệu của NXB thì chắc là đắt lắm đấy, với lại chưa chắc người ta đã bán cho.
    Phương án 2, ngồi gõ lại á???!!!!!! Mission Impossible !!
    Phương án 3, hmm... cái này chưa biết thế nào.
    Stinger &gt;:)
    Chúng ta chỉ thấy hết giá trị của những gì chúng ta đã đánh mất.
    人は... ZZY-の幸>,' 追"
  3. mit-uot

    mit-uot Thành viên rất tích cực

    Tham gia ngày:
    17/05/2001
    Bài viết:
    2.326
    Đã được thích:
    0
    em thấy mấy quyển từ điển Nhật Việt - Việt Nhật có bán ở VN chuối khủng khiếp, giải thích từ ko ra đâu vào với đâu cả, ví dụ thì chả có, nhiều khi còn bê nguyên xi cả âm Hán Việt vào nữa chứ. nếu xsa muốn làm từ điển em nghĩ nên dùng từ điển Nhật - Anh, sau đó dịch sang Anh - Việt thì hay hơn
    No man no cry, No woman no laughter
  4. vdiep1205

    vdiep1205 Thành viên mới

    Tham gia ngày:
    17/12/2002
    Bài viết:
    56
    Đã được thích:
    0
    Gửi đến xsa một tràng vỗ tay vì tấm thiện ý.!
    Phương án 1 tôi nghĩ cũng có thể khả thi, nhưng tôi thấy còn khó hơn phương pháp 2. Nếu có được dữ liệu trong cuốn đó thì đỡ nhiều rồi, dù nó vẫn có một số khiếm khuyết. Chuyện bản quyền thì tôi nghĩ bạn chả nên lo nhiều lắm. Tôi thấy quyển tử điển chữ Hán 1945常"漢- (cũng mầu đỏ đen giá 135.000đ hồi tôi mua, NXB thì xin lỗi tôi quên rồi), cũng bê nguyên xi cấu thành của một quyển từ điển Kanji Nhật Anh khác, chỉ khác là thay nghĩa Việt và thêm âm Hán Việt vào thôi. Mà tôi thì chả tin NXB này đã mua bản quyền tác giả từ chủ bút cuốn từ điển kia. Chỉ có điều tôi thấy nhiều cuốn từ điển củ chuối lắm, nhiều khi không đưa ra được một ý chính xác nào. Mà làm từ điển chắc cũng không phải là một chuyện dễ rồi. Tôi cũng đã từng định làm một cuốn từ điển chữ Hán có tất cả các cách tra theo bộ thủ, cách đọc Nhât, VIệt, nhưng vì không nhiều thời gian nên bỏ dở chừng. Dù sao cũng xin chúc bạn đi đến cùng với dự định của mình.
  5. genhitsuu

    genhitsuu Thành viên quen thuộc

    Tham gia ngày:
    09/04/2002
    Bài viết:
    123
    Đã được thích:
    0
    Bao năm ròng rã, bây giờ mời gặp người đồng chí đây !
    Cách đây vài năm và cho đến cả bây giờ tôi vẫn đang một mình hì hụi phát triển một tự-từ điển V-N-A online miễn phí, các vấn đề về kỹ thuật hay thậm chí cả nguồn dữ liệu thô tôi đều không thiếu nhưng vấn đề khó khăn nhất chính là việc dịch thuật & tinh chỉnh dữ liệu ! Thủa ban đầu tôi cũng có mời vài người bạn cùng hợp tác nhưng chỉ nhận được những lời hứa suông, tức mình tôi đã tự mình âm thầm phát triển chương trình (việc nhập liệu được bớt-nhàm-chán hoá bằng cách tưởng tượng rằng mình đang ôn lại Kanji) và đã đưa nó online cách đây gần nửa năm, bạn có thể tham khảo nó ở www.tudienkanji.com. Tuy chưa đạt được các tính năng cần có của một từ điển đúng nghĩa nhưng nó đã tỏ ra rất hữu ích trong việc tra cứu Kanji & các từ ghép. Nếu thời gian và sức lực cho phép (lại nếu) thì có lẽ tôi sẽ làm thêm được nhiều tính năng hơn, nhưng (lại nhưng)...
    Nếu bạn gặp khó khăn gì thì cứ cho tôi biết nhé, trong khả năng cho phép biết đâu tôi lại có thể giúp được gì đấy cho bạn chăng... tất cả vì sự nghiệp tiếng Nhật mà

    f,,
  6. ET.KODOMO

    ET.KODOMO Thành viên rất tích cực

    Tham gia ngày:
    19/03/2002
    Bài viết:
    1.002
    Đã được thích:
    0
    Ui ui, lâu lắm mới vào JC lại thấy có một topic tâm đắc thế này. XSA thử sức đi, có nhiều người đồng chí quá rồi này. ET có giúp gì được không nhỉ? Dịch thuật (bao gồm cả translation, e***ting và proofreading) là công việc hiện tại của ET đấy. Để ET giúp, bất cứ gì có thể. Cùng thực hiện ý tưởng này đi thôi............1,2,3 Gambarimashou !!!!!!!!!!!!!!!
    To Genhitsuu: Cám ơn tudienkanji.com nhé ! Thì ra bạn là tác giả của nó hả? Cũng rất tiện ích, nhưng mà nó cùng với cái PC càng ngày càng góp phần "giúp" ET quên cách viết chữ Hán , bây giờ thậm chí quên cả cách viết Kazoku......hic hic hic
    ET.KODOMO
    Arigatou ! Aete yokatta.....
  7. vdiep1205

    vdiep1205 Thành viên mới

    Tham gia ngày:
    17/12/2002
    Bài viết:
    56
    Đã được thích:
    0
    ỗổTó,?ó-ó"ùẳ Cuỏằ'n tỏằô 'iỏằfn cỏằĐa genhitsuu quỏÊ là tuyỏằ?t vỏằi, không ngỏằ lỏĂi có ngặỏằi kỏằ công 'ỏn thỏ. QuỏÊ là may mỏn và hiỏm hoi khi gỏãp 'ặỏằÊc mỏằTt cao nhÂn nhặ thỏ! Xin bĂi phỏằƠc ! BĂi phỏằƠc !
    Nhơn chung tôi rỏƠt tôn trỏằng ẵ kiỏn tĂc giỏÊ khi lỏưp cỏƠu thành cho trang web cỏằĐa mơnh, và tôi thỏƠy vỏằ giao diỏằ?n không có gơ 'Ăng chê trĂch lỏm. Nhặng nỏu bỏằ bỏằ>t chỏằ ổẳÂ trong nỏằn 'i thơ chỏƠc sỏẵ dỏằ. 'ỏằc hặĂn. Hi vỏằng trang web cua genhitsuu sỏẵ 'ặỏằÊc nhiỏằu ngặỏằi biỏt 'ỏn.
  8. xsa

    xsa Thành viên quen thuộc

    Tham gia ngày:
    02/10/2001
    Bài viết:
    249
    Đã được thích:
    0
    Great! Vậy là đã có người cùng hợp tác!
    Chúng ta cần khoảng 10 người.
    Nội dung cần làm "Từ điển Nhật &lt;-&gt;Việt trực tuyến."
    1. Chia nhóm phụ trách các phần Nhật Việt, Việt Nhật, các vần,...
    2. Data (sau khi đuợc proofreading) được chuyển định kì đến cho Người phụ
    trách mang để cập nhật data. ( Vì là trực tuyến nên giữ liệu được cập nhật
    thường xuyên, không cần hoàn thành rồi với đưa vào sử dụng.)
    3. Chương trình chạy từ điển: PHP+MySQL database. Nhập giữ liệu trên Excel.
    Về Cre*** cho các thành viên: A life time cre***, nắm bản quyền của từ điển.
    Ra quyêt định với cách sử dụng từ điển theo nguyên tắc số đông.
    Về phần mục từ, có lẽ chúng ta dùng 1 quyển từ điển nào đó, sau đó E*** lại
    những chỗ chưa thích hợp, hoặc dich lại từ đầu bằng cách E*** lại giữ liệu
    Nhật Anh, Anh Nhật của từ điển PDIC (thử dùng Online tại
    http://www.alc.co.jp/). Từ điển này khá đầy đủ và hữu dụng. Xsa
    có Data dạng tex của PDIC.
    -----------
    Vì là Project khá táo bạo nên cần có nhiều góp ý và đóng góp. Đặc biệt là số
    thành viên. Hiện nay chắc là có 3 người:
    1. Chị ET. (Project leader - "i ll ask her about this later") 2. Gen****u, 3
    Xsa.
    Your names please.
    Sau khi hoàn thành phần chiêu mộ thành viên, chúng ta sẽ chuyển nơi thảo
    luận.
    Xin hết.
    PS. Thực ra Xsa cũng có làm 1 quyển TĐ chữ hán.
    Các bác thử dùng xem: (dùng ofline)
    http://betonamu.net/modules.php?name=Downloads&d_op=getit&lid=1
    Xsa đang thử nghiệm Online tại http://betonamu.net/dic/ (hiện nay chỉ OK phần Việt Hán thui à...)
    ALL AHEAD!
    --------------------------------
    "Help!" is an error message.
  9. genhitsuu

    genhitsuu Thành viên quen thuộc

    Tham gia ngày:
    09/04/2002
    Bài viết:
    123
    Đã được thích:
    0
    -&gt; vdiep1205 : cám ơn lời khen của bạn, thật ra lúc đầu tôi chỉ định sử dụng nó như một công cụ để học tập tiếng Nhật cho riêng mình thôi, sau thấy rằng nếu vứt xó thì phí quá nên tôi mới tìm cách cho nó online & phổ biến cho một số người bạn với hy vọng những cố gắng của mình sẽ giúp ích phần nào cho họ trong quá trình học thứ tiếng khó xơi này. Còn về phần design, có lẽ bạn nói đúng, nó hơi bị khó nhìn phải không ? tôi vốn chẳng có mắt nghệ thuật, thấy có cái gì hay hay thì thử áp dụng thôi, cái hình chữ 漢 chìm đằng sau làm tôi tốn mất mấy buổi xoay ngang xoay ngửa trên mấy cái phần mềm design, có lẽ lúc đầu nó cũng khó xem nhưng sau có lẽ tôi dần quen với nó nên cảm thấy nó...đẹp. Nay có người cảnh tỉnh, có lẽ tôi phải nhìn lại nó với con mắt bớt thiện cảm hơn để đủ can đảm bỏ nó ra...
    -&gt; xsa, ET.KODOMO : rất tán đồng với đề nghị của các bạn, nhưng làm một từ điển cho ra hồn thì không phải là chuyện đơn giản đâu. Theo tôi, cái quan trọng nhất là khâu dịch thuật, nếu không dịch sang tiếng Việt thì trên thế giới này đã có cả trăm phần mềm hay trang web đã làm điều này rồi, còn nếu dịch được thành công sang tiếng Việt thì tôi dám chắc nó sẽ là từ điển Việt Nhật online đầu tiên trên thế giới ! Nói về sự khó khăn của việc dịch thuật, tôi nêu một vài dẫn chứng cụ thể : hiện giờ số lượng entry của dữ liệu từ điển Nhật &lt;-&gt; Anh do Jim Been phổ biến miễn phí trên mạng đã lên tới 110.000 mục từ, 1 người tình nguyện trung bình dịch được khoảng 20 mục từ/ngày -&gt; sẽ mất khoảng 5.000 ngày công để hoàn thành phần dữ liệu, một con số khổng lồ đấy, công sức của chỉ một hai người không thể nào hoàn thành nổi đâu ! Mặt khác cũng cần bàn đến chất lượng của việc dịch thuật, người tình nguyện nhất thiết phải có một trình độ tiếng Anh + tiếng Nhật hoàn hảo thì mới đảm đương được việc này, mà số lượng những người này tôi nghĩ hiện giờ chắc chỉ như lá mùa ..đông ở VN !
    Trong quá trình xây dựng nguồn dữ liệu cho www.tudienkanji.com, tôi cũng đã xây dựng xong phần dữ liệu Kanji (với khoảng 3800 chữ, nhập liệu hoàn toàn bằng tay và đang có ý định nhập hết 6500 chữ Kanji trong thời gian tới) và phần từ ghép (96.000 từ, chủ yếu sử dụng nguồn từ Jim Been, nhập liệu được thực hiện bằng tool đặc chủng). Tiếng Việt của phần từ ghép được tôi dùng phần mềm VietTrans chuyển ngữ một cách tự động nên rất ngô nghê và rất nhiều từ dịch sai, nhưng nếu dựa trên phần chuyển ngữ này mà tiến hành dịch thuật thì tốc độ sẽ tăng lên rất nhiều do chỉ cần tinh chỉnh lại ngôn từ và những thành ngữ mà máy dịch không dịch được ! Tôi cũng sẽ dự định tặng toàn bộ dữ liệu mà tôi đã dày công tạo được này cho dự án tương lai của JC.
    Việc nhập liệu, vì đây là một dự án phân tán - không đồng bộ nên có thể sử dụng cả hai phương pháp online và offline. PP online : người tình nguyện sử dụng form đặc chủng để nhập liệu, dữ liệu sẽ được ghi lên DB ở server sau đó sẽ được người có trách nhiệm xem xét và cho nhập vào nguồn dữ liệu chính thức. PP offline : người nhập liệu tình nguyện sẽ phải sử dụng một tool để nhập liệu tại máy tính của mình, sau đó sẽ upload dữ liệu lên server rồi sau đó sẽ được xử lý như pp online.
    Về ngôn ngữ lập trình: bạn xsa đề xuất PHP + MySQL, tôi cũng đồng ý với ý kiến này do tốc độ xử lý + tính dễ sử dụng của nó.
    Vấn đề hosting : dùng www.betonamu.net của bạn xsa ?
    Còn nhiều vấn đề cần phải bàn nữa trước khi bắt tay vào thực hiện, nhưng có lẽ tôi đã viết quá dài rồi. Hi vọng dự án đầy tham vọng này sẽ thành sự thực và được sự hưởng ứng của tất cả mọi người, chứ đừng nên chỉ dừng lại ở mấy lời hưởng ứng sáo rỗng rồi tất cả lại chìm vào quên lãng !
    dĩ thượng

    f,,
  10. xsa

    xsa Thành viên quen thuộc

    Tham gia ngày:
    02/10/2001
    Bài viết:
    249
    Đã được thích:
    0
    Vậy tóm lại như sau:
    Mong các bác cho ý kiến:
    1. Dùng danh sách much từ của EDIC (JIM BREEN) theo bạn Gen****su đề nghị.
    http://ftp.cc.monash.edu.au/pub/nihongo/edict.zip
    Xsa chuyển sang Unicode và Up thử khoảng 1000 từ lên đây, các bác xem thử. http://betonamu.net/dic/
    2. Quá trình làm từ điển có thể dùng Server của http://betonamu.net/dic/ để TEST, sau đó sẽ tính sau:
    Betonamu.net hỗ trợ MySQL và PHP free.
    3. Hôm trước có Chat với chị ET, thấy rằng vấn đề Nhân lực là vô cùng khó khăn. Có tới hơn 10 vạn mục từ, chúng ta cần khoảng 20 người. XSA có thể lo 5,6 người, how about the rest?
    Mong các bác tiếp tục cho ý kiến.
    --------------------------------
    "Help!" is an error message.

Chia sẻ trang này