1. Tuyển Mod quản lý diễn đàn. Các thành viên xem chi tiết tại đây

Chữ Việt mới dùng cho công nghệ thông tin

Chủ đề trong 'Tiếng Việt' bởi NgNinh, 07/05/2007.

  1. 1 người đang xem box này (Thành viên: 0, Khách: 1)
  1. honghoavi

    honghoavi Thành viên rất tích cực

    Tham gia ngày:
    17/04/2004
    Bài viết:
    1.412
    Đã được thích:
    0
    Về cái đề án của bác NgNinh tố thấy mặc dù bác rất cố gắng để hoàn thành đề án, tôi chưa đọc kỹ toàn bộ, nhưng cảm nhận ban đầu là có cái hay và cái mới nhưng cái hay thì không mới cái mới thì không hay....
    Chữ Việt là chữ ghi âm vì vậy tiêu chí hàng đầu là trong các ký tự phải thể hiện được phần âm của chữ. Không chỉ ở VN mà ở tất cả các quốc gia trên thế giới có chữ ghi âm khi viết đều phải đảm bảo quy tắc này. Chữ viết của bác không đảm bảo được nguyên tắc này.
    Lợi ích của nó về mặt ngắn gọn trong việc ghi chép thì tôi thấy đơn giản là hãy sử dụng quy tắc tốc ký. Vì việc học quy tắc tốc ký vẫn không khó hơn học cách ghi mới của bác mà về hiệu quả sử dụng ghi tắc thì còn hơn đề án của bác nhiều....
    hhv
  2. honghoavi

    honghoavi Thành viên rất tích cực

    Tham gia ngày:
    17/04/2004
    Bài viết:
    1.412
    Đã được thích:
    0
    Về cái đề án của bác NgNinh tố thấy mặc dù bác rất cố gắng để hoàn thành đề án, tôi chưa đọc kỹ toàn bộ, nhưng cảm nhận ban đầu là có cái hay và cái mới nhưng cái hay thì không mới cái mới thì không hay....
    Chữ Việt là chữ ghi âm vì vậy tiêu chí hàng đầu là trong các ký tự phải thể hiện được phần âm của chữ. Không chỉ ở VN mà ở tất cả các quốc gia trên thế giới có chữ ghi âm khi viết đều phải đảm bảo quy tắc này. Chữ viết của bác không đảm bảo được nguyên tắc này.
    Lợi ích của nó về mặt ngắn gọn trong việc ghi chép thì tôi thấy đơn giản là hãy sử dụng quy tắc tốc ký. Vì việc học quy tắc tốc ký vẫn không khó hơn học cách ghi mới của bác mà về hiệu quả sử dụng ghi tắc thì còn hơn đề án của bác nhiều....
    hhv
  3. NgNinh

    NgNinh Thành viên quen thuộc

    Tham gia ngày:
    04/05/2007
    Bài viết:
    107
    Đã được thích:
    0
    Cảm ơn bác honghoavi đã góp ý.
    Mong bác đọc kỹ hơn đề án, nhất là phần thứ 2: "Những lợi ích chính của chữ Việt mới" và góp thêm ý kiến
    Chào thân ái !
  4. NgNinh

    NgNinh Thành viên quen thuộc

    Tham gia ngày:
    04/05/2007
    Bài viết:
    107
    Đã được thích:
    0
    Cảm ơn bác honghoavi đã góp ý.
    Mong bác đọc kỹ hơn đề án, nhất là phần thứ 2: "Những lợi ích chính của chữ Việt mới" và góp thêm ý kiến
    Chào thân ái !
  5. hoa_khanh

    hoa_khanh Thành viên gắn bó với ttvnol.com

    Tham gia ngày:
    30/11/2003
    Bài viết:
    7.371
    Đã được thích:
    6.823
    Tiếp chuyện bác 1 bữa cho đến đầu đến đũa xem sao.
    Tóm lại, đề án của bác có 2 fần: fần 1 là về gõ nhanh tiếng Việt, fần 2 là về giúp đỡ cho công nghệ thông tin, phải không?
    Có vẻ như bác đang có ý bỏ fần 1 và theo fần 2. Công bằng mà nói, tôi nghĩ fần 1 của bác có lẽ có ích hơn. Dù rằng đã có 1 số đề án cải tiến rồi, của bác cũng chỉ là 1 trong rất nhiều, nhưng dù sao đó cũng là 1 cái gì mới mới.
    Còn nếu bác chỉ muốn cải tiến CNTT thì như tôi có nói là bác đi muộn chừng 10 năm. Tôi cũng làm CNTT đây, nên cho phép tôi fản biện mấy ý của bác :)
    - "Nhất là việc viết liền các từ kép để tạo thuận lợi cho việc chế tạo các phần mềm phiên dịch và các phần mềm sửa lỗi chính tả." Kho^ng hiểu bác lấy ý này ở đâu ra? Vì sao viết liền lại dễ sửa lỗi chính tả hơn viết rời?
    - "Chữ Quốc ngữ (chữ có dấu) viết rời từng từ nên gây trở ngại cho nhiều ứng dụng tin học". Chữ có dấu thì hơi trở ngại 1 chút, tôi sẽ nói thêm sau, nhưng viết rời thì có trở ngại gì ? Giả sử thay vì tiengviet, giờ viết tieng viet, đối với cái computer tôi không thấy có trở ngại gì cả(?)
    - "Thế là công nghệ phải ngồi chờ chữ viết." Tôi chẳng thấy ai làm CNTT phải ngồi chờ chữ viết cả, nhất là từ sau khi Unicode trở nên phổ biến.
    - "Chúng ta đều biết các nước Trung Quốc, Nhật, Hàn Quốc rất trân trọng bảo tồn chữ viết truyền thông của họ, nhưng họ đều có chữ Latinh hóa để tạo thuận lợi cho khoa học, kỹ thuật phát triển". Bác quên rằng các tiếng kia phải Latin hóa vì họ dùng chữ tượng hình, còn tiếng Việt ta đã Latin hóa từ lâu rồi mà? Và sở dĩ họ phải Latin hóa chẳng qua vì không thể dùng công cụ thông thường (bàn phím chẳng hạn) để gõ chữ tượng hình. Chứ bây giờ website các thứ của họ cũng toàn chữ lổm ngổm thôi, có mấy cái website nào đăng tải nội dung bằng chữ Latin hóa đâu?
    - "Cái dấu trong chữ Viêt xem ra cũng đoạn trường lắm đấy. Việc đánh dấu chữ Việt hiện nay chưa theo một qui tắc chặt chẽ." Gõ dấu chỉ là 1 thứ tiêu chuẩn (standard) trong tiếng Việt, hôm nay chưa hoàn hảo, ngày mai cãi nhau chán sẽ hoàn hảo. Đề án của bác cũng chẳng giúp hoàn thiện thêm việc gõ dấu đúng không? Còn nếu bảo vì gõ dấu gây tranh cãi (thực ra chỉ khi bác nói tôi mới biết là có tranh cãi chứ xưa giờ có thấy ai thắc mắc bao giờ?) mà bỏ hết toàn bộ dấu má thì tôi nghĩ bác đang làm nghèo đi tiếng Việt quá nhiều :)
  6. SeeTrocKD

    SeeTrocKD Thành viên mới

    Tham gia ngày:
    21/05/2007
    Bài viết:
    2.048
    Đã được thích:
    0
    Em ở Đức, thấy từ dùng trong IT nói riêng và từ kỹ thuật nói chung của Đức bị lai căng của Anh rất ghê. Hầu như 1 động từ tiếng Anh nào hay dùng trong KT cũng đẻ ra 1 ĐT tương ứng bên tiếng Đức, chỉ thêm đuôi -ieren.
    Nên tiếng Việt mình cũng nên chế ra vài từ lai Anh cho dễ dùng. Như các cụ ngày trước dùng từ lai Pháp lai Tàu
  7. NgNinh

    NgNinh Thành viên quen thuộc

    Tham gia ngày:
    04/05/2007
    Bài viết:
    107
    Đã được thích:
    0
    Thân gửi bác Hòa Khánh,
    Tôi đoán bác cũng khá quan tâm đến đề tài này, nên đã bỏ công đọc kỹ đề án và muốn tranh luận cho ra nhẽ. Tôi rất hoan nghênh thiện chí của bác và có lời cảm ơn.
    Để án của tôi ngay từ đầu đã nêu ra nội dung " Đề xuất phương án cải tiến chữ Việt hiện nay thành chữ Việt không dấu " , nhằm 3 mục tiêu chính " Không dấu - Ngắn gọn -Viết liền ". Ba muc tiêu này không thể tách rời, mà hỗ trợ lẫn nhau để đat một mục tiêu bao trùm là "Thuận tiện cho công nghệ thông tin". Vì vậy không có ý bỏ phần nào và theo phần nào như bác nêu ra. Xuất phát điểm của những nội dung, mục tiêu trên đây là thực tế cho thấy: Vì chữ Việt có quá nhiều dấu nên gây trở ngại cho việc sử lý các tiện ích của CNTT. Đành rằng hiện nay, qua bao vất vả, tốn kém trong việc chuẩn hóa cách gõ tiếng Việt, và đã tiến tới có Unicode chuẩn hóa quốc tế. Song có ai dám chăc sau này chữ Việt với nhiều dấu và viết rời từng từ đơn âm lại không còn gây trở ngại cho các ứng dụng của công nghệ thông tin ? Nếu từ đầu ta có chữ không dấu thì đã không phải trải qua một thời gian dài mò mẫm và từ nay về sau ta không cần lo lắng gì đến chữ nữa. Có thể nói vừa qua các chuyên gia tin học Việt nam đã mất quá nhiều thời gian vào việc nghiên cứu về " chữ nghĩa", nếu thời gian ấy dành cho những nghiên cứu khác thì nền tin học của ta có khi còn tiến bộ sớm hơn bây giờ phải không bác ? ( Vì CNTT phải chờ chuẩn hóa chữ viết mà !)
    Việc viết liền các từ kép có rất nhiều lợi ích không chỉ trong lĩnh vực tin học. Ngay cái khoản một từ kép cũng chỉ là một từ với một nghĩa nhất định mà lại viết thành nhiều từ rời ra đã là phi lý rồi. Song vì đây là diễn đàn tin học nên ta chỉ bàn giới hạn trong phạm vi lợi ích của CNTT: Hiện nay Việt nam ta có một vài phần mềm " Từ điển và phiên dịch" và phần mềm "Soát lỗi chính tả", mong bác tìm hiểu và sử dụng thử một thời gian để thấy rõ ưu nhược điểm của các phần mềm này, trong đó môt nguyên nhân gây nên những sai sót đáng tiếc là việc không viết liền các từ kép. Trong quá trình trao đổi trên diễn đàn, tôi thường tránh bình luận công trình của người khác vì đây là vấn đề tế nhị. Vì vậy xin không nêu cụ thể các phần mềm trên đây, mong bác thông cảm.
    Trong các phần mềm "Phiên dịch", việc viết liền từ kép giúp máy dịch chính xác hơn. Xin nêu một thí dụ đơn giản và dễ thấy:
    Khi ta viết " Đất nước ta". có thể hiểu theo hai cách :
    - Tổ quốc hoặc quê hương ta, dịch sang tiếng Anh là our home country hoặc our homeland.
    -Đất đai của nước ta, dịch là the land of our country hoặc the soil of our country.
    Đây mới chỉ là những câu ngắn. Với những câu dài liệu máy có đủ thông minh để dịch đúng ý ta muốn không ?
    Sự sai sót của máy có thể giải quyết dễ dàng nếu ta viết hai từ "Đất" và "Nước" liền nhau trong câu 1 và rời nhau trong câu 2.
    Trong việc sửa lỗi chính tả viết rời từ kép cũng gây trở ngại tương tự. Thí dụ: Câu " Hãy điều tra (cha) con nhà hàng sứ (xứ)".
    Câu này nếu không thực hiện viêt liền các từ kép thì máy không thể sửa lỗi chính tả vì không thể biết phải viết "Tra" hay "Cha", "Sứ" hay "Xứ". Nếu thực hiện viết liền từ kép, câu này có thể viết thành 4 câu có nghĩa khác nhau:
    -Hãy điềutra con nhàhàng sứ. (nhà hàng bán đồ sứ)
    -Hãy điều chacon nhàhàng sứ.
    -Hãy điềutra con nhà hàngxứ. (hàng xứ là người nơi khác đến ngụ cư)
    -Hãy điều chacon nhà hàngxứ
    Và lúc đó máy mới dễ dàng hiểu cần phải sửa lỗi cho từng câu trên được chính xác.
    Tôi rất đồng ý với bác là chữ Quốc ngữ đã Latinh hóa rồi, nhưng cần cải tiến những bất hợp lý để hoàn chỉnh hơn, phù hợp hơn với công nghệ mới. Tôi nghĩ không có gì là bất biến cả mà !
    Còn việc bỏ dấu có làm nghèo tiếng Việt không ? Bỏ thanh mới làm nghèo tiếng Việt. Chữ mới không bỏ thanh, chỉ thay dấu thanh bằng 5 chữ cái (chữ thanh) đặt ở cuối từ nên không ảnh hưởng gì đến tiếng Việt, mà lại không phải tranh luân xem nên đánh dấu vào nguyên âm nào mới hợp lý.
    Thân !
  8. PKaN

    PKaN Thành viên mới

    Tham gia ngày:
    15/11/2006
    Bài viết:
    979
    Đã được thích:
    0
    Đọc đi đọc lại vẫn không hiểu rõ lắm ý của bác NgNinh. Bác nhấn mạnh vào phần "công nghệ thông tin" nhưng tôi cứ có cảm giác bác đang muốn sửa đổi tiếng Việt nói chung chứ không chỉ tiếng Việt dùng trong CNTT. Nếu tối hiểu đúng ý bác thì khi viết trên giấy, trên báo, trên web thì vẫn hiển thị tiếng Việt với dấu má, các từ ghép không liền nhau... cái khác, theo dự án của bác, là ở chỗ, lúc gõ thì ta sẽ không gõ như vậy ? Nghĩa là "gõ một đằng hiện ra một nẻo" ? "What you type is what you won''t get" ? Thế nhưng bác lại lấy ví dụ về phần mềm kiểm tra lỗi chính tả và phiên dịch, như vậy nghĩa là để các phần mềm này hoạt động chính xác thì sẽ là cầnthiết phải viết các từghép liền vào nhau, thậmchí còn lượcbỏbớt các dauthanh ??? Việc ''kải kách'' tiếng Việt luôn gây tranh cãi từ xưa nay rồi (bác có thể tham khảo thêm nhiều chủ đề khác trong box này), đâu thể dễ dàng quyết định một sớm một chiều được hả bác. Tóm lại, bác muốn thay đổi tiếng Việt "dùng trong CNTT" hay "tiếng Việt" đơn thuần" ?
    Ngoài ra, một phần mềm dịch song ngữ hay đa ngữ hoạt động lý tưởng là điều khó có thể tưởng tượng. Phiên dịch là lĩnh vực mà máy móc không thể thay thế con người vì đây là công việc đòi hỏi sự linh hoạt, thích ứng vào từng tình huống cụ thể. Công việc của máy, nếu có thể, chỉ là phụ trợ thôi. Do đó nếu bác muốn tăng hiệu quả của các phần mềm này thì cái cần thay đổi không phải là ngôn ngữ mà là cách lập trình. Chẳng hạn, muốn cho máy "hiểu" một câu viết bằng tiếng Việt thì không chỉ đơn thuần là đọc từng từ ngăn cách nhau bởi các khoảng trống mà phải "đọc" cả câu và tìm cách phân tích từng phần của câu, thậm chí cả bài viết. Ví dụ, muốn dịch "đất nước ta" thì phải tìm hiểu cả đoạn có chứa câu đó, xem từ vựng của đoạn đó nằm trong lĩnh vực nào để từ đó đưa ra giải pháp thích hợp. Hoặc để sửa chính tả của cụm "cha con" thì không chỉ đơn thuần tìm tra/cha có phải là những từ có nghĩa hay không mà phải tìm xem "tra con" liệu có phải là một cụm có nghĩa hay không.
    Theo tôi, vấn đề bác nêu ra không nhất thiết nằm trong những điểm bất tiện (có thực) của tiếng Việt mà có lẽ nằm trong khả năng lập trình CNTT.
  9. NgNinh

    NgNinh Thành viên quen thuộc

    Tham gia ngày:
    04/05/2007
    Bài viết:
    107
    Đã được thích:
    0
    Bác PKaN thân mến,
    Qua góp ý của bác tôi thấy bác còn phân vân nhiều về lợi ích thiết thực của chữ mới trong CNTT. Lợi ích rõ nhất mà ai cũng thấy ngay là chữ này ngắn gọn, nếu dùng quen có thể tiết kiệm được khá nhiều thời gian so với các bộ gõ hiện nay. Lợi ích thứ hai là có thể dùng ngay font chữ tiếng Anh, nên bớt được những thao tác rườm rà. Lợi ích thứ ba là dễ dàng thực hiện viết liền các từ kép phục vụ cho những ứng dụng thiết thực.
    Đúng là nếu chỉ nhằm mục tiêu ngắn gọn, gõ nhanh thì có thể dùng tốc ký hoăc viết tắt. Song những phương pháp này chỉ nên dùng trong một số trường hợp đặc biệt, chứ không dùng phổ biến được. Hơn nữa chữ mới còn có nhiều mục tiêu nữa như xóa bỏ dấu và viết liền từ kép để tạo thuận lợi cho nhiều ứng dụng thiết thực của tin học hiện nay và sau này.
    Về vấn đề thông dịch, tôi rât đồng ý với bác là máy móc không thể hoàn toàn thay thế được con người. Nhưng nếu chữ mới giúp nâng cao hiệu quả của máy, giúp máy dịch chính xác hơn, đỡ sai hơn thi cũng không nên bỏ qua.
    Về vấn đề sửa lỗi chính tả,bác nói rất đúng ý của đề án. Trong bộ nhớ của máy sẽ được lưu trữ những từ kép có nghĩa của tiếng Việt. Nếu ta viết sai chính tả một từ kép làm cho từ đó trở thành vô nghĩa thì máy sẽ tự động sửa lỗi chính tả cho ta để từ đó trở thành có nghĩa. Thí dụ ta viết nhầm từ kép "Tracon", trong bộ nhớ của máy không chứa từ kép vô nghĩa đó, mà chỉ chứa từ có nghĩa "Chacon" thôi. Máy sẽ tự sửa cho ta thành "Chacon" đúng chính tả và có nghĩa. Vấn đề là phải làm thế nào để máy biết đấy là từ kép ? Cách giải quyết đơn giản và dễ nhất là viết liền đối với những từ kép. Đối với những từ đơn, khi ta viết ra mà còn nghi ngờ không biết có đúng chính tả không, ta chỉ cần viết thêm một từ nữa để biến thành từ kép. Sau khi máy sửa xong ta xóa từ mới thêm vào đi. Thí dụ khi ta viết "Cha từ điển", ta nghi từ "Cha" sai chính tả, ta chỉ cần thêm vào từ "Hỏi" sau từ "Cha" thành từ kép "Chahỏi". Từ kép này vô nghĩa, máy sẽ tự sửa hộ ta thành "Trahỏi" đúng chính tả. Cuối cùng ta xóa từ "Hỏi" đi, ta sẽ viết đúng là "Tra từ điển".
    Bài góp ý của bác còn đề cập cách sử dụng chữ mới trong CNTT . Tôi tạm phác họa quy trình áp dụng chữ này vào CNTT để bác tham khảo:
    -Trước hết phải biên soạn môt phần mềm có thể chuyển đổi "chữ không dấu viết liền" với font tiếng Anh, sang "chữ có dấu viết rời" với font tiếng Việt Unicode. Phần mềm này được cài đặt sẵn đầu mỗi trang web để những ai cần đọc bằng chữ cũ có dấu thì click vào đấy và chữ có dấu sẽ hiển thị trên màn hình cho họ đọc. Còn nhưng ai thích đọc bằng chữ mới không dấu thì không cần làm gì cả, màn hình sẽ hiển thị chữ không dấu. Đó là những người chỉ có nhu cầu đọc các thông tin trên mạng.
    -Đối với những người cần làm việc trên máy có thể theo nhiều cách:
    +Khi sử dụng những tiện ích phải dùng đến " chữ không dấu viết liền" thì người đó bắt buộc phải dùng chữ đó.
    +Những ứng dụng khác thì tùy ý thích của từng người. Nếu thích chữ cũ vì quen dùng hơn thì ta cứ gõ theo kiểu cũ. Nếu thích dùng chữ mới để gõ được nhanh hơn thì ta gõ theo kiểu chữ mới, và màn hình sẽ hiển thị chữ mới. Hoặc nếu muốn gõ theo chữ mới mà màn hình lại hiển thị chữ cũ thì phải dùng phần mềm. Tóm lại việc sử dụng chữ mới rất linh hoạt.
    Tôi xin nói thêm bác cũng không cần băn khoăn về việc đề án này nhằm sửa đổi chữ Việt trong CNTT hay trong đời sống làm gì mà chỉ cần bàn xem đề án này có lợi hại gì cho CNTT, với điều kiện nó không làm ảnh hưởng gì đến tiếng Việt mà thôi.
    Chào thân ái !
    Được NgNinh sửa chữa / chuyển vào 08:23 ngày 13/06/2007
  10. pategan

    pategan Thành viên mới

    Tham gia ngày:
    03/04/2006
    Bài viết:
    1.394
    Đã được thích:
    0
    ui, phức tạp quá. Kiếm đâu ra người học và viết kiểu này để nhập dữ liệu cho bạn nhỉ:
    Nó thế này đấy ạh: (trích từ cái link của NgNinh)
    Bài 1:
    Chữ cũ: Sẽ ?chat? với người ngoài hành tinh.
    Đó là tuyên bố gần đây của các nhà khoa học thuộc viện nghiên cứu văn minh ngoài Trái Đất của Anh. Trưởng nhóm nghiên cứu, TS Seth Shostak, cho biết chỉ khoảng 15 năm nữa, từ năm 2020 ?" 2025, ?oChúng ta sẽ không đơn độc?. Ông cho biết hiện tại nhóm của mình đang xây dựng 350 ống nghe tầm xa để nghe các âm thanh ngoài hành tinh, Ông cũng khẳng định người ngoài hành tinh đã nghe được người Trái Đất.
    Chữ mới: Seek ?cats? voes ngyif ngwif hawftiw.
    Dos laf tylboos garfdae kead kacs nhafqwhocb thuqb vilbngilkies valmiw ngwif Traisdads kead Aw. Tryjdnhoms ngilkies, TS Seth Shostak, co biss cid qwgd 15 nav nyok, tiof nav 2020 ?" 2025, ?oCejsta seek qoz dordokb?. Oz co biss hilbtaib nhoms kead miwf dag xaezijb 350 ozsngee tahfxa ded ngee kacs ahthaw ngwif hawftiw. Oz kejk qazddiwb ngyif ngwif hawftiw dak ngee dyqb ngyif Traisdads.
    Bài 2:
    Chữ cũ:
    Đây Thôn Vĩ Dạ
    - Hàn Mặc Tử -
    Sao anh không về chơi thôn Vĩ ?
    Nhìn nắng hàng cau nắng mới lên
    Vườn ai mướt quá xanh như ngọc
    Lá trúc che ngang mặt chữ điền
    Gió theo lối gió, mây đường mây
    Dòng nước buồn thiu hoa bắp lay
    Thuyền ai đậu bến sông trăng đó
    Có chở trăng về kịp tối nay ?
    Mơ khách đường xa, khách đường xa
    Áo em trắng qua nhìn không ra
    Ở đây sương khói mờ nhân ảnh
    Ai biết tình ai có đậm đà ?
    Chữ mới: Dae Thol Vikzab
    - Hanf Makb Tiod -
    Sao aw qoz vef coe thol Vik ?
    Nhinf nazs hagf kau nazs moes len
    Vyrf ai myds kws xaw nhio ngocb
    Las treqs cee ngag masb ciok dilf
    Jos theo loys jos, mae dyjf mae
    Zogfnyqs burfthiu hwbafs lay
    Thylf ai daab bens soztraz dos
    Kos coud traz vef kipb toysnay ?
    Mou qax dyjfxa, qax dyjfxa
    Aos ev trazs kws nhinf qozra
    Ouddae syjqois mouf nhar-awd
    Ai biss tiwf ai kos dahbdaf ?
    Hà nội, ngày 12 tháng 02 năm 2006
    Nguyễn Ninh

Chia sẻ trang này