1. Tuyển Mod quản lý diễn đàn. Các thành viên xem chi tiết tại đây

Chữ Việt mới dùng cho công nghệ thông tin

Chủ đề trong 'Tiếng Việt' bởi NgNinh, 07/05/2007.

  1. 0 người đang xem box này (Thành viên: 0, Khách: 0)
  1. paddy8788

    paddy8788 Thành viên mới

    Tham gia ngày:
    10/07/2006
    Bài viết:
    52
    Đã được thích:
    0
    Em chưa có thời gian để nghiên cứu đề án của bác, nhưng em có đọc qua mấy lượt thảo luận trên diễn đàn này.
    Thứ nhất về khoản error-correction thì theo em học qua thì nó không chỉ dựa vào chỉ đơn giản là cách viết mà còn phụ thuộc vào khả năng sematic analysis của chương trình - tức phân tích ngữ nghĩa. Tiếng Anh cũng gặp rất nhiều rào cản này vì đặc thù của nó, và tiếng Việt thì em nghĩ còn có nhiều rào cản hơn, về mặt phiên âm và về mặt ngữ pháp nên quá trình này đòi hỏi các chuyên gia phải nghiên cứu thêm nữa.
    Thứ hai về khoản thực dụng thì em phải rate cho bác điểm rất thấp :|. Dù một ý tưởng có hay đến mấy, nhưng muốn được áp dụng vào cuộc sống và được người dùng chấp nhận thì đầu tiên là phải user-friendly đã. Bác cứ nhìn ví dụ Windows Vista ấy, dù tính năng nó hơn hẳn Windows XP nhưng người ta cứ quay lại dùng XP thôi, dù Microsoft nói gì cũng kệ. Bác không thể chỉ đơn giản là thuyết phục hay ép buộc người ta dùng được. Và nhìn cái bộ gõ của bác thì em thấy nó sẽ rất khó chịu, bởi kiểu phối hợp các chữ cái của nó rất kỳ lạ, không giống một ngôn ngữ tự nhiên nào cả. Bác có thể lập luận là học sẽ quen, nhưng mà bác không thể ép bấy nhiêu người dùng máy tính thay đổi được :-?. Và đang cần phổ cập CNTT, bác dùng thế này khác gì người nào ko học bộ chữ sẽ ko đọc được. Nhìn sang kiểu gõ VNI và Telex sẽ thấy, vì lý do lịch sử nên mỗi người có lựa chọn riêng, và chả ai thay đổi được là tiếng Việt có tới mấy bộ gõ.
    Thứ ba là em thấy bác đi lùi. Ngay cả các ngôn ngữ lập trình cũng đang cố gắng hướng gần với ngôn ngữ tự nhiên hơn, thì bác lại cố đưa một ngôn ngữ tự nhiên gần với máy, tức đi ngược thời đại rồi.
    Đấy chỉ là ý kiến của riêng em thôi. Em chả ngâm cứu cái xử lý ngôn ngữ lắm, và cũng chả giỏi tiếng Việt. Chỉ góp ý về con mắt của một người dùng thôi :D
  2. DilLaBen

    DilLaBen Thành viên mới

    Tham gia ngày:
    09/09/2004
    Bài viết:
    173
    Đã được thích:
    0
    Tôi thấy đề tài của bác cũng hay nhưng chỉ có điều áp dụng vào thực tế là chuyện khác. Bây giờ mà bắt mọi người học thêm một cách viết khác chắc là rất ít người đồng ý. Không có ngôn ngữ và chữ viết nào hoàn hảo cả. Để tài của bác muốn được áp dụng chắc phải chờ đến ***************** mới. Khi nào chính quyền bắt dùng thì mọi người mới phải theo.
    Trân trọng.
  3. Liv

    Liv Thành viên mới

    Tham gia ngày:
    15/04/2003
    Bài viết:
    398
    Đã được thích:
    0
    Tại hạ chưa có viết cái giới thiệu về cái "chữ viết" của tại hạ, nhưng đại khái là nó không có kế thừa cái gì từ chữ Quốc Ngữ cả. Tất nhiên có những điểm tương đồng vì cùng một nguồn gốc bảng chữ cái Roman mà chế ra.
    Các bằng hữu đọc chơi bài thơ nổi tiếng rồi nhận xét thử coi nó nhìn có giống cái ngôn ngữ gì không :D Tại hạ thật ra vẫn chưa ưng ý hẳn, đang muốn dùng diacritics để bỏ dấu cho xong...
    Dei thon Vizzahrs
    Xaur aarnj kong veh qai thon Viz
    Njihn narnc haahrng cour narnc mais len
    Vyhrn air myrd cwars saarnj njy ngorc
    Las trug qer ngaarng mart qyzdihrn
    Jos theur lois jos, mei dyhrng mei
    Zohrng nyrg buhrn thiu huar barb leir
    Thwihrn air dows bend xong trarng dors
    Cors qahz trarng veh cip tois neir?
    Ma kark dyhrng sar, kark dyhrng sar
    Aurs erm trarnc cwars njihn kong rar
    Ahz dei xyrng koirs mah njan ahrnq
    Air bird tihnj air cors dahmbdahr?
    Haahrnmarc-tyhz
    Được Liv sửa chữa / chuyển vào 18:45 ngày 16/03/2009
  4. NgNinh

    NgNinh Thành viên quen thuộc

    Tham gia ngày:
    04/05/2007
    Bài viết:
    107
    Đã được thích:
    0

    Re: Bạn Paddy8788,
    Bạn có đề cập đến semantíc analysis ( trong tin hoc còn gọi là semantic web = trang web có ngữ nghĩa ). Đây là một lĩnh vực khá mới mẻ của CNTT thế giới, còn đang trên bước đường nghiên cứu, và càng mới lạ hơn với Việt Nam ta. Tuy nhiên semantics không thể tách rời style ( cách viết ). Cùng với nhiều yếu tố khác, style hỗ trợ semantics, làm nổi bật ngữ nghĩa lên rất nhiều. Vì vậy theo mình cải tiến chữ viiết là rất cần thiết để nâng cao hiệu quả của semantic web trong tương lai.
    Thân chào !
  5. paddy8788

    paddy8788 Thành viên mới

    Tham gia ngày:
    10/07/2006
    Bài viết:
    52
    Đã được thích:
    0
    Đúng là học một số thứ tiếng khác thì thấy tiếng Việt mình chưa chặt chẽ về mặt ngữ âm lẫn ngữ pháp thật, và việc cần phải cải tiến tiếng Việt là cần thiết. Em không phản đối mục đích của bác, nhưng em không đồng ý cách bác làm thôi.
    Thực ra ngay như tiếng Anh người ta cũng phải chấp nhận một điều là không ai điều khiển được sự xuất hiện của những từ mới và mất dần đi của những từ cũ. Tự thân ngôn ngữ nó cũng tiến hoá rồi, nên em thấy việc bác xoay chuyển một cách hoàn toàn trái ngược thế sẽ không mang tính thực tiễn chút nào cả.
    Với lại em cũng đã nói, ngay cả ngôn ngữ lập trình người ta cũng cố làm cho nó gần với ngôn ngữ tự nhiên, cứ chưa có ai cố làm ngôn ngữ tự nhiên gần với ngôn ngữ máy cả... Đấy là lý do vì sao em thấy việc bác làm đang đi ngược với xu hướng thôi :D
    Cá nhân em nghĩ, bác có thể dành công sức để phát triển bộ nhận dạng tiếng Việt về mặt ngữ nghĩa, thay vì như bây giờ là cố gắng thay đổi tiếng Việt để cho bộ nhận dạng...
  6. Liv

    Liv Thành viên mới

    Tham gia ngày:
    15/04/2003
    Bài viết:
    398
    Đã được thích:
    0
    Để tại hạ đi từ dưới lên nhé:
    Các hạ nói chí phải, giá như Ninh tiền bối nói thẳng ra là "tui thấy cái này vui nè, tui làm thử đem lên cho các bạn coi chơi, ai muốn xài thì xài, không thì thôi" thì sẽ không có vấn đề gì. Chỉ đáng tiếc là Ninh tiền bối lại muốn cưỡng ép nó trở thành cái gì hữu ích thực dụng, nên mới là vấn đề...
    Còn về vụ ngôn ngữ lập trình thì các hạ nói sai rồi, ngôn ngữ lập trình khác xa ngôn ngữ tự nhiên, và không có cố gắng nào đáng kể để biến ngôn ngữ lập trình trở nên gần gũi hơn với ngôn ngữ tự nhiên cả: ví dụ trong (đa phần) các ngôn ngữ lập trình hoàn toàn không có thanh điệu, trọng âm, chẳng có từ đồng âm, đồng nghĩa, biến dị chính tả, không có thì cũng chẳng có cách, không có chơi chữ, nói lái, điệp vần, vân vân... Và hiển nhiên là không có ai thật sự muốn bổ sung những yếu tố "tự nhiên" đó vào trong ngôn ngữ lập trình một cách nghiêm túc cả.
    Về tiếng Anh mà các hạ nói "ngay như tiếng Anh người ta cũng phải" là cố tình mập mờ. Tiếng Anh và chữ viết của nó (orthography) là một trong những hệ thống âm vị loạn nhất châu Âu, các thứ tiếng khác như tiếng Đức, Ý, Tây Ban Nha, Bồ Đào Nha, Hà Lan, Hungary, Ba Lan, Czech, và thậm chí là tiếng Pháp, đều là những ngôn ngữ tương đối quy củ về mặt orthography gấp trăm lần tiếng Anh, sao các hạ không lấy một trong những tiếng đó ra để dẫn chứng? Từ lâu đã có không ít đề nghị cải cách orthography cho tiếng Anh rồi, nhưng vấn đề phân bố địa lý của ngôn ngữ này (trải khắp thế giới, dưới nhiều chính phủ khác nhau) làm cho chuyện này quá khó khăn dường như không thể làm nổi...
  7. hinattvn

    hinattvn Thành viên mới

    Tham gia ngày:
    17/07/2008
    Bài viết:
    69
    Đã được thích:
    0
    Em đoán thử, có gì bác chỉnh lại nhé!
    - Phụ âm đầu: C/K/Q => C, Kh => K, X => S, X => S, Ch => Q, D =>Z, Gi/G => J, Nh => Nj, Đ => D.
    - Âm đệm: hầu hết chuyển qua W, một số còn dùng U. (đi kèm với nguyên âm sẽ phân biệt được)
    - Dấu: nếu không có (phụ) âm cuối thì: huyền => h, sắc => s, nặng => hs, ngã => z, hỏi => hz
    - Phụ âm cuối:
    T+dấu sắc => D, T+dấu nặng => T
    P+dấu sắc => B, P+dấu nặng => B
    C+dấu sắc => G, C+dấu nặng => C
    Ch+dấu sắc => K, Ch+dấu nặng =>Nq
    Các âm cuối khác N/M/Ng/Nh khi có dấu ngang, huyền, ngã thì dùng dấu và âm cuối tương ứng (trừ Nh=>Nj); khi có dấu sắc, nặng, hỏi thì thành ....??? (nhiều quá em chịu!)
    (nguyên) âm cuối I/Y và U/O chuyển thành I và U hết (đi kèm với nguyên âm sẽ phân biệt được)
    - Nguyên âm và âm có âm cuối là nguyên âm:
    Nguyên âm đơn/đôi:
    IÊ/IA => Ir, Ê => E, E => Er, Ư => Y, ƯƠ/ƯA => Yr, Ơ => A, A => Ar, UÔ/UA => Ur, Ô => O, O => Or.
    Nguyên âm trong vần có âm cuối: tương tự, trừ một số trường hợp đặc biệt như:
    Ă => Ar, A(Ar) => Aar, Âu => Ow, Au => Our, Ây => Ei, Ay => air,...
    Bác Liv chuyển đổi cũng chóng mặt thật!
  8. NgNinh

    NgNinh Thành viên quen thuộc

    Tham gia ngày:
    04/05/2007
    Bài viết:
    107
    Đã được thích:
    0
    Để thấy rõ hơn " chữ Việt có dấu " đã gây trở ngại cho việc sử dụng các tiện ích mới của CNTT như thế nào , mình gợi ý các bạn có thể tìm kiêm thông tin về vấn đề này trên google.com với các tiêu đề sau:
    - Khó khăn tiếng Việt trong Windows Vista.
    - Khó khăn tiếng Việt trong Linux.
    - Khó khăn tiếng Việt trong MySQL.
    Thân chào !
  9. lehongphu

    lehongphu Thành viên rất tích cực

    Tham gia ngày:
    01/02/2002
    Bài viết:
    1.581
    Đã được thích:
    0
    Bạn thử giới thiệu một vài trong số "các tiện ích mới của CNTT " và nói xem "chữ Việt có dấu" nó "đã gây trở ngại cho việc sử dụng các tiện ích mới của CNTT" như thế nào.
    Tôi đã thử search Google với "Khó khăn tiếng Việt trong Windows Vista" như bạn gợi ý nhưng toàn thấy các kết quả của "người sử dụng Windows Vista gặp khó khăn khi gõ tiếng Việt có dấu...." mà cái việc gõ tiếng Việt có dấu trong Windows Vista đó người ta đã xử lý được xong từ lâu rồi. Tôi vẫn gõ tiếng Việt có dấu trong Windows Vista (Ultimate, SP1 / SP2) bình thường với Unikey có gặp khó khăn gì đâu, sau này thử cả trên Windows 7 + Office 2010 cũng vẫn gõ tốt, không có gì đáng phàn nàn.
    Linux thì chưa thử nhưng cũng nói luôn để bạn biết là theo nhận xét cá nhân thì ở VN, số người sử dụng Linux không nhiều, số lượng người dùng Linux chắc chắn thua xa số người quen sử dụng Windows.
    MySQL.? Bạn thử hỏi 100 người đang sử dụng PC / Laptop xem có được mấy người biết / quan tâm đến MySQL ?
  10. Liv

    Liv Thành viên mới

    Tham gia ngày:
    15/04/2003
    Bài viết:
    398
    Đã được thích:
    0
    OMG không biết bạn dùng Window có bản quyền hay lậu thế nhỉ?
    Nếu luận điểm của bạn là số người dùng Linux quá ít không đáng kể, thì coi như là một lời khen đối với bác Ninh, chẳng khác gì nói bác ấy đã biết "đi tắt", "đón đầu". Vì thật sự tương lai sẽ hoặc là phải trả tiền cho Windows, hoặc sẽ phải quay sang Linux thôi. :D
    Ừ nhưng mà thật ra Linux cũng có hỗ trợ tiếng Việt cho đánh văn bản này nọ. Chỉ có những bản Linux cổ xưa hay Unix mới có vấn đề, nhưng dân mà đã dùng đến Unix thì chẳng cần phải dùng đến tiếng Việt nữa...

Chia sẻ trang này