1. Tuyển Mod quản lý diễn đàn. Các thành viên xem chi tiết tại đây

Chữ Việt mới dùng cho công nghệ thông tin

Chủ đề trong 'Tiếng Việt' bởi NgNinh, 07/05/2007.

  1. 1 người đang xem box này (Thành viên: 0, Khách: 1)
  1. NgNinh

    NgNinh Thành viên quen thuộc

    Tham gia ngày:
    04/05/2007
    Bài viết:
    107
    Đã được thích:
    0
    Thân gửi bạn Chitto,
    Bạn cũng biết muốn máy tinh làm việc phải mã hóa các dữ liêu để đưa vào máy tính và lập trình để máy xử lý. Bộ gõ Telex và một số bộ gõ khác dùng để mã hóa chữ Việt có dấu. Nếu không có các bộ gõ này thì với các máy tính hiện nay không thể dùng để đánh máy chữ có dấu được. Hiện nay có mấy bộ gõ thông dụng, nhưng thường rất dài
    Chữ mới (Gọi là chữ mới để phân biệt với chữ cũ và với các bộ gõ khác) chẳng qua cũng chỉ là một "bộ gõ mới" được cải tiến dùng để mã hóa chữ có dấu giống như các bộ gõ hiện nay, chỉ khác là ngắn gọn hơn và dễ viết liền hơn, giúp thực hiện một số tiện ích có hiệu quả hơn mà thôi.
    Tôi công nhận chữ mới còn phức tạp và khó nhớ. Song khả năng tôi không thể làm hơn được.Mong các bạn thông cảm!
    Còn nếu trong tương lai ta có thể nghiên cứu để chế taọ ra được những máy tính không cần bộ gõ mà vẫn đánh máy trực tiếp ra chữ có dấu thì rất đáng hoan nghênh và vui mừng cho CNTT của nước nhà.
    Chào quyết tiến!
    Được NgNinh sửa chữa / chuyển vào 15:59 ngày 16/07/2007
  2. levant57

    levant57 Thành viên mới

    Tham gia ngày:
    17/10/2003
    Bài viết:
    1.520
    Đã được thích:
    1
    Tôi vẫn đang hiểu rằng bạn không dùng nó để thay thế chữ quốc ngữ. Nên bạn không phải băn khoăn về điều đó (xin lỗi, giả sử bạn có ý định đó có lẽ tôi...ốm mất)
    Bạn đã làm một việc rất công phu nhưng điều đem lại thì lại là...VÔ ÍCH, Ít nhất là cho tới thời điểm bây giờ. Chưa thấy có ai ở trong diễn đàn này đồng tình với bạn. Tôi rất miễn cưỡng khi nghĩ về tương lai của cái chữ viết của bạn.
    Cuối cùng, bạn đã muốn người ta thực hiện một việc khó hơn trong khi chẳng phải tội gì lại phải làm như thế.
    Công nghệ thông tin là cái gì đó lớn hơn việc xử lý ngôn ngữ qua bàn phím. Bạn gán cho sứ mệnh của việc cải tiến chữ gõ liên quan tới sự phát triển của công nghệ thông tin thì tôi phân vân quá. Theo tôi CNTT đâu có phụ thuộc vào ngôn ngữ thông thường! Không có chữ viết của ta thì CNTT vẫn phát triển như vũ bão. Những cái về CNTT mà VN có chỉ là sự kéo theo một cơn cuồng phong ở ngoài kia.
  3. pategan

    pategan Thành viên mới

    Tham gia ngày:
    03/04/2006
    Bài viết:
    1.394
    Đã được thích:
    0
    Úh giời , bác mà nghe thầy em kể chuyện ngày xưa (196x) học máy tính, để nó hiểu thầy em phải nạp dữ liệu bằng các bìa đục lỗ cơ, Ngạc nhiên hơn nhiều., hi hi cái chữ không dấu viết liền này ăn thua gì. Cái công trình này của bác NgNinh lạc hậu mất tí thời gian thôi mà.
    Bây giờ dùng cái touch screen thích lắm, em viết cực xấu ngoằn ngèo vài nét máy tính nó hiểu ngay ra định viết chữ gì, Ngạc nhiên gấp bội, bác cứ thử mấy cái PDA xem
    Xem qua cái Đề án này thực ra không có gì mới. Trong quân đội, sử dụng hệ thống móoc-xơ thì mã hoá viết tắt tiết kiệm rất nhiều thời gõ mã và truyền tin . Nhưng tụi em dùng kết hợp chữ và số (ví dụ d9=đường), và cũng có bảng mã qui định viết tắt, thay đổi hàng ngày theo quy chế bảo mật.
    Việc áp dụng chữ này cho CNTT là không khả thi và chẳng giúp được gì cả theo ý kiến cá nhân:
    1. Khi thay đổi chữ viết, sử dụng bàn phím hiện tại không hiệu quả, một số phím dùng quá nhiều, một số phím cực ít dùng.
    2. Lỗi chính tả sinh ra do ngưòi nhập dữ liệu thì chữ nào cũng như nhau chẳng hạn chế được bao giờ.
    3. Các phần mềm biên dịch và phiên dịch không làm việc như các ví dụ tác giả tưởng tượng.
    4. Nếu đưa chữ này vào sử dụng sẽ kéo theo một khối lượng lớn công việc như biên soạn từ điển mới cho máy tính có thể hiểu tra cứu đc vì nếu không có cơ sở dữ liệu này, phải chạy cái phần mềm chuyển đổi chữ mới về chữ cũ và dùng từ điển kiểu cũ tăng, thêm thời gian xử lý, tăng sai số tích luỹ.
    5. Trong CNTT lưu trữ và sắp xếp là công việc chủ yếu. Nếu dùng chữ mới, kho tư liệu lại phức tạp để đánh lại index (ví dụ tên người lúc này sẽ lại không theo thứ tự như trước nữa..) hoặc lại phải thêm cột index mới
    Bác tác giả nên nghiên cứu dùng vào việc khác thì tốt hơn.

    Được pategan sửa chữa / chuyển vào 22:39 ngày 17/07/2007
  4. hoa_khanh

    hoa_khanh Thành viên gắn bó với ttvnol.com

    Tham gia ngày:
    30/11/2003
    Bài viết:
    7.337
    Đã được thích:
    6.783
    Su*?a ba''c mấy chỗ:
    1. Dùng hay không dùng 1 số phím thì ảnh hưởng gì đến chất lượng của đề án hả bác. Giả sử nó tiện lợi hơn cho người dùng thì cứ dùng thôi. Đâu có ai bắt một ngôn ngữ / cách đánh nào phải dùng cả bàn phím với cùng tần số đâu?
    2. Chỗ này bác nhầm. Chỗ này tôi cũng đã thắc mắc, và tôi đồng ý với bác NgN là viết liền nhau giúp việc sửa lỗi chính tả. Tôi nói cái này hơi "sâu" một chút, trong tin học có khái niệm error correction, trong đó bằng cách viết / mã hóa thông tin theo 1 cách đặc biệt, máy móc có thể sửa lỗi trong thông tin. Người dùng có thể vẫn đánh sai, nhưng thông tin mã hóa với error correction code có độ tin cậy cao hơn.
    3. Tôi cũng không rõ bác NgN đưa ví dụ ra sao nên không dám nói thêm.
    4. 5. Cái này giống câu 1 ở trên. Tôi nghĩ đánh giá về đề án này, các tiêu chuẩn chính phải là: có tiện lợi không? Có lợi ích gì về mặt nhập + lưu + gửi thông tin không? Còn tiêu chuẩn về mặt kỹ thuật (phải viết phần mềm, viết từ điển) chỉ nên coi là thứ yếu.
    Nói chung, nếu đề án của bác NgN có lợi cho người dùng thì tự khắc các vấn đê vè kỹ thuật sẽ được giải quyết (có cầu thì sẽ có cung). Còn nếu nó không có lợi thì cho dù có bắt người ta cũng không thể làm theo.
    Nhìn chung, tôi thấy phần lớn các bác ở đây chỉ nhìn vào đề nghị của bác NgN từ khía cạnh ngôn ngữ, cho rằng bác ấy muốn "làm méo" tiếng Việt để phục vụ cho cái máy tính. Tôi thì tôi nghĩ đó cũng là một hướng đi, chỉ có điều như tôi nói là muộn mất 10 năm, lúc đó trong hòan cảnh điều kiện kỹ thuật chưa có, phải có một cách gì đấy để đưa tiếng Việt vào máy, chứ không chẳng lẽ lại hy sinh luôn tiếng Việt? Còn đến thời điểm này, những lựa chọn khác đã có, đề nghị của bác lại tương đối khó học và khó dùng (mặc dù tôi cũng công nhận là nó cũng có chỗ hay chứ không phải tòan là dở), thành ra nó không được khả thi cho lắm. Vậy thôi.
  5. pategan

    pategan Thành viên mới

    Tham gia ngày:
    03/04/2006
    Bài viết:
    1.394
    Đã được thích:
    0
    Em chẳng quan niệm về chữ nghĩa hay phản đối cải tiến chữ Việt gì cả. Như em đã viết ở bài trên, và ý kiến của nhiều bác tham gia thực tế chữ viết đã không còn là cản trở của CNTT rồi.
    Các lý do em nêu ra là nhằm làm rõ hơn bất lợi của đề án trong CNTT hiện tại. Phát triển CNTT nên dựa trên sự kế thừa.
    1. Về bàn phím, cách bố trí phím là vấn đề đưọc chú ý rất nhiều trong CNTT vì nó là công cụ chính giao tiếp người và máy. Thiết kế vị trí các phím do tần suất sử dụng của con người, các yếu tố sinh học (kết cấu bàn tay..) mà ra. Khi sử dụng ngôn ngữ khác nhau người ta cũng bố trí lại các phím cho phù hợp : các bác sử dụng bàn phím tiếng Đức, Nhật sẽ thấy rõ hiệu quả điều này.
    Trong đề án có nói là để nhanh hơn do rút gọn hơn cách gõ dùng bàn phím thông thường chưa xét đến khía cạnh này.
    2. Với lối chính tả thì em quan tâm tới lỗi do con người sinh ra nhiều hơn. Vì đối với CNTT thì chữ viết cũng chỉ mã hoá thành chuỗi (string) mà thôi và xử lý trên string đó, viết liền hay rời chỉ có ý nghĩa với con người thôi. Và việc xử lý chuỗi do máy tính thực hiện với trí thông minh nhân tạo do ta cài đặt chính là cái error correction như bác nói .
    3.
    Ai làm CNTT về từ điển hay dịch thuật sẽ thấy máy tính làm việc theo thuật toán trên chuỗi ký tự và trả kết quả ra sao. Không hề như ví dụ minh hoạ.
    4.Còn tiêu chuẩn về mặt kỹ thuật (phải viết phần mềm, viết từ điển) không thể coi là thứ yếu được vì CNTT mang tính kế thừa rất cao, nếu tận dụng được tài nguyên có sẵn thì sẽ tăng tốc độ phát triển, nếu không thì khi áp dụng nó chính là sự kìm hãm. Đó là cái mà những người làm CNTT luôn để tâm tới khi phát triển các sản phẩm của mình.
    Được pategan sửa chữa / chuyển vào 13:46 ngày 20/07/2007
  6. NgNinh

    NgNinh Thành viên quen thuộc

    Tham gia ngày:
    04/05/2007
    Bài viết:
    107
    Đã được thích:
    0
    Các bạn thân mến,
    Vừa qua tôi mắc một số công việc riêng nên không lên diễn đàn trao đổi với các bạn được. Mặt khác tôi cũng muốn chờ các bạn góp nhiều ý kiến một chút rồi phát biểu một thể.
    Nói chung các bạn có vẻ không đồng tình với đề án này! Trong khi ở các diễn đàn khác có một số bạn ủng hộ đề án này. Tôi chỉ nói vậy thôi chứ ủng hộ hay không là quyền của mỗi người. Dù sao tôi cũng mạnh dạn trao đổi một số ý kiến để chúng ta thảo luận thêm.
    Tôi đồng ý với bạn Pategan là các phần mềm phiên dịch và sửa lỗi chinh tả làm việc theo nguyên tắc chuỗi (String), trong trường hợp này là chuỗi ký tự. Nhưng việc viết liền các từ kép sẽ giúp làm tăng hiệu quả của phương pháp này. Đó là căn cứ vào đặc điểm của tiếng Việt có nhiều từ đồng âm dị nghĩa.
    Ngôn ngữ của nhiều nước có tính đa âm tiết nên những âm tiết trong một từ đa âm được viết liền nhau,do đó những từ có nghĩa khác nhau đều được viết khác nhau. Họ cũng có những từ đơn đồng âm, nhưng nếu khác nghĩa sẽ được viết khác nhau.
    Chẳng hạn như trong tiếng Anh những từ đơn đồng âm dị nghĩa viết rất khác nhau:
    son (con trai); sun (mặt trời)
    to (tới); two (hai); too (cũng, quá)
    by (bởi); bye (tạm biệt); buy (mua)
    Vì vậy xử lý chuỗi của tiếng Anh rất đơn giản. Chữ nào viết sai chính tả là máy phát hiện ra ngay và tự động sửa lỗi cho từ đó, hoặc báo cho người viết biết bằng phát ra âm thanh "pip" hoặc ánh sáng mầu vàng.
    Đối với tiếng Việt, từ đồng âm khác nghĩa viết hoàn toàn giống nhau. Thí dụ:Từ "ba" có thể hiểu là: cha,số 3,sóng(trong "phong ba").v.v.v. nên dễ bị hiểu lầm. Nếu viết liền các từ kép thì khả năng phân biệt các từ của máy sẽ được tăng lên nhiều, do đó việc xử lý chuỗi sẽ dễ dàng hơn nhiều.
    Có một số từ mà người nói ngọng khó phân biệt về chính tả,nhưng khi viết liền và viết rời sẽ có nghĩa khác nhau và chính tả cũng khác nhau giúp người nói ngọng phân biệt được ngay. Và máy cũng nhận biết dễ dàng hơn,do đó việc lâp trình cũng đơn giản hơn. Thí dụ:
    trânchâu khác chân trâu.
    saosa khác sao xa.
    chứngkiến khác trứng kiến.
    trẻnhỏ khác chẻ nhỏ
    trớtrêu khác chớ trêu
    trữtình khác chữ tình.
    Trong tiếng Viêt có rất nhiều từ như trường hợp trên đây.
    Có nhiều trường hợp nếu viết rời từng từ đơn âm, máy rất khó nhận biết. Chẳng hạn khi viết câu "Hắt hơi nóng đầu" có thể hiều theo hai nghĩa:
    hắthơi nóngđầu (cảm sốt)
    Hắt hơinóng đầu (hắt hơi nóng đầu tiên)
    Ta cũng biết rằng tiếng Trung quốc viết bằng chữ tượng hình thì rời từng đơn âm vì các từ đồng âm khác nghĩa được viết khác nhau trong loại chữ này. Nhưng khi latinh hóa (Chữ pinyin) cũng viết liền các từ kép vì tiếng Trung quốc cũng có nhiều từ đồng âm rất dễ bị hiểu nhầm như tiếng Việt. Viết liền từ kép là xu hướng tất yếu của chữ Việt, chỉ có điều nên chuyển sang viết liền như thế nào cho tiện và tốt nhất. Theo tôi chữ có quá nhiều dấu như chữ VIệt hiện nay rất khó viết liền những từ kép. Các bạn thử nghĩ xem khi viết liền từ "kiếntrúcsưtrưởng" sau khi viết xong ta lại phải đưa tay ngược trở lại để đánh 7 cái dấu có mất thời gian không?
    Và nếu đánh máy trên máy tính thì mất quá nhiều thao tác, tức quá nhiều thời gian, nhất là khi phải soạn thảo một văn bản lẫn lộn tiếng Việt và tiếng Anh.
    Hôm nay tôi chỉ xin tâp trung phát biểu về một vấn đề " viết liền từ kép". Mong các bạn góp ý thêm.
    Để các bạn dễ dàng đọc đề án, tôi xin cung cấp thêm một số đường Link sau:
    http://cuasotinhoc.vn/index.php?act=attach&type=post&id=9567
    hoặc
    http://www.adminviet.net/forum/attachment.php?attachmentid=118&d=1189999556
    TB:
    Tôi giới thiệu với các bạn một diễn đàn theo đường Link sau đây:
    http://vninformatics.com/forum/box/40/Linh-ta-linh-tinh.html?zone=6&
    -> topic: Mọi người hãy ký vào đây để MySQL support collation cho tiếng Việt.
    để các bạn thấy tại sao chúng ta phải xin người ta hỗ trợ tiếng Việt trong phần mềm của họ, trong khi ta chỉ cần thay đổi một chút cách viết chữ trong CNTT là có thể sử dụng phần mềm đó một cách hiệu quả theo ý muốn!!!???
    Được NgNinh sửa chữa / chuyển vào 09:50 ngày 20/09/2007
  7. lehongphu

    lehongphu Thành viên rất tích cực

    Tham gia ngày:
    01/02/2002
    Bài viết:
    1.581
    Đã được thích:
    0
    Xin được hỏi một chút:
    - Cụ thể hơn một chút thì cái ?omột chút? nói trên của bạn bằng bao vậy bạn? hay chính là ?o?omột chút? = .....cái đề án >10 năm của tôi nói trên??
    - Bạn nghĩ sao khi để xử lý 1 việc là: khâu lại 1 đoạn chỉ bị đứt ở nách áo 1 bệnh nhân đang nằm trên giường bệnh thì người ta đặt vấn đềđề xuất giải pháp như sau: ?oDo bị vướng cái tay của người này (cái tay của người này gây khó khăn cho việc ?othi công? của tôi), để có thể thực hiện việc đó được nhanh hơn, ta nên chặt bỏ cánh tay bệnh nhân, khâu lại cái đoạn bị đứt chỉ đó, sau đó ráp lại tay cho bệnh nhân sau? !

    - Theo ý bạn thì liệu 1 người đang ?~nghi từ "Cha" sai chính tả?T kia có thể, thay vì định viết "Cha từ điển" như trong thí dụ trên, người ta lại định viết câu: ?oCha hỏi con lần cuối: con có chịu lấy nó hay không?? có làm động tác check như nói trên hay không? Và kết quả như thế nào?
    Được lehongphu sửa chữa / chuyển vào 01:18 ngày 19/09/2007
  8. Chitto

    Chitto Thành viên rất tích cực

    Tham gia ngày:
    23/01/2002
    Bài viết:
    5.198
    Đã được thích:
    13
    Vẫn luôn là Luận điểm : Thay đổi Con Người để cho Cái Máy được chạy dễ hơn !!!
    Vậy là Con Người sẽ phải thay đổi thói quen, để cho Cái Máy nó được chạy theo thói quen của nó.
    Hàng triệu người Việt đang dùng và gõ tiếng Việt sẽ thay đổi sang cách gõ liền,
    để cho vừa lòng Một số Người Lập Trình đỡ phải nghĩ việc xử lý cho từ không liền.
    Hoan hô, mời tiếp tục phát triển ý kiến.
    Được chitto sửa chữa / chuyển vào 23:05 ngày 19/09/2007
  9. Chitto

    Chitto Thành viên rất tích cực

    Tham gia ngày:
    23/01/2002
    Bài viết:
    5.198
    Đã được thích:
    13
    Cũng mong bạn làm ơn đừng đưa những cái link quá dài vào trong
    bài viết, nó làm cho trang forum bị xô lệch đi. Máy của bạn có thể có
    màn hình rộng không sao, nhưng làm ơn nghĩ đến những người
    dùng máy tính mà màn hình không đủ, cái link của bạn sẽ kéo lệch mắt người ta đi.
    Tôi phải viết bài này và xuống dòng liên tục để đảm bảo bài viết không
    bị cái link của bạn nó kéo ra dài ngoằng.
  10. NgNinh

    NgNinh Thành viên quen thuộc

    Tham gia ngày:
    04/05/2007
    Bài viết:
    107
    Đã được thích:
    0
    Thân gửi bác Chitto,
    Mấy lần định trao đổi với bác một vài ý kiến, nhưng lại phân vân vì e ngại lạc sang đề tài "triết học" vượt ra khỏi phạm vi của diễn đàn này. Sau tôi nghĩ cũng nên thẳng thắn trình bày quan điểm của mình để đi đến thống nhất ý kiến.
    Chắc bác cũng biết không có gì là bất biến cả, kể cả vũ trụ và con người...Loài người ngày càng tạo nên nhiều thành tựu khoa học làm thay đổi cuộc sống của mình, nhưng xã hội thay đổi cũng buộc con người phải thay đổi cách sống, cách làm việc phù hợp với sự phát triển của nền văn minh. Ta hãy so sánh con người cổ đại ăn lông ở lỗ ngồi trong hang đá trước đống lửa với người hiện đại ngồi trước màn hình máy tính trong phòng có máy điều hòa nhiệt độ thì thấy khác nhau xa lắm.
    Con người còn phải thay đổi theo thời đại, chứ nói chi đến chữ viết. Chữ viết chẳng qua chỉ là sản phẩm do con người tạo ra, thì con người có thể giữ nó, thay đổi nó, thậm chí bỏ nó đi nếu nó không phục vụ cho lợi ích thiết thực của mình. Sự nhường chỗ của chữ Nho và chữ Nôm cho chữ Quốc ngữ ở nước ta đã minh chứng điều
    này. Hai thứ chữ trên chỉ còn tác dụng trong một phạm vi hẹp của công việc nghiên cứu, chứ không dùng rộng rãi nữa.
    Mặt khác, ta không nên lẫn lộn chữ viết với con người, chữ viết cũng chỉ là một phương tiện để phục vụ lợi ích của con người. Tránh "lấy phương tiện làm cứu cánh". Máy móc cũng là phương tiện phục vụ con người. Vậy nên thay đổi máy móc hay thay đổi chữ viết, miễn là đem lại lợi ích cho con người đều đáng làm lắm thay! Thay đổi máy móc hay thay đổi chữ viết ta đều phải học mới làm được. Ta nên suy xét đằng nào lợi hơn thì làm. Theo tôi nên làm song song cả hai để bổ trợ cho nhau thì lợi hơn cả.
    Còn thói quen! Thói quen ư? Thật đáng sợ! Nhưng có thói quen tốt, có thói quen trì trệ. Bác nông dân quen canh tác manh mún với con trâu đi trước cái cày theo sau, lại yêu cầu phải sản xuất máy cày giống con trâu của bác để phục vụ cho thói quen của bác. Bác Chitto thấy có buồn cười không? (Nói vui thôi bác đừng giận nhé!)
    Nhận xét một việc làm, theo tôi nên xuất phát từ thực tiễn, cân nhắc xem việc làm ấy có lợi gì, có hại gì cụ thể trong thực tế. Nên xét cả lợi ích nhiều mặt, trứớc mắt và lâu dài...Không nên xuất phát từ một số triết lý làm tiên đề, vì "lý thuyết đều màu xám,nhưng cây đời mãi mãi xanh tươi", phải không bác?
    Tất cả các nhà ngôn ngữ học Viêt Nam và nước ngoài đều có chung một quan điểm là chữ Việt hiện nay có nhiều chỗ bất hợp lý, nhiều nhược điểm, gây nhiều trở ngại nhất là đối với CNTT hiên nay và sau này. Vậy nên cải tiến chữ viết dùng cho công nghệ thông tin theo tôi là điều cần thiết nên làm. Ý kiến của bác Chitto thế nào xin cho biết.
    Chào thân ái!
    Được NgNinh sửa chữa / chuyển vào 18:16 ngày 21/09/2007

Chia sẻ trang này