1. Tuyển Mod quản lý diễn đàn. Các thành viên xem chi tiết tại đây

Mục lục box Tiếng Việt-Từ điển tra cứu trực tuyến-Tuyển tập các bài viết(SƯU TẦM) về Tiếng Việt.

Chủ đề trong 'Tiếng Việt' bởi home_nguoikechuyen, 24/06/2003.

  1. 1 người đang xem box này (Thành viên: 0, Khách: 1)
  1. minh_le

    minh_le Thành viên quen thuộc

    Tham gia ngày:
    15/12/2002
    Bài viết:
    780
    Đã được thích:
    0
    Topic này hay lắm, mỗi tội chưa có thời gian để post lên thôi
    tôi thấy thể loại này nhiều lắm ,rải rác khắp nơi, báo nào cũng đăng 1 đến 2 bài ,nhất là cái vụ cải cách sách lớp 1 ấy, hầu như ngày nào mà chả nhắc đến lại còn thêm mắm muối vào nữa,thành thử tiếng việt vốn đã phong phú rồi lại rắc rối thêm mà thôi,hẹn mấy hôm nữa post nhá

    9399
    Welcome to Box Quảng Trị.. Click here,please!
  2. minh_le

    minh_le Thành viên quen thuộc

    Tham gia ngày:
    15/12/2002
    Bài viết:
    780
    Đã được thích:
    0
  3. minh_le

    minh_le Thành viên quen thuộc

    Tham gia ngày:
    15/12/2002
    Bài viết:
    780
    Đã được thích:
    0
  4. minh_le

    minh_le Thành viên quen thuộc

    Tham gia ngày:
    15/12/2002
    Bài viết:
    780
    Đã được thích:
    0
    Giảng dạy chương trình tiểu học mới:
    Cần nhất sự sáng tạo



    Lần đầu tiên Sở Giáo dục và Đào tạo TP Hồ Chí Minh phát động phong trào "chọn lựa giáo viên có phương pháp giảng dạy chương trình tiểu học mới tốt nhất" qua từng cấp. Những người tham gia đều có chung kết luận: đổi mới phương pháp giảng dạy chương trình tiểu học mới cần nhất vẫn là sự sáng tạo.
    Tiết học sinh động
    Tiết học tạo ra một không khí sôi nổi ngay từ phút đầu tiên khi cô giáo bắt nhịp cho cả lớp hát bài Bác đưa thư: "Kính coong, kính coong, bác đưa thư đang đến nhà em...". Phần chính tiết học cũng thu hút sự chú ý của học sinh (HS) ngay từ khâu đầu tiên - khâu trả bài. Thay cho việc gọi tên HS lên bảng cầm sách đọc thì bốn tấm bìa cứng có in sẵn một đoạn văn được chia cho bốn tổ với yêu cầu: "tìm từ thích hợp điền vào chỗ trống". Các mái đầu chụm lại, bàn tán, xôn xao...
    Phần trả bài diễn ra khá nhanh chóng, giáo viên (GV) dẫn dắt vào bài mới: "Tiết học trước, các con đã học bài Bác đưa thư, thư của bố dặn dò Minh phải ngoan ngoãn, lễ phép, giúp mẹ chăm sóc em bé... Hôm nay chúng ta sẽ học bài Làm anh xem Minh chăm sóc em bé như thế nào nha các con". Cả lớp chăm chú nhìn lên bảng với ánh mắt ngây thơ không giấu nổi sự tò mò, háo hức khi cô giáo dán lên bức tranh hai anh em đang chơi đùa trước sân nhà có cây táo trĩu quả. Cô đọc mẫu bài tập đọc rồi cho HS phát biểu tìm những từ khó để luyện phát âm. Mỗi lần một từ khó được phát hiện là một quả táo mầu trắng trên bức tranh được mở ra: quả này có chữ "chuyện đùa", quả bên trên là "dịu dàng", quả bên dưới là "dỗ dành", "làm anh"... tạo cho HS sự chú ý đặc biệt. Thao tác luyện đọc câu cũng khiến HS hứng khởi không kém khi được thực hiện theo trò chơi truyền tin: HS này đọc rồi gọi tên một HS khác đứng dậy đọc tiếp. Những lời khen khá hào phóng của GV: "Con đọc tốt lắm", "Con đọc rất tiến bộ" càng khiến HS thêm phấn chấn...
    Tiết học trôi qua gần 20 phút thì GV khởi xướng trò chơi. Đã trở thành quen thuộc, cả lớp nhanh nhẹn đứng lên, vừa múa vừa vỗ tay, miệng hát vang: "Mình thương nhau mình nắm tay nhau, nắm tay nhau mới là thương nhau...". Trò chơi diễn ra thật chóng vánh (chỉ trong ba phút) được xem là thời gian nghỉ giữa tiết: HS được thư giãn và vận động thoải mái ngay tại chỗ.
    Vào phần luyện tập, cả lớp lại im phăng phắc chăm chú nhìn lên bảng khi cô giáo lần lượt dán lên sáu bức tranh khác nhau, cô đưa ra sáu thẻ từ và gọi HS chọn một thẻ từ đúng nhất gắn vào bức tranh. HS đua nhau giơ tay xin lên bảng, sau khi gắn thẻ các em phải đọc thật to các từ đã chọn - theo giải thích của GV. "Đó là cách giúp HS nhận biết mặt chữ, phân biệt mặt chữ và phân biệt cách phát âm". Luyện đọc cả bài thơ, thay vì cho HS nhìn bảng hay nhìn sách đọc GV hướng dẫn: "Các con ạ, bài thơ này chúng ta còn đọc được theo kiểu đồng dao với song loan". Liền đó, cô gõ song loan và đọc mẫu trước theo nhịp 2/2: "Làm anh khó lắm. Phải đâu chuyện đùa...". Sau phút chốc mở to mắt vì ngạc nhiên, cả lớp thích thú đồng thanh đọc theo cô giáo...

    Cái "tài" của người GV
    Trên đây là một tiết học tiếng Việt của HS lớp 1 Trường tiểu học Nguyễn Việt Hồng, Q.3 do GV Đặng Mỹ Phương giảng dạy cô Phương vừa được Sở Giáo dục và Đào tạo TP Hồ Chí Minh trao giải nhất "GV dạy tốt lớp 1" năm học 2002-2003. Đã 10 năm đứng lớp và đặc biệt chỉ dạy HS lớp 1 nên GV Đặng Mỹ Phương hiểu rất rõ về HS của mình: "Các em mới từ mẫu giáo lên, vẫn còn quen với hình thức vừa học vừa chơi ở bậc học này. Vì thế giáo dục trực quan là phương pháp hiệu quả nhất có hình ảnh cụ thể, có trò chơi... vừa dễ khắc sâu vừa tạo sự thích thú cho HS". Có lẽ vì điều này mà cô đã sử dụng khá nhiều đồ dùng dạy học trong các tiết dạy, nhưng lấy ở đâu ra? Cô cười: "Đồ dùng dạy học ngày nay không thiếu, GV có nghĩ ra và có chịu sử dụng hay không thôi. Như thấy bài thơ Làm anh có khổ 4/4, tôi chợt nảy ra ý sẽ đọc theo dạng đồng dao kết hợp thêm tiếng gõ của song loan cho thêm hấp dẫn. Tranh ảnh khó khăn hơn vì không phải nội dung nào cũng có tranh vẽ sẵn hay GV nào cũng có hoa tay để vẽ. Tôi cũng không có hoa tay nên thường nhờ GV môn mỹ thuật vẽ hộ theo ý tưởng của mình".
    Cô bảo: tâm lý HS lớp 1 chỉ theo dõi và chú ý được trong một thời gian ngắn nên GV cần thay đổi thường xuyên hình thức học và chơi - thay đổi một cách sáng tạo cho phù hợp với đối tượng HS của mình. Và thế là cô đi tham khảo các trò chơi ở bậc mẫu giáo, trò chơi trên ti-vi, trò chơi của các đồng nghiệp (trong những lần được đi dự giờ ở các trường bạn)... rồi chế ra thêm cho phù hợp trước khi đưa vào sử dụng. Cô đúc kết: "Dạy chương trình mới GV rất cực, phải đầu tư công sức và thời gian cho việc chuẩn bị giáo án, tổ chức tiết học sao cho hấp dẫn, sinh động... Nhưng điều quan trọng là giáo án phải thật sáng tạo để cả HS giỏi và trung bình, cả HS nhút nhát và hoạt bát đều có thể tham gia tiết học".
    Giải thích về lý do trao giải nhất cho GV Đặng Mỹ Phương, ông Lê Ngọc Điệp - phó Phòng giáo dục tiểu học Sở Giáo dục và Đào tạo TP Hồ Chí Minh - nhận định: "Cái hay và cũng là điểm nổi trội của GV này là biết đổi mới phương pháp giảng dạy chương trình mới rất sáng tạo chứ không máy móc. GV giảng dạy ở một trường tiểu học bình thường của quận 3, không phải HS trường điểm nhưng các em vẫn được tham gia tiết học một cách tích cực. Đó là cái tài của GV: tùy đặc điểm của HS lớp mình để có cách dạy phù hợp. GV biết tổ chức cho HS hoạt động: HS được hoạt động theo đúng nghĩa của nó: không chỉ ngồi một chỗ giơ tay phát biểu mà còn được thi đua nhau lên bảng, được di chuyển thảo luận theo tổ...".

    ( theo báo Nhân Dân )

    9399
    Welcome to Box Quảng Trị.. Click here,please!
  5. minh_le

    minh_le Thành viên quen thuộc

    Tham gia ngày:
    15/12/2002
    Bài viết:
    780
    Đã được thích:
    0
    Giảng dạy chương trình tiểu học mới:
    Cần nhất sự sáng tạo



    Lần đầu tiên Sở Giáo dục và Đào tạo TP Hồ Chí Minh phát động phong trào "chọn lựa giáo viên có phương pháp giảng dạy chương trình tiểu học mới tốt nhất" qua từng cấp. Những người tham gia đều có chung kết luận: đổi mới phương pháp giảng dạy chương trình tiểu học mới cần nhất vẫn là sự sáng tạo.
    Tiết học sinh động
    Tiết học tạo ra một không khí sôi nổi ngay từ phút đầu tiên khi cô giáo bắt nhịp cho cả lớp hát bài Bác đưa thư: "Kính coong, kính coong, bác đưa thư đang đến nhà em...". Phần chính tiết học cũng thu hút sự chú ý của học sinh (HS) ngay từ khâu đầu tiên - khâu trả bài. Thay cho việc gọi tên HS lên bảng cầm sách đọc thì bốn tấm bìa cứng có in sẵn một đoạn văn được chia cho bốn tổ với yêu cầu: "tìm từ thích hợp điền vào chỗ trống". Các mái đầu chụm lại, bàn tán, xôn xao...
    Phần trả bài diễn ra khá nhanh chóng, giáo viên (GV) dẫn dắt vào bài mới: "Tiết học trước, các con đã học bài Bác đưa thư, thư của bố dặn dò Minh phải ngoan ngoãn, lễ phép, giúp mẹ chăm sóc em bé... Hôm nay chúng ta sẽ học bài Làm anh xem Minh chăm sóc em bé như thế nào nha các con". Cả lớp chăm chú nhìn lên bảng với ánh mắt ngây thơ không giấu nổi sự tò mò, háo hức khi cô giáo dán lên bức tranh hai anh em đang chơi đùa trước sân nhà có cây táo trĩu quả. Cô đọc mẫu bài tập đọc rồi cho HS phát biểu tìm những từ khó để luyện phát âm. Mỗi lần một từ khó được phát hiện là một quả táo mầu trắng trên bức tranh được mở ra: quả này có chữ "chuyện đùa", quả bên trên là "dịu dàng", quả bên dưới là "dỗ dành", "làm anh"... tạo cho HS sự chú ý đặc biệt. Thao tác luyện đọc câu cũng khiến HS hứng khởi không kém khi được thực hiện theo trò chơi truyền tin: HS này đọc rồi gọi tên một HS khác đứng dậy đọc tiếp. Những lời khen khá hào phóng của GV: "Con đọc tốt lắm", "Con đọc rất tiến bộ" càng khiến HS thêm phấn chấn...
    Tiết học trôi qua gần 20 phút thì GV khởi xướng trò chơi. Đã trở thành quen thuộc, cả lớp nhanh nhẹn đứng lên, vừa múa vừa vỗ tay, miệng hát vang: "Mình thương nhau mình nắm tay nhau, nắm tay nhau mới là thương nhau...". Trò chơi diễn ra thật chóng vánh (chỉ trong ba phút) được xem là thời gian nghỉ giữa tiết: HS được thư giãn và vận động thoải mái ngay tại chỗ.
    Vào phần luyện tập, cả lớp lại im phăng phắc chăm chú nhìn lên bảng khi cô giáo lần lượt dán lên sáu bức tranh khác nhau, cô đưa ra sáu thẻ từ và gọi HS chọn một thẻ từ đúng nhất gắn vào bức tranh. HS đua nhau giơ tay xin lên bảng, sau khi gắn thẻ các em phải đọc thật to các từ đã chọn - theo giải thích của GV. "Đó là cách giúp HS nhận biết mặt chữ, phân biệt mặt chữ và phân biệt cách phát âm". Luyện đọc cả bài thơ, thay vì cho HS nhìn bảng hay nhìn sách đọc GV hướng dẫn: "Các con ạ, bài thơ này chúng ta còn đọc được theo kiểu đồng dao với song loan". Liền đó, cô gõ song loan và đọc mẫu trước theo nhịp 2/2: "Làm anh khó lắm. Phải đâu chuyện đùa...". Sau phút chốc mở to mắt vì ngạc nhiên, cả lớp thích thú đồng thanh đọc theo cô giáo...

    Cái "tài" của người GV
    Trên đây là một tiết học tiếng Việt của HS lớp 1 Trường tiểu học Nguyễn Việt Hồng, Q.3 do GV Đặng Mỹ Phương giảng dạy cô Phương vừa được Sở Giáo dục và Đào tạo TP Hồ Chí Minh trao giải nhất "GV dạy tốt lớp 1" năm học 2002-2003. Đã 10 năm đứng lớp và đặc biệt chỉ dạy HS lớp 1 nên GV Đặng Mỹ Phương hiểu rất rõ về HS của mình: "Các em mới từ mẫu giáo lên, vẫn còn quen với hình thức vừa học vừa chơi ở bậc học này. Vì thế giáo dục trực quan là phương pháp hiệu quả nhất có hình ảnh cụ thể, có trò chơi... vừa dễ khắc sâu vừa tạo sự thích thú cho HS". Có lẽ vì điều này mà cô đã sử dụng khá nhiều đồ dùng dạy học trong các tiết dạy, nhưng lấy ở đâu ra? Cô cười: "Đồ dùng dạy học ngày nay không thiếu, GV có nghĩ ra và có chịu sử dụng hay không thôi. Như thấy bài thơ Làm anh có khổ 4/4, tôi chợt nảy ra ý sẽ đọc theo dạng đồng dao kết hợp thêm tiếng gõ của song loan cho thêm hấp dẫn. Tranh ảnh khó khăn hơn vì không phải nội dung nào cũng có tranh vẽ sẵn hay GV nào cũng có hoa tay để vẽ. Tôi cũng không có hoa tay nên thường nhờ GV môn mỹ thuật vẽ hộ theo ý tưởng của mình".
    Cô bảo: tâm lý HS lớp 1 chỉ theo dõi và chú ý được trong một thời gian ngắn nên GV cần thay đổi thường xuyên hình thức học và chơi - thay đổi một cách sáng tạo cho phù hợp với đối tượng HS của mình. Và thế là cô đi tham khảo các trò chơi ở bậc mẫu giáo, trò chơi trên ti-vi, trò chơi của các đồng nghiệp (trong những lần được đi dự giờ ở các trường bạn)... rồi chế ra thêm cho phù hợp trước khi đưa vào sử dụng. Cô đúc kết: "Dạy chương trình mới GV rất cực, phải đầu tư công sức và thời gian cho việc chuẩn bị giáo án, tổ chức tiết học sao cho hấp dẫn, sinh động... Nhưng điều quan trọng là giáo án phải thật sáng tạo để cả HS giỏi và trung bình, cả HS nhút nhát và hoạt bát đều có thể tham gia tiết học".
    Giải thích về lý do trao giải nhất cho GV Đặng Mỹ Phương, ông Lê Ngọc Điệp - phó Phòng giáo dục tiểu học Sở Giáo dục và Đào tạo TP Hồ Chí Minh - nhận định: "Cái hay và cũng là điểm nổi trội của GV này là biết đổi mới phương pháp giảng dạy chương trình mới rất sáng tạo chứ không máy móc. GV giảng dạy ở một trường tiểu học bình thường của quận 3, không phải HS trường điểm nhưng các em vẫn được tham gia tiết học một cách tích cực. Đó là cái tài của GV: tùy đặc điểm của HS lớp mình để có cách dạy phù hợp. GV biết tổ chức cho HS hoạt động: HS được hoạt động theo đúng nghĩa của nó: không chỉ ngồi một chỗ giơ tay phát biểu mà còn được thi đua nhau lên bảng, được di chuyển thảo luận theo tổ...".

    ( theo báo Nhân Dân )

    9399
    Welcome to Box Quảng Trị.. Click here,please!
  6. home_nguoikechuyen

    home_nguoikechuyen Thành viên rất tích cực

    Tham gia ngày:
    15/05/2002
    Bài viết:
    3.846
    Đã được thích:
    7

    Chữ Nôm trên đường hội nhập
    với khu vực và thế giới
    Giáo sư Nguyễn Quang Hồng
    Đặc San Nhịp Sống

    1.
    Trong khoảng mươi năm cuối cùng của thế kỉ XX trở lại đây, chữ Hán và những hệ thống chữ viết biểu ý tương tự ở các nước Á Ðông đã trở thành đối tượng thu hút sự chú ý của các chuyên gia quan tâm tới công nghệ thông tin trên thế giới. Quả thật, sau các hệ thống chữ viết phiên âm bắt nguồn từ hệ chữ cái La-tinh, Hi Lạp, A-rập, mà những vấn đề tin học hóa cho chúng về cơ bản đã được giải quyết, thì khối văn tự đồ sộ và đầy rẫy những nét đặc thù, lại có số người sử dụng khá lớn trên thế giới, là chữ Hán và các lối chữ ô vuông theo kiểu Hán tự, sẽ là mục tiêu công phá của tin học và công nghệ thông tin hiện đại.
    Mối quan tâm đó của các chuyên gia tin học và công nghệ thông tin đối với các hệ thống văn tự ô vuông biểu ý thể hiện trước hết ở các cuộc thảo luận của nhóm CJK (gồm đại diện của China, Japan và Korea, tức là Trung Quốc, Nhật Bản và Hàn Quốc), nằm trong Tổ chức Tiêu chuẩn hóa Quốc tế ISO (International Standard Organization). Từ tháng 10-1993, nhóm này chuyển thành nhóm IRG (Ideographic Rappoteur Group), với chương trình làm việc dày dặn hơn và thường xuyên hơn, mỗi năm nhóm họp chính thức 2 kì. Ngoài 3 nước kể trên, nhóm IRG có thêm sự tham gia của đại diện các nhà chuyên môn về văn tự và tin học từ Ðài Loan, Việt Nam, Hong Kong, Hoa Kì, sau này có cả Singapore và cuối cùng, vào năm 2000, bắt đầu có đại diện của (Bắc) Triều Tiên.
    Trong kết quả của sự hợp tác chặt chẽ giữa các nhà chuyên môn trong nước (ở Viện Hán Nôm, Viện Công nghệ Thông tin và Trung tâm Tiêu chuẩn Ðo lường Chất lượng) với các chuyên gia người Việt ở nước ngoài (nhóm Tiến sĩ Ngô Thanh Nhàn ở Mĩ), Việt Nam ta đã chính thức tham gia vào chương trình hoạt động của nhóm IRG từ đầu năm 1994 trong cuộc họp lần thứ 2 của nhóm này ở Hà Nội. Tại cuộc họp IRG#2 này, chữ Nôm của Việt Nam bắt đầu được đưa vào chương trình nghị sự của IRG trong tổ chức ISO của quốc tế.

    2.
    Mục tiêu trực tiếp nhất mà nhóm IRG muốn đạt tới là cùng nhau xác lập một kho chữ vuông biểu ý được tiêu chuẩn hóa và được thống nhất công nhận từ phía các thành viên có chủ quyền trong nhóm IRG đối với loại văn tự này. Kho chữ này phải làm sao bao gồm được hầu hết các đơn vị chữ và cả những biến thể của chúng, đã và đang được sử dụng phổ biến ở từng quốc gia vốn là chủ nhân của các thứ văn tự loại này. Dựa trên kết quả làm việc của nhóm IRG, Tổ chức ISO quốc tế sẽ cấp kí mã cho từng chữ một, sau khi đã giao cho các nhóm công tác chuyên trách rà xét cẩn thận.
    Trên cơ sở một kho chữ vuông biểu ý được chuẩn hóa và được thống nhất cấp mã quốc tế như vậy, các nhà công nghệ trong lĩnh vực in ấn và thông tin có thể sẽ sáng chế ra những thiết bị và những chương trình thích hợp để sử dụng rộng rãi chúng trong mọi lĩnh vực tạo lập, lưu trữ và trao đổi thông tin.

    3.
    Ðể thực hiện các mục tiêu trên đây, chương trình nghị sự của nhóm IRG bao gồm một loạt các nội dung công việc sau đây mà mỗi thành viên trong nhóm đều phải góp phần thực hiện:
    3.1.
    Xác định đối tượng chữ được đưa vào kho chữ chung. Cần phải phân biệt mấy khía cạnh khác nhau về đối tượng "nhập kho":
    Chữ và biến thể của chữ. Các đơn vị chữ vuông riêng biệt đại diện cho các ngữ tố khác nhau đương nhiên sẽ là đối tượng hàng đầu của việc nhập kho chữ chung. Tuy nhiên, để đáp ứng những nhu cầu khác nhau, đôi khi là rất tế nhị trong thông tin trên mặt chữ, người ta không ngần ngại thu nạp vào kho chữ chung này cả những dị thể hay biến thể của một đơn vị văn tự, và sẵn sàng cấp cho chúng những kí mã khác nhau. Bởi vậy mà ở đây không có sự "phân biệt đối xử" chữ phồn thể với chữ giản thể, mặc dầu các chữ Hán giản thể không xếp chen lẫn với chữ Hán phồn thể, mà đều xếp nối vào sau toàn bộ các chữ phồn thể của cùng một bộ thủ.

    Bộ thủ và bộ kiện của chữ. Mới đầu, các thành viên nhóm IRG chỉ quan tâm đưa các chữ vuông nguyên vẹn vào kho chữ chung. Về sau, người ta thấy cần thiết phải lập một danh sách riêng cho 214 bộ thủ truyền thống (theo Khang Hi tự điển). Bên cạnh đó còn xác lập một danh sách gồm 116 các biển thể hay dị thể của các bộ thủ, gọi là "bộ kiện" (CJK Radical Supplement). Các bộ thủ và bộ kiện này đều được cấp mã quốc tế như những kí tự riêng biệt.
    Các biến dạng của chữ và bộ thủ tùy theo thể loại thư pháp (Triện, Lệ, Hành, Thảo v.v.) dĩ nhiên sẽ không làm thành đối tượng nhập kho để mã hóa, bởi vì đó đều là những gì mà phần mềm của máy tính điện tử có thể xử lí được trên cơ sở một dạng chữ minh xác và chuẩn mực đã được cấp mã.

    3.2.
    Phân chia lớp hạng ưu tiên để nhập chữ vuông biểu ý vào kho. Trên đại thể, nhóm IRG đã phân biệt các lớp hạng sau đây:
    Cần ưu tiên đưa vào kho và cấp mã đối với những chữ hiện đang còn được sử dụng phổ biến ở các nưóc trong khu vực đồng văn Hán tự. Ðó là những chữ thuộc lớp A.

    Thứ đến là những chữ đang được các nước trong khu vực sử dụng nhưng không thường xuyên và ít phổ biến. Ðây là những chữ thuộc lớp B, sẽ được chuẩn hóa và đưa vào kho để lập mã sau khi đã lập mã xong cho các chữ thuộc loại A nói trên. Những chữ Nôm do người Việt tự tạo trên đại thể là thuộc vào lớp hạng B này.

    Những chữ cổ hoặc thuần túy địa phương, chỉ đôi khi xuất hiện trong những văn bản hạn hẹp, được xếp vào lớp hạng C. Những chữ thuộc lớp hạng này sẽ được chiếu cố xem xét đến để nhập kho cấp mã, sau khi đã lập mã xong cho các lớp chữ A và B, mà vẫn còn chỗ cho chúng trong bảng mã chữ vuông chung.

    3.3.
    Xác định nguồn chữ để đưa vào kho chữ chung. Các nước thành viên của IRG đã nhất trí như sau:
    Ðối với chữ Hán nguyên gốc, lấy Tự điển Khang Hi (in lần thứ 7 tại Bắc Kinh) làm nguồn chính. Và tự điển này cũng là căn cứ để tham chiếu các tự điển và tư liệu làm nguồn khác của tất cả các nước thành viên IRG.

    Ðối với chữ Hán được sử dụng ở các quốc gia, thì dựa theo sự lựa chọn và đề nghị của các nước thành viên hữu quan, nhưng phải được rà xét và thông qua tại các hội nghị của nhóm IRG. Hầu hết những chữ Hán có mặt trong trong các bộ tự điển sau đây đã được IRG thừa nhận cho vào kho chữ chung và được cấp mã theo lớp hạng A:- Hanyu Dazidian của Trung Quốc (in lần thứ nhất).- Daikanwa Jiten của Nhật Bản (in lần thứ 9).- Daejaweon của Hàn Quốc (in lần thứ nhất).- Tự điển chữ Nôm (Sài Gòn, 1971) và Bảng tra chữ Nôm (Hà Hội, 1976) của Việt Nam.

    Ðối với những chữ vuông được các quốc gia tự tạo ra để dùng cho tiếng bản ngữ, thì ngoài những tự điển ở (b), còn có thể sử dụng thêm các nguồn tư liệu khác nhau. Việc bổ sung này được đặt ra từ đầu năm 1998, khi kho chữ được mở rộng sang lớp hạng B và C. Danh sách các tư liệu này do từng nước đề nghị và được nhóm IRG thống nhất chấp nhận vào tháng 5-1998, gồm 107 tên tư liệu, trong đó có 40 tác phẩm bằng chữ Nôm do Việt Nam đề nghị.

    ------------------------------------
    Có khi mưa ngoài trời là giọt nước mắt em.
  7. home_nguoikechuyen

    home_nguoikechuyen Thành viên rất tích cực

    Tham gia ngày:
    15/05/2002
    Bài viết:
    3.846
    Đã được thích:
    7

    Chữ Nôm trên đường hội nhập
    với khu vực và thế giới
    Giáo sư Nguyễn Quang Hồng
    Đặc San Nhịp Sống

    1.
    Trong khoảng mươi năm cuối cùng của thế kỉ XX trở lại đây, chữ Hán và những hệ thống chữ viết biểu ý tương tự ở các nước Á Ðông đã trở thành đối tượng thu hút sự chú ý của các chuyên gia quan tâm tới công nghệ thông tin trên thế giới. Quả thật, sau các hệ thống chữ viết phiên âm bắt nguồn từ hệ chữ cái La-tinh, Hi Lạp, A-rập, mà những vấn đề tin học hóa cho chúng về cơ bản đã được giải quyết, thì khối văn tự đồ sộ và đầy rẫy những nét đặc thù, lại có số người sử dụng khá lớn trên thế giới, là chữ Hán và các lối chữ ô vuông theo kiểu Hán tự, sẽ là mục tiêu công phá của tin học và công nghệ thông tin hiện đại.
    Mối quan tâm đó của các chuyên gia tin học và công nghệ thông tin đối với các hệ thống văn tự ô vuông biểu ý thể hiện trước hết ở các cuộc thảo luận của nhóm CJK (gồm đại diện của China, Japan và Korea, tức là Trung Quốc, Nhật Bản và Hàn Quốc), nằm trong Tổ chức Tiêu chuẩn hóa Quốc tế ISO (International Standard Organization). Từ tháng 10-1993, nhóm này chuyển thành nhóm IRG (Ideographic Rappoteur Group), với chương trình làm việc dày dặn hơn và thường xuyên hơn, mỗi năm nhóm họp chính thức 2 kì. Ngoài 3 nước kể trên, nhóm IRG có thêm sự tham gia của đại diện các nhà chuyên môn về văn tự và tin học từ Ðài Loan, Việt Nam, Hong Kong, Hoa Kì, sau này có cả Singapore và cuối cùng, vào năm 2000, bắt đầu có đại diện của (Bắc) Triều Tiên.
    Trong kết quả của sự hợp tác chặt chẽ giữa các nhà chuyên môn trong nước (ở Viện Hán Nôm, Viện Công nghệ Thông tin và Trung tâm Tiêu chuẩn Ðo lường Chất lượng) với các chuyên gia người Việt ở nước ngoài (nhóm Tiến sĩ Ngô Thanh Nhàn ở Mĩ), Việt Nam ta đã chính thức tham gia vào chương trình hoạt động của nhóm IRG từ đầu năm 1994 trong cuộc họp lần thứ 2 của nhóm này ở Hà Nội. Tại cuộc họp IRG#2 này, chữ Nôm của Việt Nam bắt đầu được đưa vào chương trình nghị sự của IRG trong tổ chức ISO của quốc tế.

    2.
    Mục tiêu trực tiếp nhất mà nhóm IRG muốn đạt tới là cùng nhau xác lập một kho chữ vuông biểu ý được tiêu chuẩn hóa và được thống nhất công nhận từ phía các thành viên có chủ quyền trong nhóm IRG đối với loại văn tự này. Kho chữ này phải làm sao bao gồm được hầu hết các đơn vị chữ và cả những biến thể của chúng, đã và đang được sử dụng phổ biến ở từng quốc gia vốn là chủ nhân của các thứ văn tự loại này. Dựa trên kết quả làm việc của nhóm IRG, Tổ chức ISO quốc tế sẽ cấp kí mã cho từng chữ một, sau khi đã giao cho các nhóm công tác chuyên trách rà xét cẩn thận.
    Trên cơ sở một kho chữ vuông biểu ý được chuẩn hóa và được thống nhất cấp mã quốc tế như vậy, các nhà công nghệ trong lĩnh vực in ấn và thông tin có thể sẽ sáng chế ra những thiết bị và những chương trình thích hợp để sử dụng rộng rãi chúng trong mọi lĩnh vực tạo lập, lưu trữ và trao đổi thông tin.

    3.
    Ðể thực hiện các mục tiêu trên đây, chương trình nghị sự của nhóm IRG bao gồm một loạt các nội dung công việc sau đây mà mỗi thành viên trong nhóm đều phải góp phần thực hiện:
    3.1.
    Xác định đối tượng chữ được đưa vào kho chữ chung. Cần phải phân biệt mấy khía cạnh khác nhau về đối tượng "nhập kho":
    Chữ và biến thể của chữ. Các đơn vị chữ vuông riêng biệt đại diện cho các ngữ tố khác nhau đương nhiên sẽ là đối tượng hàng đầu của việc nhập kho chữ chung. Tuy nhiên, để đáp ứng những nhu cầu khác nhau, đôi khi là rất tế nhị trong thông tin trên mặt chữ, người ta không ngần ngại thu nạp vào kho chữ chung này cả những dị thể hay biến thể của một đơn vị văn tự, và sẵn sàng cấp cho chúng những kí mã khác nhau. Bởi vậy mà ở đây không có sự "phân biệt đối xử" chữ phồn thể với chữ giản thể, mặc dầu các chữ Hán giản thể không xếp chen lẫn với chữ Hán phồn thể, mà đều xếp nối vào sau toàn bộ các chữ phồn thể của cùng một bộ thủ.

    Bộ thủ và bộ kiện của chữ. Mới đầu, các thành viên nhóm IRG chỉ quan tâm đưa các chữ vuông nguyên vẹn vào kho chữ chung. Về sau, người ta thấy cần thiết phải lập một danh sách riêng cho 214 bộ thủ truyền thống (theo Khang Hi tự điển). Bên cạnh đó còn xác lập một danh sách gồm 116 các biển thể hay dị thể của các bộ thủ, gọi là "bộ kiện" (CJK Radical Supplement). Các bộ thủ và bộ kiện này đều được cấp mã quốc tế như những kí tự riêng biệt.
    Các biến dạng của chữ và bộ thủ tùy theo thể loại thư pháp (Triện, Lệ, Hành, Thảo v.v.) dĩ nhiên sẽ không làm thành đối tượng nhập kho để mã hóa, bởi vì đó đều là những gì mà phần mềm của máy tính điện tử có thể xử lí được trên cơ sở một dạng chữ minh xác và chuẩn mực đã được cấp mã.

    3.2.
    Phân chia lớp hạng ưu tiên để nhập chữ vuông biểu ý vào kho. Trên đại thể, nhóm IRG đã phân biệt các lớp hạng sau đây:
    Cần ưu tiên đưa vào kho và cấp mã đối với những chữ hiện đang còn được sử dụng phổ biến ở các nưóc trong khu vực đồng văn Hán tự. Ðó là những chữ thuộc lớp A.

    Thứ đến là những chữ đang được các nước trong khu vực sử dụng nhưng không thường xuyên và ít phổ biến. Ðây là những chữ thuộc lớp B, sẽ được chuẩn hóa và đưa vào kho để lập mã sau khi đã lập mã xong cho các chữ thuộc loại A nói trên. Những chữ Nôm do người Việt tự tạo trên đại thể là thuộc vào lớp hạng B này.

    Những chữ cổ hoặc thuần túy địa phương, chỉ đôi khi xuất hiện trong những văn bản hạn hẹp, được xếp vào lớp hạng C. Những chữ thuộc lớp hạng này sẽ được chiếu cố xem xét đến để nhập kho cấp mã, sau khi đã lập mã xong cho các lớp chữ A và B, mà vẫn còn chỗ cho chúng trong bảng mã chữ vuông chung.

    3.3.
    Xác định nguồn chữ để đưa vào kho chữ chung. Các nước thành viên của IRG đã nhất trí như sau:
    Ðối với chữ Hán nguyên gốc, lấy Tự điển Khang Hi (in lần thứ 7 tại Bắc Kinh) làm nguồn chính. Và tự điển này cũng là căn cứ để tham chiếu các tự điển và tư liệu làm nguồn khác của tất cả các nước thành viên IRG.

    Ðối với chữ Hán được sử dụng ở các quốc gia, thì dựa theo sự lựa chọn và đề nghị của các nước thành viên hữu quan, nhưng phải được rà xét và thông qua tại các hội nghị của nhóm IRG. Hầu hết những chữ Hán có mặt trong trong các bộ tự điển sau đây đã được IRG thừa nhận cho vào kho chữ chung và được cấp mã theo lớp hạng A:- Hanyu Dazidian của Trung Quốc (in lần thứ nhất).- Daikanwa Jiten của Nhật Bản (in lần thứ 9).- Daejaweon của Hàn Quốc (in lần thứ nhất).- Tự điển chữ Nôm (Sài Gòn, 1971) và Bảng tra chữ Nôm (Hà Hội, 1976) của Việt Nam.

    Ðối với những chữ vuông được các quốc gia tự tạo ra để dùng cho tiếng bản ngữ, thì ngoài những tự điển ở (b), còn có thể sử dụng thêm các nguồn tư liệu khác nhau. Việc bổ sung này được đặt ra từ đầu năm 1998, khi kho chữ được mở rộng sang lớp hạng B và C. Danh sách các tư liệu này do từng nước đề nghị và được nhóm IRG thống nhất chấp nhận vào tháng 5-1998, gồm 107 tên tư liệu, trong đó có 40 tác phẩm bằng chữ Nôm do Việt Nam đề nghị.

    ------------------------------------
    Có khi mưa ngoài trời là giọt nước mắt em.
  8. home_nguoikechuyen

    home_nguoikechuyen Thành viên rất tích cực

    Tham gia ngày:
    15/05/2002
    Bài viết:
    3.846
    Đã được thích:
    7

    3.4.
    Xác lập quy tắc mã hóa và thể thức lập bảng chữ vuông chung.
    Quy tắc mã hóa. Mỗi nước thành viên IRG, sau khi thu thập các chữ vuông cần lập bảng chữ đề nghị nhập kho, trong đó mỗi chữ phải được mã hóa theo hệ mã nội bộ và sắp xếp theo một thứ tự nhất định. Ví dụ: với chữ Nôm ba chúng ta cấp mã nội bộ (V-code) là V0-354F, được xác định là thuộc bộ "nhất" (vì chữ "tam" thuộc bộ "nhất"), với 6 nét (không tính bộ thủ), như vậy chiếu vào Khang Hi tự điển thì chữ Nôm này sẽ được định vị là 0078.131 (nghĩa là nó được xếp tiếp theo sau chữ thứ 13 ở trang 78 của tự điển này). Theo đó, chữ Nôm này sẽ được đề nghị cấp mã trong bảng mở rộng Extension B là 2-0027 và đồng thời là mã quốc tế (Unicode) trong ISO/IEC-10646.

    Thể thức lập bảng. Tất cả những chữ do các nước thành viên đề nghị, sau khi đã được IRG chấp thuận, thì được sắp xếp vào một bảng chữ chung, mà thực chất đó là một cuốn tự điển thu nạp toàn bộ các chữ vuông đã qua chuẩn hóa và được cấp mã quốc tế. Tập chữ này được gọi là SuperCJK, được bắt đầu soạn thảo từ đầu năm 1998, qua hàng chục lần điều chỉnh và bổ sung, đến cuối năm 2000 với bảng SuperCJK 11.1, tổng số chữ vuông được thu nạp và cấp mã quốc tế là 70205 chữ (trong đó có 9299 chữ do Việt Nam cung cấp). Trong tập SuperCJK này, các chữ được xếp thứ tự theo bộ thủ và theo mã số Khang Hi đã được định vị, và mỗi chữ đều được ghi rõ mã nội bộ, mã quốc tế như trên đã trình bày.

    4.
    Chữ Hán vốn đã phức tạp và đa dạng, mà chữ vuông theo kiểu Hán tự được sử dụng ở các nước trong khu vực lại càng đa dạng và phức tạp hơn. Làm việc với một khối lượng chữ đồ sộ mà lại phức tạp và đa dạng như thế, quả thực là vô cùng lí thú và cũng vô cùng... vất vả. Công việc này không những đòi hỏi khả năng chuyên môn cao trong lĩnh vực văn tự học và tin học, mà cũng cần đến một tinh thần nghiêm túc, chu đáo và nhẫn nại trên từng nét chữ, từng con số từ lúc bắt đầu cho đến khi kết thúc công việc đặt ra theo mục tiêu đã định. Trên từng khâu công việc cụ thể, có sự khác biệt trong cách xử lí giữa các thành viên, và cũng không tránh khỏi những thiếu sót và sơ suất khi soạn thảo, thẩm định và in ấn các hình chữ và mã chữ. Do đó trong các phiên họp chính thức cũng như thông qua thư từ điện tử, giữa các thành viên IRG luôn luôn có sự trao đổi, thảo luận, bổ sung, điều chỉnh. Và nhiều khi cũng phải có sự nhân nhượng lẫn nhau để có thể đạt tới một giải pháp chung được đa số chấp nhận. Ðiều này thường xảy ra khi gộp hay tách các hình chữ, khi quy bộ thủ hoặc tính đếm số nét cho từng trường hợp cụ thể. Riêng đối với chữ Nôm của Việt Nam, thì đây là lần đầu tiên được đem ra đối chiếu từng chữ một với chữ vuông biểu ý của các nước trong khu vực đồng văn Hán tự. Trong khi đó thì việc nghiên cứu cơ bản về chữ Nôm còn chưa thật sâu sắc, cũng như bản thân chữ Nôm hầu như chưa được thực sự chuẩn hóa trong lịch sử phát triển của mình. Bởi vậy mà đã có không ít vấn đề phải xem xét và xử lí một cách kịp thời để không cản trở tiến độ chung của công việc.
    Hoạt động của nhóm IRG trong Tổ chức ISO quốc tế diễn ra đều đặn và khẩn trương từ đầu thập niên cuối cùng của thế kỉ XX đến nay, đã trải qua 18 phiên họp chính thức và một số kì họp dành riêng cho nhóm biên tập các bảng chữ. Trong đó, thành viên Việt Nam đã tham gia gần đủ các phiên họp chính thức, chỉ trừ phiên họp thứ 5 (IRG#5) họp tại Hàn Quốc (tháng 11/1995) là không có mặt đại diện của Việt Nam. Ðiều đáng tiếc là chính trong kì họp này, đề nghị đổi tên gọi bảng chữ tổng hợp "CuperCJK" thành "CuperCJKV" do Việt Nam nêu ra từ trước đó đã bị bỏ qua (vì không có thành viên Việt Nam tại kì họp để bảo vệ đề nghị họp lí này). Tuy nhiên, đây cũng chỉ là chuyện tên gọi, còn thực chất thì trong các bảng tổng hợp kho chữ của IRG vẫn dành riêng cho chữ Nôm một cột V bên cạch các cột của K (Korea) J (Japan), G (guobiao- Trung Quốc), T (Taiwan), H (Hong Kong). Và khi bảng chữ không chia cột, thì các kí hiệu V, J, K, v.v. cũng được ghi rõ ở ô chữ được mã hóa.

    5.
    Trong suốt quá trình tham gia chương trình hoạt động cùng nhóm IRG, các chuyên gia Việt Nam đã lần lượt soạn thảo 4 bảng chữ Nôm chuẩn để cung cấp cho IRG với ý thức tranh thủ đưa chữ Nôm vào kho chữ chung ISO/IEC-10646 càng nhiều càng tốt (mà cái ý thức này thì các thành viên khác trong nhóm IRG cũng không thua kém, vì quyền lợi lâu dài của đất nước và dân tộc mình). Các bảng chữ Nôm chuẩn của Việt Nam lần lượt được đánh số là V0, V1, V2, V3 (và hiện đang gấp rút hoàn thành thêm bảng V4 và V5):
    V0: Ðây là bộ mã chuẩn 16-bit chữ Nôm do Ban Kĩ thuật Công nghệ Thông tin tổ chức soạn thảo, Tổng cục Tiêu chuẩn Ðo lường Chất lượng xét duyệt và được Bộ Khoa học Công nghệ và Môi trường công bố năm 1993 (TCVN 5773:1993). Với bộ mã chuẩn chữ Nôm này, Việt Nam đã đăng kí tham gia chương trình nghị sự của nhóm IRG vào dịp nhóm này họp thường kì lần thứ 2 tại Hà Nội đầu năm 1994. Bảng chữ Nôm chuẩn này gồm 2357 chữ, trong đó có hơn 70% là chữ Nôm không trùng hình với chữ Hán.

    V1: Cũng là bộ mã chuẩn 16-bit chữ Nôm do Ban Kĩ thuật Công nghệ thông tin tổ chức biên soạn, Tổng cục Tiêu chuẩn Ðo Lường Chất lượng xét duyệt và Bộ Khoa học Công nghệ Môi trường công bố năm 1995 (TCVN 6056:1995). Bộ chữ này thu thập tất cả 3361 chữ Nôm hoàn toàn trùng hình với chữ Hán (có mặt trong Khang Hi tự điển).
    Trong suốt các phiên họp và các cuộc tiếp xúc với đồng nghiệp các nước trong nhóm IRG từ năm 1995 đến 1997 các chuyên gia Việt Nam đã cố gắng cộng tác để đưa các chữ Nôm trong 2 tập chữ trên đây vào kho chữ vuông chung ISO/IEC-10646. Sau khi rà xét đối chiếu lại giữa V0 và V1, thấy có 38 chữ trùng lặp phải loại bỏ. Số còn lại của cả hai bảng chữ, có 3897 chữ được chính thức đưa vào ISO/IEC-10646 từ giữa năm 1997. Sau đó còn có thêm 128 chữ Nôm cũng được cấp mã trong bảng chữ mở rộng Extension A của IRG. Như vậy là từ cuối năm 1997, có 4025 chữ Nôm (trùng hình với chữ Hán) được đề nghị cấp mã ISO/IEC-10646. Kết quả này được khẳng định tại cuộc họp thường kì IRG#10 tại thành phố Hồ Chí Minh tháng 12/1997. Ðến đây, nhóm IRG cũng kết thúc giai đoạn I của chương trình, chủ yếu dành cho việc xem xét cấp mã cho các chữ vuông thuộc lớp hạng A.
    Từ năm 1998, nhóm IRG chuyển sang giai đoạn II là giai đoạn xem xét và cấp mã cho các chữ thuộc lớp hạng B. Ðây là dịp chữ Nôm thuần Việt có nhiều khả năng được chấp nhận hàng loạt vào kho chữ chung, vì những chữ trùng hình với chữ Hán về cơ bản đã được thu nạp rồi. Vả lại không gian mã hóa mới dành cho giai đoạn II là rất lớn (đến 64565 vị trí mã), cho nên hầu như không phải tranh chấp ưu tiên cấp mã nữa. Việc soạn thảo và phê duyệt các tập chữ vuông chuẩn ở từng nước thành viên trong giai đoạn này cũng được đơn giản hơn về mặt thủ tục, Nguồn chữ không nhất thiết phải là các tự điển, mà có thể là nhiều ấn phẩm khác nhau. Theo đó, các chuyên gia ở Viện Hán Nôm và Viện Công nghệ Thông tin đã khẩn trương soạn thảo thêm 2 tập mã chữ Nôm chuẩn để làm việc với nhóm IRG trong giai đoạn mới:

    V2: Tập chuẩn chữ Nôm này do Viện Nghiên cứu Hán Nôm xét duyệt và gửi tới nhóm IRG ngày 17/4/1998. Cũng như hai tập chữ V0 và V1, nguồn chữ mà V2 thu thập vẫn là hai bộ tự điển chữ Nôm đã nói ở trên (Sài Gòn, 1971 và Hà Nội, 1976). Tập chữ Nôm này gồm 3371 chữ, trong đó có 844 chữ là bổ sung vào những vị trí tương ứng trong Extension A (trùng với chữ Hán và chữ các nước khác, đã được cấp mã), còn lại 2527 chữ (hầu hết là chữ thuần Nôm) là đăng kí cấp mã trong bảng Extension B.

    V3: Tập chuẩn này cũng do Viện Nghiên cứu Hán Nôm xét duyệt và gửi tới nhóm IRG ngày 7/5/1998. Tất cả 849 chữ hầu hết là thuần Nôm được thu thập vào tập chuẩn này là lấy từ 40 tác phẩm và tự điển khác nhau.
    Sau 2 năm làm việc tiếp theo (đầu năm1998 đến cuối năm 2000), có thêm 5274 chữ Nôm nữa (chủ yếu từ V2, V3 và một phần còn lại của V0 và V1) được thu nạp vào Extension A và Extension B của IRG để cấp mã ISO/IEC-10646. Tổng cộng lại, như trên đã nói, đến cuối năm 2000 trong bảng tổng hợp CuperCJK-11.1 (in ngày 21/11/2000) có mặt tất cả 9299 chữ mang tên Việt Nam (với kí hiệu V0, V1, V2, V3). Trong đó có 4232 chữ là những chữ Nôm không trùng hình với chữ Hán.
    Tuy nhiên, nhóm IRG không muốn dừng tại đây, mà tiếp tục khuyến khích các nước thành viên cung cấp thêm các tập chữ thuộc lớp hạng C, và cả những chữ còn bỏ sót, để lập thêm Extension C. Tất cả các nước thành viên đều hưởng ứng khuyến nghị này và bắt đầu từ cuộc họp nhóm IRG#17 (6/2001 tại Hong Kong) đã đăng kí thêm chữ của họ. Các chuyên gia Việt Nam hiện đang khẩn trương hoàn thành tập chuẩn V4, gồm hơn 2500 chữ thuần Nôm, trong đó có khoảng 400 chữ Nôm Tày (không trùng với chữ Hán và chữ Nôm Việt, thu thập từ công trình nghiên cứu văn hóa Tày của Giáo sư Nguyễn Văn Huyên và Từ điển chữ Nôm Tày của Triều Ân). Cùng với tập mã chữ Nôm V4, tập mã chữ Nôm V5 cũng đang được chuẩn bị nhằm bổ sung vào CuperCJK mã Việt Nam cho gần 1000 chữ Nôm trùng hình với các nước khác. Công việc rà xét và cấp mã cho chúng sẽ được nhóm IRG thực hiện trong thời gian 2002-2003. Như vậy, nếu mọi việc tiến triển như dự kiến, thì cuối năm 2003, tổng số chữ Nôm của Việt Nam hội nhập vào kho chữ vuông biểu ý của khu vực và quốc tế với mã của ISO/IEC-10646 sẽ lên tới con số hơn 12000 chữ (khoảng 50% là chữ thuần Nôm, không trùng hình với chữ vuông của các nước khác).

    6.
    Với số lượng hơn 12000 chữ Nôm được chuẩn hóa và cấp mã quốc tế như vậy, hoàn toàn có thể xúc tiến việc chế tạo ra các phông chữ Nôm để ứng dụng cho các phần mềm máy vi tính, từ đó có thể thực hiện được việc phiên chuyển, tái tạo hoặc tạo lập các văn bản chữ Nôm, truyền đạt và truy cập các thông tin dưới dạng chữ Nôm qua máy tính điện tử.
    Trong khi các tổ chức, các công ti tin học và công nghệ thông tin lớn ở nước ta chưa thực sự lưu tâm đến những vấn đề như thế, thì từ nhiều năm nay, một số tổ chức và công ti nước ngoài đã quan tâm đến những triển vọng như vậy đối với chữ Nôm, song song với quá trình hội nhập chữ Nôm vào kho chữ vuông biểu ý của khu vực và quốc tế. Thông qua những mối quan hệ chuyên môn đạt được giữa các chuyên gia Việt Nam là thành viên của nhóm IRG (Giáo sư Nguyễn Quang Hồng và Kĩ sư Ngô Trung Việt) với một số đồng nghiệp nước ngoài, đến cuối năm 2000 đã có hai cơ sở nước ngoài tự nguyện thực hiện bước đầu vẽ phông cho chữ Nôm. Ðó là Hội Văn Tự Kính ở Tokyo (Nhật Bản) và Công ti DynaLab của Ðài Loan (đóng tại Thượng Hải). Toàn bộ 9299 chữ Nôm có mặt trong CuperCJK đã được cả hai cơ sở này vẽ phông đầy đủ theo các chuẩn mực đặt ra cho chữ vuông biểu ý nói chung. Với điều kiện kĩ thuật và kinh nghiệm vẽ chữ còn rất hạn chế ở nước ta hiện nay, khó lòng có thể thực hiện được tốt một công việc đồ sộ và phức tạp như vậy. Tuy nhiên, với cả 2 bộ phông chữ Nôm này, vẫn cần được rà soát một cách cẩn thận và tiếp tục gia công, chỉnh lí cho hoàn thiện hơn nữa.
    Sau khi đã có được những bộ phông chữ Nôm hoàn chỉnh rồi, thì một công việc phức tạp đặt ra cho các chuyên gia chữ Nôm và chuyên gia tin học là làm sao tạo ra được các chương trình ứng dụng chúng, chuyển các phông chữ Nôm đó thành các đĩa mềm có thể cài đặt vào máy vi tính để sử dụng chữ Nôm như hiện nay người ta đã sử dụng được đối với chữ Hán. Một hướng xử lí thích hợp đối với chữ Nôm trong công việc này là sử dụng âm đọc của chữ Nôm theo chữ Quốc ngữ hiện hành để làm "chìa khóa" mở gọi một chữ nào đó khi cần thiết. Tính phức tạp của cách xử lí này là mỗi chữ Nôm thường có nhiều âm đọc khác nhau, và ngược lại, một âm đọc có thể tương ứng với nhiều chữ Nôm khác nhau. Xác lập cho đầy đủ và chính xác mối tương ứng giữa âm và hình của từng chữ Nôm là câu chuyện không đơn giản chút nào, mặc dù không phải là không thực hiện được (tương tự như người ta đã làm việc này đối với chữ Hán). Dĩ nhiên cũng có thể tìm kiếm những cách xử lí khác nữa để lập "chìa khóa" tra tìm chữ Nôm, như căn cứ vào bộ thủ hoặc theo các mô hình cấu tạo của chữ Nôm chẳng hạn, mặc dù cách này có thể còn rối ren hơn nhiều. Cũng cần nói thêm rằng, mặc dù hầu như toàn bộ số chữ Nôm đã và đang đi vào kho chữ vuông quốc tế là được thu thập từ các nguồn tư liệu chữ Nôm tiếng Việt, song có khá nhiều chữ Nôm Tày là trùng hình với chữ Nôm Việt (và cả với chữ Hán). Bởi vậy, nếu đối với những chữ trùng hình như thế cũng tiến hành xác lập các âm đọc tương ứng trong tiếng Tày, thì cùng với những chữ thuần Nôm Tày trong V4 đang được đăng kí cấp mã, ở một mức độ đáng kể cũng có thể lợi dụng vốn chữ Nôm Việt đã có cho tiếng Tày.
    Như có thể thấy, chữ Nôm của Việt Nam đã có được những bước đi vững chắc trên đường hội nhập với khu vực và thế giới. Con đường tin học hóa chữ Nôm bước đầu đã được khai thông, Và từ đây, từ đầu thế kỉ mới chúng ta có thể nghĩ tới và nhanh chóng thực hiện những bước tiếp theo để hệ thống văn tự cổ truyền này chẳng những sẽ được bảo tồn vững chắc, mà còn có khả năng đi vào cuộc sống mới, thực sự làm một chiếc cầu nối quá khứ với hiện tại và tương lai của các dân tộc Việt Nam.
    Giáo sư Nguyễn Quang Hồng

    ------------------------------------
    Có khi mưa ngoài trời là giọt nước mắt em.
  9. home_nguoikechuyen

    home_nguoikechuyen Thành viên rất tích cực

    Tham gia ngày:
    15/05/2002
    Bài viết:
    3.846
    Đã được thích:
    7

    3.4.
    Xác lập quy tắc mã hóa và thể thức lập bảng chữ vuông chung.
    Quy tắc mã hóa. Mỗi nước thành viên IRG, sau khi thu thập các chữ vuông cần lập bảng chữ đề nghị nhập kho, trong đó mỗi chữ phải được mã hóa theo hệ mã nội bộ và sắp xếp theo một thứ tự nhất định. Ví dụ: với chữ Nôm ba chúng ta cấp mã nội bộ (V-code) là V0-354F, được xác định là thuộc bộ "nhất" (vì chữ "tam" thuộc bộ "nhất"), với 6 nét (không tính bộ thủ), như vậy chiếu vào Khang Hi tự điển thì chữ Nôm này sẽ được định vị là 0078.131 (nghĩa là nó được xếp tiếp theo sau chữ thứ 13 ở trang 78 của tự điển này). Theo đó, chữ Nôm này sẽ được đề nghị cấp mã trong bảng mở rộng Extension B là 2-0027 và đồng thời là mã quốc tế (Unicode) trong ISO/IEC-10646.

    Thể thức lập bảng. Tất cả những chữ do các nước thành viên đề nghị, sau khi đã được IRG chấp thuận, thì được sắp xếp vào một bảng chữ chung, mà thực chất đó là một cuốn tự điển thu nạp toàn bộ các chữ vuông đã qua chuẩn hóa và được cấp mã quốc tế. Tập chữ này được gọi là SuperCJK, được bắt đầu soạn thảo từ đầu năm 1998, qua hàng chục lần điều chỉnh và bổ sung, đến cuối năm 2000 với bảng SuperCJK 11.1, tổng số chữ vuông được thu nạp và cấp mã quốc tế là 70205 chữ (trong đó có 9299 chữ do Việt Nam cung cấp). Trong tập SuperCJK này, các chữ được xếp thứ tự theo bộ thủ và theo mã số Khang Hi đã được định vị, và mỗi chữ đều được ghi rõ mã nội bộ, mã quốc tế như trên đã trình bày.

    4.
    Chữ Hán vốn đã phức tạp và đa dạng, mà chữ vuông theo kiểu Hán tự được sử dụng ở các nước trong khu vực lại càng đa dạng và phức tạp hơn. Làm việc với một khối lượng chữ đồ sộ mà lại phức tạp và đa dạng như thế, quả thực là vô cùng lí thú và cũng vô cùng... vất vả. Công việc này không những đòi hỏi khả năng chuyên môn cao trong lĩnh vực văn tự học và tin học, mà cũng cần đến một tinh thần nghiêm túc, chu đáo và nhẫn nại trên từng nét chữ, từng con số từ lúc bắt đầu cho đến khi kết thúc công việc đặt ra theo mục tiêu đã định. Trên từng khâu công việc cụ thể, có sự khác biệt trong cách xử lí giữa các thành viên, và cũng không tránh khỏi những thiếu sót và sơ suất khi soạn thảo, thẩm định và in ấn các hình chữ và mã chữ. Do đó trong các phiên họp chính thức cũng như thông qua thư từ điện tử, giữa các thành viên IRG luôn luôn có sự trao đổi, thảo luận, bổ sung, điều chỉnh. Và nhiều khi cũng phải có sự nhân nhượng lẫn nhau để có thể đạt tới một giải pháp chung được đa số chấp nhận. Ðiều này thường xảy ra khi gộp hay tách các hình chữ, khi quy bộ thủ hoặc tính đếm số nét cho từng trường hợp cụ thể. Riêng đối với chữ Nôm của Việt Nam, thì đây là lần đầu tiên được đem ra đối chiếu từng chữ một với chữ vuông biểu ý của các nước trong khu vực đồng văn Hán tự. Trong khi đó thì việc nghiên cứu cơ bản về chữ Nôm còn chưa thật sâu sắc, cũng như bản thân chữ Nôm hầu như chưa được thực sự chuẩn hóa trong lịch sử phát triển của mình. Bởi vậy mà đã có không ít vấn đề phải xem xét và xử lí một cách kịp thời để không cản trở tiến độ chung của công việc.
    Hoạt động của nhóm IRG trong Tổ chức ISO quốc tế diễn ra đều đặn và khẩn trương từ đầu thập niên cuối cùng của thế kỉ XX đến nay, đã trải qua 18 phiên họp chính thức và một số kì họp dành riêng cho nhóm biên tập các bảng chữ. Trong đó, thành viên Việt Nam đã tham gia gần đủ các phiên họp chính thức, chỉ trừ phiên họp thứ 5 (IRG#5) họp tại Hàn Quốc (tháng 11/1995) là không có mặt đại diện của Việt Nam. Ðiều đáng tiếc là chính trong kì họp này, đề nghị đổi tên gọi bảng chữ tổng hợp "CuperCJK" thành "CuperCJKV" do Việt Nam nêu ra từ trước đó đã bị bỏ qua (vì không có thành viên Việt Nam tại kì họp để bảo vệ đề nghị họp lí này). Tuy nhiên, đây cũng chỉ là chuyện tên gọi, còn thực chất thì trong các bảng tổng hợp kho chữ của IRG vẫn dành riêng cho chữ Nôm một cột V bên cạch các cột của K (Korea) J (Japan), G (guobiao- Trung Quốc), T (Taiwan), H (Hong Kong). Và khi bảng chữ không chia cột, thì các kí hiệu V, J, K, v.v. cũng được ghi rõ ở ô chữ được mã hóa.

    5.
    Trong suốt quá trình tham gia chương trình hoạt động cùng nhóm IRG, các chuyên gia Việt Nam đã lần lượt soạn thảo 4 bảng chữ Nôm chuẩn để cung cấp cho IRG với ý thức tranh thủ đưa chữ Nôm vào kho chữ chung ISO/IEC-10646 càng nhiều càng tốt (mà cái ý thức này thì các thành viên khác trong nhóm IRG cũng không thua kém, vì quyền lợi lâu dài của đất nước và dân tộc mình). Các bảng chữ Nôm chuẩn của Việt Nam lần lượt được đánh số là V0, V1, V2, V3 (và hiện đang gấp rút hoàn thành thêm bảng V4 và V5):
    V0: Ðây là bộ mã chuẩn 16-bit chữ Nôm do Ban Kĩ thuật Công nghệ Thông tin tổ chức soạn thảo, Tổng cục Tiêu chuẩn Ðo lường Chất lượng xét duyệt và được Bộ Khoa học Công nghệ và Môi trường công bố năm 1993 (TCVN 5773:1993). Với bộ mã chuẩn chữ Nôm này, Việt Nam đã đăng kí tham gia chương trình nghị sự của nhóm IRG vào dịp nhóm này họp thường kì lần thứ 2 tại Hà Nội đầu năm 1994. Bảng chữ Nôm chuẩn này gồm 2357 chữ, trong đó có hơn 70% là chữ Nôm không trùng hình với chữ Hán.

    V1: Cũng là bộ mã chuẩn 16-bit chữ Nôm do Ban Kĩ thuật Công nghệ thông tin tổ chức biên soạn, Tổng cục Tiêu chuẩn Ðo Lường Chất lượng xét duyệt và Bộ Khoa học Công nghệ Môi trường công bố năm 1995 (TCVN 6056:1995). Bộ chữ này thu thập tất cả 3361 chữ Nôm hoàn toàn trùng hình với chữ Hán (có mặt trong Khang Hi tự điển).
    Trong suốt các phiên họp và các cuộc tiếp xúc với đồng nghiệp các nước trong nhóm IRG từ năm 1995 đến 1997 các chuyên gia Việt Nam đã cố gắng cộng tác để đưa các chữ Nôm trong 2 tập chữ trên đây vào kho chữ vuông chung ISO/IEC-10646. Sau khi rà xét đối chiếu lại giữa V0 và V1, thấy có 38 chữ trùng lặp phải loại bỏ. Số còn lại của cả hai bảng chữ, có 3897 chữ được chính thức đưa vào ISO/IEC-10646 từ giữa năm 1997. Sau đó còn có thêm 128 chữ Nôm cũng được cấp mã trong bảng chữ mở rộng Extension A của IRG. Như vậy là từ cuối năm 1997, có 4025 chữ Nôm (trùng hình với chữ Hán) được đề nghị cấp mã ISO/IEC-10646. Kết quả này được khẳng định tại cuộc họp thường kì IRG#10 tại thành phố Hồ Chí Minh tháng 12/1997. Ðến đây, nhóm IRG cũng kết thúc giai đoạn I của chương trình, chủ yếu dành cho việc xem xét cấp mã cho các chữ vuông thuộc lớp hạng A.
    Từ năm 1998, nhóm IRG chuyển sang giai đoạn II là giai đoạn xem xét và cấp mã cho các chữ thuộc lớp hạng B. Ðây là dịp chữ Nôm thuần Việt có nhiều khả năng được chấp nhận hàng loạt vào kho chữ chung, vì những chữ trùng hình với chữ Hán về cơ bản đã được thu nạp rồi. Vả lại không gian mã hóa mới dành cho giai đoạn II là rất lớn (đến 64565 vị trí mã), cho nên hầu như không phải tranh chấp ưu tiên cấp mã nữa. Việc soạn thảo và phê duyệt các tập chữ vuông chuẩn ở từng nước thành viên trong giai đoạn này cũng được đơn giản hơn về mặt thủ tục, Nguồn chữ không nhất thiết phải là các tự điển, mà có thể là nhiều ấn phẩm khác nhau. Theo đó, các chuyên gia ở Viện Hán Nôm và Viện Công nghệ Thông tin đã khẩn trương soạn thảo thêm 2 tập mã chữ Nôm chuẩn để làm việc với nhóm IRG trong giai đoạn mới:

    V2: Tập chuẩn chữ Nôm này do Viện Nghiên cứu Hán Nôm xét duyệt và gửi tới nhóm IRG ngày 17/4/1998. Cũng như hai tập chữ V0 và V1, nguồn chữ mà V2 thu thập vẫn là hai bộ tự điển chữ Nôm đã nói ở trên (Sài Gòn, 1971 và Hà Nội, 1976). Tập chữ Nôm này gồm 3371 chữ, trong đó có 844 chữ là bổ sung vào những vị trí tương ứng trong Extension A (trùng với chữ Hán và chữ các nước khác, đã được cấp mã), còn lại 2527 chữ (hầu hết là chữ thuần Nôm) là đăng kí cấp mã trong bảng Extension B.

    V3: Tập chuẩn này cũng do Viện Nghiên cứu Hán Nôm xét duyệt và gửi tới nhóm IRG ngày 7/5/1998. Tất cả 849 chữ hầu hết là thuần Nôm được thu thập vào tập chuẩn này là lấy từ 40 tác phẩm và tự điển khác nhau.
    Sau 2 năm làm việc tiếp theo (đầu năm1998 đến cuối năm 2000), có thêm 5274 chữ Nôm nữa (chủ yếu từ V2, V3 và một phần còn lại của V0 và V1) được thu nạp vào Extension A và Extension B của IRG để cấp mã ISO/IEC-10646. Tổng cộng lại, như trên đã nói, đến cuối năm 2000 trong bảng tổng hợp CuperCJK-11.1 (in ngày 21/11/2000) có mặt tất cả 9299 chữ mang tên Việt Nam (với kí hiệu V0, V1, V2, V3). Trong đó có 4232 chữ là những chữ Nôm không trùng hình với chữ Hán.
    Tuy nhiên, nhóm IRG không muốn dừng tại đây, mà tiếp tục khuyến khích các nước thành viên cung cấp thêm các tập chữ thuộc lớp hạng C, và cả những chữ còn bỏ sót, để lập thêm Extension C. Tất cả các nước thành viên đều hưởng ứng khuyến nghị này và bắt đầu từ cuộc họp nhóm IRG#17 (6/2001 tại Hong Kong) đã đăng kí thêm chữ của họ. Các chuyên gia Việt Nam hiện đang khẩn trương hoàn thành tập chuẩn V4, gồm hơn 2500 chữ thuần Nôm, trong đó có khoảng 400 chữ Nôm Tày (không trùng với chữ Hán và chữ Nôm Việt, thu thập từ công trình nghiên cứu văn hóa Tày của Giáo sư Nguyễn Văn Huyên và Từ điển chữ Nôm Tày của Triều Ân). Cùng với tập mã chữ Nôm V4, tập mã chữ Nôm V5 cũng đang được chuẩn bị nhằm bổ sung vào CuperCJK mã Việt Nam cho gần 1000 chữ Nôm trùng hình với các nước khác. Công việc rà xét và cấp mã cho chúng sẽ được nhóm IRG thực hiện trong thời gian 2002-2003. Như vậy, nếu mọi việc tiến triển như dự kiến, thì cuối năm 2003, tổng số chữ Nôm của Việt Nam hội nhập vào kho chữ vuông biểu ý của khu vực và quốc tế với mã của ISO/IEC-10646 sẽ lên tới con số hơn 12000 chữ (khoảng 50% là chữ thuần Nôm, không trùng hình với chữ vuông của các nước khác).

    6.
    Với số lượng hơn 12000 chữ Nôm được chuẩn hóa và cấp mã quốc tế như vậy, hoàn toàn có thể xúc tiến việc chế tạo ra các phông chữ Nôm để ứng dụng cho các phần mềm máy vi tính, từ đó có thể thực hiện được việc phiên chuyển, tái tạo hoặc tạo lập các văn bản chữ Nôm, truyền đạt và truy cập các thông tin dưới dạng chữ Nôm qua máy tính điện tử.
    Trong khi các tổ chức, các công ti tin học và công nghệ thông tin lớn ở nước ta chưa thực sự lưu tâm đến những vấn đề như thế, thì từ nhiều năm nay, một số tổ chức và công ti nước ngoài đã quan tâm đến những triển vọng như vậy đối với chữ Nôm, song song với quá trình hội nhập chữ Nôm vào kho chữ vuông biểu ý của khu vực và quốc tế. Thông qua những mối quan hệ chuyên môn đạt được giữa các chuyên gia Việt Nam là thành viên của nhóm IRG (Giáo sư Nguyễn Quang Hồng và Kĩ sư Ngô Trung Việt) với một số đồng nghiệp nước ngoài, đến cuối năm 2000 đã có hai cơ sở nước ngoài tự nguyện thực hiện bước đầu vẽ phông cho chữ Nôm. Ðó là Hội Văn Tự Kính ở Tokyo (Nhật Bản) và Công ti DynaLab của Ðài Loan (đóng tại Thượng Hải). Toàn bộ 9299 chữ Nôm có mặt trong CuperCJK đã được cả hai cơ sở này vẽ phông đầy đủ theo các chuẩn mực đặt ra cho chữ vuông biểu ý nói chung. Với điều kiện kĩ thuật và kinh nghiệm vẽ chữ còn rất hạn chế ở nước ta hiện nay, khó lòng có thể thực hiện được tốt một công việc đồ sộ và phức tạp như vậy. Tuy nhiên, với cả 2 bộ phông chữ Nôm này, vẫn cần được rà soát một cách cẩn thận và tiếp tục gia công, chỉnh lí cho hoàn thiện hơn nữa.
    Sau khi đã có được những bộ phông chữ Nôm hoàn chỉnh rồi, thì một công việc phức tạp đặt ra cho các chuyên gia chữ Nôm và chuyên gia tin học là làm sao tạo ra được các chương trình ứng dụng chúng, chuyển các phông chữ Nôm đó thành các đĩa mềm có thể cài đặt vào máy vi tính để sử dụng chữ Nôm như hiện nay người ta đã sử dụng được đối với chữ Hán. Một hướng xử lí thích hợp đối với chữ Nôm trong công việc này là sử dụng âm đọc của chữ Nôm theo chữ Quốc ngữ hiện hành để làm "chìa khóa" mở gọi một chữ nào đó khi cần thiết. Tính phức tạp của cách xử lí này là mỗi chữ Nôm thường có nhiều âm đọc khác nhau, và ngược lại, một âm đọc có thể tương ứng với nhiều chữ Nôm khác nhau. Xác lập cho đầy đủ và chính xác mối tương ứng giữa âm và hình của từng chữ Nôm là câu chuyện không đơn giản chút nào, mặc dù không phải là không thực hiện được (tương tự như người ta đã làm việc này đối với chữ Hán). Dĩ nhiên cũng có thể tìm kiếm những cách xử lí khác nữa để lập "chìa khóa" tra tìm chữ Nôm, như căn cứ vào bộ thủ hoặc theo các mô hình cấu tạo của chữ Nôm chẳng hạn, mặc dù cách này có thể còn rối ren hơn nhiều. Cũng cần nói thêm rằng, mặc dù hầu như toàn bộ số chữ Nôm đã và đang đi vào kho chữ vuông quốc tế là được thu thập từ các nguồn tư liệu chữ Nôm tiếng Việt, song có khá nhiều chữ Nôm Tày là trùng hình với chữ Nôm Việt (và cả với chữ Hán). Bởi vậy, nếu đối với những chữ trùng hình như thế cũng tiến hành xác lập các âm đọc tương ứng trong tiếng Tày, thì cùng với những chữ thuần Nôm Tày trong V4 đang được đăng kí cấp mã, ở một mức độ đáng kể cũng có thể lợi dụng vốn chữ Nôm Việt đã có cho tiếng Tày.
    Như có thể thấy, chữ Nôm của Việt Nam đã có được những bước đi vững chắc trên đường hội nhập với khu vực và thế giới. Con đường tin học hóa chữ Nôm bước đầu đã được khai thông, Và từ đây, từ đầu thế kỉ mới chúng ta có thể nghĩ tới và nhanh chóng thực hiện những bước tiếp theo để hệ thống văn tự cổ truyền này chẳng những sẽ được bảo tồn vững chắc, mà còn có khả năng đi vào cuộc sống mới, thực sự làm một chiếc cầu nối quá khứ với hiện tại và tương lai của các dân tộc Việt Nam.
    Giáo sư Nguyễn Quang Hồng

    ------------------------------------
    Có khi mưa ngoài trời là giọt nước mắt em.
  10. home_nguoikechuyen

    home_nguoikechuyen Thành viên rất tích cực

    Tham gia ngày:
    15/05/2002
    Bài viết:
    3.846
    Đã được thích:
    7
    Giới thiệu sơ lược chữ Nôm
    trong tin học
    Tiến sĩ Ngô Thanh Nhàn
    Đặc San Nhịp Sống


    Giới thiệu
    Một trong những mất mát lớn nhất của dân tộc Việt Nam trong những năm chiến tranh là chữ Nôm. Theo nhiều nhà nghiên cứu, chữ Nôm bắt đầu sử dụng vào thế kỷ thứ 10 cho đến đầu thế kỷ này (khoảng những năm 1920). Những kho tư liệu viết bằng chữ Nôm còn lại sau chiến tranh ở rải rác khắp thế giới như Trung Quốc, Pháp, Mỹ, Va-ti-can, Nhật, v.v. Hàng nghìn văn bia ở rải rác khắp nước Việt Nam không người và của cải để giữ gìn chăm sóc. Số người đọc được chữ Nôm hiện nay có thể đếm trên đầu ngón tay và có nguy cơ bị mất hoàn toàn khi những học giả này qua đời. Những học giả tiền bối của chúng ta đã nhiều năm cố gắng phiên các tác phẩm viết bằng chữ Nôm ra chữ quốc ngữ, như truyện Kiều. Tuy nhiên số này còn nhỏ so với các kho tư liệu to tát như các địa chí, các tác phẩm nghệ thuật khác như chèo, tuồng, hát bộ, v.v. ghi bằng chữ Nôm.
    Hiện nay có nhiều cố gắng tại Việt Nam và ngoài nước để gây lại chữ Nôm, như tự điển chữ Nôm của Ðỗ Thông Minh (tại Nhật), các nghiên cứu của Nguyễn Khắc Kham, Nguyễn Ðình Hoà (tại Mỹ), và nhiều nghiên cứu công phu như của cụ Hoàng Xuân Hãn, Ðào Duy Anh, Vũ Văn Kính, Nguyễn Quang Hồng, Viện Hán Nôm, Viện Ngôn ngữ học, Hội Ngôn ngữ học Việt Nam, v.v.
    Bài này không nhằm mục đích nghiên cứu sâu về chữ Nôm. Tôi chỉ xin giới thiệu một công trình đưa chữ Nôm vào tin học của Tổng cục Tiêu chuẩn, Ðo lường, Chất lượng - Tiểu ban mã chuẩn chữ Nôm (thuộc Ban Tiêu chuẩn Công nghệ Thông tin) trong những năm vừa qua.

    Giới thiệu sơ lược về ngôn ngữ và chữ viết
    Truyện Kiều có câu:
    phiên âm ra chữ quốc ngữ thành:
    "Lời lời châu ngọc, hàng hàng gấm thêu"
    Khi nói, ta nói từng tiếng một. Tiếng nối nhau thành hàng, thành chuỗi, như chuỗi hạt. Câu nói nối kết nhau như thêu một bức gấm. Chữ viết cũng thế - người ta chỉ viết được từng nét một nối nhau thành chuỗi ký tự. Trong ngành ngôn ngữ học, ta nói ngôn ngữ có tuyến tính (linearity).
    Số câu nghe được và học được trọn đời của một người Việt có giới hạn, nhưng số câu ta nói được là vô hạn. Số chữ ta biết được có giới hạn, số câu mẫu và cụm từ tạo thành câu có giới hạn, nhưng số câu chúng tạo thành vô hạn. Những câu mới của người nói mà người nghe hiểu được "tự nhiên như đã nghe được từ trước" cho ta thấy ngôn ngữ có tính hệ thống và tính phổ quát (là người ai cũng có).
    Chữ viết là một hệ thống ký tự ghi lại tiếng nói của con người. Tất cả những hệ thống ký tự hiện nay đều không thể ghi lại đầy đủ tiếng nói, kể cả các ký tự phiên âm quốc tế. Ví dụ, ta viết câu "em đi học", người đọc không thể biết "em" là người nói (tiếng Anh, "I"), hay "em" là người nghe (tiếng Anh, "you"), hay "em" là người thứ ba (tiếng Anh, "he/she"). Ta cũng không thể biết đó là câu sai khiến, câu hỏi, hay câu xác định, hay câu kể chuyện - dù ta có bỏ thêm dấu "?", dấu thang "!", dấu dứt câu "." hay dấu lửng "...".
    Tiếng Việt nằm trong nhóm Môn-Khơ-me, thuộc ngữ hệ Nam-á. Trong tiếng Việt, mỗi tiếng (syllable) khi viết xuống thành một chữ (written syllable) đứng riêng biệt với các chữ khác. Trong tin học, ta nói chữ đứng giữa hai dấu cách (delimiters). Một từ (word) trong tiếng Việt có một hay nhiều tiếng (số nguyên dương), ví dụ bút, đồng hồ, nhà cửa, ô-tô, v.v.
    Chữ quốc ngữ dùng các ký tự la-tinh, như a, b, c, d, đ,...; các dấu mũ (circumflex), dấu ngắn hay dấu trăng (breve), dấu râu (horn) dành cho các nguyên âm a, ă, â, e, ê, o, ô, ơ, u, ư; các dấu thanh như không dấu (no tone mark) cho thanh ngang (high level tone), dấu huyền (grave tone mark) cho thanh huyền (low level tone), dấu sắc (acute tone mark) cho thanh sắc (high-rising tone), dấu nặng (dot below tone mark) cho thanh nặng (creaky tone), dấu hỏi (hook above tone mark) cho thanh hỏi (low rising tone), dấu ngã (tilde tone mark) cho thanh ngã (creaky rising tone). Chữ quốc ngữ chuẩn gồm có 17 con chữ phụ âm: b, c, d, đ, g, h, k, l, m, n, p, q, r, s, t, v, x, 12 con chữ nguyên âm: a, ă, â, e, ê, i, o, ô, ơ, u, ư, y, và 5 dấu thanh: huyền, sắc, nặng, hỏi, ngã.
    Người Việt Nam đánh vần, â mờ âm thờ âm thâm sắc thấm để tả cách viết của chữ thấm. Thanh sắc đọc cuối cùng, và thường là nét cuối cùng khi viết. Dấu sắc viết lên trên con chữ nguyên âm â. (Ðúng ra, tuy thanh sắc nằm trên vần âm, nhưng khi viết ta vẫn coi như nằm trên nguyên âm â. Ðiều này có nghĩa là khi viết, việc bỏ dấu sắc lên nguyên âm chỉ là quy ước). Cách đánh vần quôc ngữ như thế cho ta biết người Việt Nam "phân tích" một tiếng theo các con chữ (â, m, t, h, sắc), các con chữ lập thành phần vần (âm), phần phụ âm đầu (th), và cuối cùng là thanh (sắc - high rising). Ðánh vần như thế giúp ta hiểu được cách nói lái, cách tạo từ láy, cách chơi chữ, cách gieo vần trong thơ, v.v. Ðối với người Việt Nam, tiếng, vần và thanh là ba đơn vị quan trọng hơn các con chữ cái và từ. Ta nói, Việt Nam hai tiếng ngọt ngào, nhưng không nói Việt Nam một từ ngọt ngào... Chữ Nôm nói chung sử dụng những âm và tiếng có sẵn trong tiếng Hán-Việt và thay đổi hình dáng của chúng để ghi lại những tiếng có sẵn trong tiếng Việt.
    Ta nói, tiếng Việt có hai cách viết, một cách viết theo chữ quốc ngữ, một cách viết theo chữ Nôm.

    Khái niệm về chuẩn công nghệ thông tin
    Chuẩn công nghệ thông tin là một hệ thống mã (số) biểu thị hệ thống chữ viết dùng để trao đổi thông tin. Máy tính là công cụ chính. Mỗi mã là một con chữ cái trong tiếng Việt chuẩn. Theo chuẩn trao đổi thông tin chữ quốc ngữ TCVN 5712:1993, â và dấu sắc là hai đơn vị chính tả (orthographic units) và mỗi đơn vị có một mã riêng biệt. Một thành tố chính tả (orthographic element), ví dụ như ấ, được tạo bằng hai cách: dùng mã 202 (cơ số 10) (ấ) hoặc dùng hai mã 169 (â) tiếp theo mã dấu kết nối 179 (dấu sắc - acute combining mark). Ta nói, trong chính tả tiếng Việt mã 202 "tương đương" với hai mã 169 và 179. Một điểm cần nhớ là chuẩn thông tin ở mỗi thứ tiếng có khác nhau - do đó chuẩn ISO 8859 La-tinh-1 cho các thứ tiếng Âu châu đặt mã 202 cho con chữ ấ, thay vì ấ trong tiếng Việt.
    Chúng ta "đưa" mã vào bộ nhớ của máy tính bằng cách sao chép hoặc nhấn từ bàn phím (đánh máy chữ). Khi đánh máy, mỗi phím, ví dụ như a, chuyển vào bộ nhớ của máy tính số 97. Và hai phím Shift+a chuyển vào bộ nhớ số 65. Trong máy tính, số 97 chuyển thành ảnh chữ a (bitmap - ma trận bit) phóng lên màn hình và máy in.
    Bộ nhớ (memory) và vận hành (processor) của máy tính cơ bản vẫn nối đuôi nhau (sequential) - ta nói, máy tính vận hành và ghi nhớ có tuyến tính. Ðặc tính này không phải là ngẫu nhiên mà tương tự với ngôn ngữ sống. Hệ thống chuẩn trao đổi thông tin và chuẩn bàn phím trong máy tính cho các loại chữ viết giúp ta hiển thị tiếng Việt đúng, đơn giản và đầy đủ. Ba nguyên tắc này, dựa trên cách ta đánh vần ở trường học, là ba nguyên tắc quan trọng trong việc lập chuẩn chữ Nôm.

    Vài nét về chữ Nôm

    Chữ Nôm là thứ chữ viết được gọi là biểu ý (tiếng Anh, "ideographic") - là thứ chữ ghi lại nghĩa hoặc hình vẽ. Tuy nhiên, không ai có thể xác định: "nghĩa là gì ?"
    Ta nói con dao, tờ giấy, cục đá, nước đá, cái đá, cuộn chỉ, mũi kim, cuốn sách, v.v. trong tiếng Việt thì chữ cái, con, tờ, cục, nước, cuộn, mũi, cuốn, v.v. có thể gọi là nghĩa, nhưng đúng ra phải gọi là những chữ phân loại những chữ kế tiếp (theo một quy ước nào đó của mỗi ngôn ngữ).
    Khi ta nói câu Cho hắn một ... đá, thì tiếng đá chỉ rõ nghĩa khi ta thêm tiếng cái hoặc tiếng hòn vào chỗ ba chấm "...". Khi ta viết hai chữ đá, chữ Nôm và - bộ túc (loại chân) chỉ động từ đá, và bộ thạch (loại đá) để chỉ hòn đá, thì những "bộ" này thật ra cũng chỉ là những ký tự để phân loại, giống như cái và hòn. Nếu "bộ" là để chỉ nghĩa, thì trong chữ Nôm ta không biết nên viết đá trong câu đá lông nheo thành
    theo bộ mịch (loại tơ),
    theo bộ mục (loại mắt),
    theo bộ tiêu (loại tóc), hay
    theo bộ túc (loại chân), v.v.
    Ví dụ trên cho ta thấy, tuy bộ là tiéng phân loại, nhưng hệ thống "bộ" của chữ Hán (như túc, thạch, mịch, mục, tiêu, v.v.) và hệ thống các tiếng phân loại trong tiếng Việt (như cái, con, hòn, mũi, sợi, v.v.) không giống nhau. Suy luận từ đó, lập chuẩn thông tin cho chữ Nôm (có thể nói, kể cả chữ Hán) dựa hệ thống "bộ" chữ Hán (cụ thể theo hệ thống 214 bộ trong Tự điển Khang Hy) không bao giờ đúng và không bao giờ đầy đủ.
    ------------------------------------
    Có khi mưa ngoài trời là giọt nước mắt em.

Chia sẻ trang này