1. Tuyển Mod quản lý diễn đàn. Các thành viên xem chi tiết tại đây

Làm sao gõ theo font Unicode UTF8 ?

Chủ đề trong 'Hỏi đáp Tin học' bởi hookeba, 11/01/2003.

  1. 1 người đang xem box này (Thành viên: 0, Khách: 1)
  1. hookeba

    hookeba Thành viên mới

    Tham gia ngày:
    24/10/2002
    Bài viết:
    57
    Đã được thích:
    0
    Làm sao gõ theo font Unicode UTF8 ?

    Có ai biết chỉ cho mình với ?

    Không có người dở, chỉ có người không biết tự vươn lên.
  2. sonkgnc

    sonkgnc Thành viên mới

    Tham gia ngày:
    16/12/2002
    Bài viết:
    57
    Đã được thích:
    0
    Bạn nói rõ hơn được không?!
    Nếu chỉ đơn thuần gõ tiếng Việt trong trang web thì bạn chuyển mã sang Unicode với việc sử dụng bộ gõ VietKey hoặc UniKey.

    Người lang thang trong mạng
  3. hookeba

    hookeba Thành viên mới

    Tham gia ngày:
    24/10/2002
    Bài viết:
    57
    Đã được thích:
    0
    Tức là sau khi bật Vietkey lên, chọn mã Unicode UTF8, rồi vào một trình soạn thảo (Word chẳng hạn) rồi chọn font nào để đánh ra tiếng Việt ?
    Không có người dở, chỉ có người không biết tự vươn lên.
  4. thainhi_vn

    thainhi_vn Thành viên rất tích cực

    Tham gia ngày:
    12/02/2002
    Bài viết:
    1.448
    Đã được thích:
    1
    HÌnh như nếu đã dùng Unicode thì font nào có hỗ trợ Unicode là "chơi" được
  5. hookeba

    hookeba Thành viên mới

    Tham gia ngày:
    24/10/2002
    Bài viết:
    57
    Đã được thích:
    0
    Cụ thể là font nào ?
    Không có người dở, chỉ có người không biết tự vươn lên.
  6. thainhi_vn

    thainhi_vn Thành viên rất tích cực

    Tham gia ngày:
    12/02/2002
    Bài viết:
    1.448
    Đã được thích:
    1
    Nh?° Time New Roman chẳng hạn (go bang UTF-8)
  7. paingod

    paingod Thành viên rất tích cực

    Tham gia ngày:
    23/07/2001
    Bài viết:
    3.274
    Đã được thích:
    0
    Nếu bạn đánh văn bản word chẳng hạn bạn có thể vào mục bảng mã chọn TCVN3
    mã 15 ABC(.vntime)
    ko nên quá cầu kì
  8. Madking

    Madking Thành viên rất tích cực

    Tham gia ngày:
    08/01/2002
    Bài viết:
    2.395
    Đã được thích:
    0
    Cũng nên cầu kỳ đấy. UNICODE là chuẩn quốc tế rồi bác ạ. Nếu dùng net thì càng phải biết cái bé Unicode này. Phải "chuyển dịch cơ cấu" dần đi chứ miền bắc thì "chuyên" ABC, miền nam "chuyên" VNI thì lằng nhằng lắm.
    Font Unicode có Arial, Tahoma, Time New Roman, Ms San Srerif.... Mà bác cứ gõ thử các loại font bằng bộ Unicode đi, cái nào đọc được ngon lành thì nó là unicode (nhớ là viết nhiều nhiều lên chút nhé)
    [​IMG]Một mình lang thang trên đất này. . .
  9. thainhi_vn

    thainhi_vn Thành viên rất tích cực

    Tham gia ngày:
    12/02/2002
    Bài viết:
    1.448
    Đã được thích:
    1
    Madking nói đúng đó! UNICODE đã trở thành chuẩn quốc tế mà VN cũng đã tham gia. Chuẩn UNICODE (Phần của Việt Nam là TCVN 6909:2001) được áp dụng ở Việt Nam kể từ 01/01/2003. Các bài về chủ đề UNICODE cũng đã đăng nhiều trên box "Thảo luận chung về Công nghệ thông tin" rồi.
    Về UTF-8, đây là dạng mã hóa của UNICODE để tương thích với hệ xử lý 8 bit (UNICODE vốn là 16 bit trở lên). Dưới đây là phần trích tham khảo của tài liệu tập huấn UNICODE của Ban chỉ đạo 58, đoạn nói về UTF-8.
    "
    Định dạng biến đổi tập ký tự Unicode UTF

    Các định dạng biến đổii Tập ký tự Unicode (UTF) thực hiện biến đổi mỗi giá trị Unicode thành một dãy giá trị mã duy nhất. Một UTF có thể xác định một thứ tự byte cho việc tuần tự hóa các giá trị mã trong byte. UTF cũng có thể xác định việc dùng dấu thứ tự byte (Byte Order Mark - BOM). Unicode định nghĩa ra các định dạng biến đổi Tập ký tự là UTF-8, UTF-16, UTF-16LE, UTF-16BE, UTF-32.
    UTF-8 là định dạng biến đổi Unicode làm tuần tự hóa một giá trị Unicode thành một dãy có từ một tới bốn byte. Đây là việc mã hóa chiều dài thay đổi bảo toàn tính trong suốt ASCII để đáp ứng cho yêu cầu của các hệ thống hướng byte, dựa trên ASCII. Nói cách khác, cách mã hóa này để nhằm tương hợp với các hệ thống xử lý mã hóa 8 bit đã có từ trước.
    Bảng sau liệt kê tất cả các dãy byte hợp lệ trong UTF-8.
    điểm mã Byte 1 Byte 2 Byte 3 Byte 4
    U+0000..U+007F 00..7F
    U+0080..U+07FF C2..DF 80..BF
    U+0800..U+0FFF E0 A0..BF 80..BF
    U+1000..U+FFFF E1..EF 80..BF 80..BF
    U+10000..U+3FFFF F0 90..BF 80..BF 80..BF
    U+40000..U+FFFFF F1..F3 80..BF 80..BF 80..BF
    U+100000..U+10FFFF F4 80..8F 80..BF 80..BF
    Chi tiết về định dạng UTF-8
    0x00..0x7F ==> 1 byte
    0x80..0x3FF ==> 2 byte
    0x400..0xD7FF, 0xE000..0xFFFF ==> 3 byte
    0x10000..0x10FFFF ==> 4 byte."
    Có thể nói nếu bạn sử dụng font UNICODE và sử dụng "bảng mã" UTF-8 thì bộ gõ sẽ tự động mã hóa dùm bạn. Bạn không cần phải băn khoăn về "vấn đề" font UTF-8.
    Các ký tự thuần Việt chủ yếu mã hóa 2 byte, hiếm có ký tự mã hóa 3 byte, 4 byte thì không có chữ nào.
    Thêm: 6 font UNICODE chuẩn được sử dụng là Arial, Courier, Platino Linotype, Tahoma, Time New Roman và Verdana

Chia sẻ trang này