1. Tuyển Mod quản lý diễn đàn. Các thành viên xem chi tiết tại đây

Nhận dạng ký tự từ văn bản giấy và lưu thành file Word

Chủ đề trong 'Hỏi đáp Tin học' bởi Namdinh80, 30/03/2004.

  1. 1 người đang xem box này (Thành viên: 0, Khách: 1)
  1. scouter

    scouter Thành viên mới

    Tham gia ngày:
    08/07/2003
    Bài viết:
    1.565
    Đã được thích:
    0
    Các ngôn ngữ được FineReader 7.0 hỗ trợ​

    1- Các ngôn ngữ chính (FR hỗ trợ luôn cả kiểm tra chính tả và ngữ pháp cho các ngôn ngữ này):

    Armenian (Eastern, Western, Grabar) - ngôn ngữ chính thức của Armenia, còn được sử dụng ở Georgia, Azerbaijan và Nga. Khoảng 7 triệu người sử dụng ngôn ngữ này như tiếng mẹ đẻ.

    Bulgarian - ngôn ngữ xla-vơ, là ngôn ngữ chính thức của CH Bun-ga-ri. Khoảng 9 triệu người dùng ngôn ngữ này.

    Catalan - một ngôn ngữ có nguồn gốc La Mã, là tiếng mẹ đẻ của khoảng 8 triệu người sống ở Tây Ban Nha (các vùng Catalonia, Valencia và Balearic Islands), Pháp (Roussillon và East Pyrenees), Andorra and Sardinia Island.

    Croatian - cũng là một thứ ngôn ngữ xla-vơ. Nó giống y hệt tiếng Serbia, chỉ khác ở một điểm là tiếng Serbian thì dùng hệ cyrillic, còn tiếng Croatian thì dùng hệ la-tinh. Khoảng 5 triệu người dùng tiếng Croatian.

    Czech - ngôn ngữ xla-vơ, là ngôn ngữ chính thức của CH Czech, nó cũng được sử dụng rộng rãi ở Slovakia. Khoảng 12 triệu người dùng ngôn ngữ này.

    Danish - tiếng Đan Mạch, có nguồn gốc xcan-đi-na-vơ, là ngôn ngữ chính thức của Đan Mạch, được sử dụng rộng rãi ở Greenland và quần đảo Faroe. Có 5,5 triệu người dùng.

    Dutch - tiếng Hà Lan, có nguồn gốc german, là ngôn ngữ chính thức của Hà Lan và Bỉ. 20 triệu người sử dụng nó như tiếng mẹ đẻ.

    English - tiếng Anh, cũng có nguồn gốc german. Nó là ngôn ngữ được sử dụng rất rộng rãi trên thế giới, là một trong những ngôn ngữ LHQ sử dụng. Là ngôn ngữ chính thức của Mỹ, Canada, Vương quốc Anh, Ireland (ở đó cả tiếng Irish và tiếng Anh đều là ngôn ngữ chính thức), Australia, New Zealand, Ấn-độ (hiện nay là thế) và 15 nước châu Phi như Nam Phi, Nigeria, Ghana, Uganda... Có khoảng 508 triệu người sử dụng nó như tiếng mẹ đẻ.

    Estonian - có nguồn gốc Phần Lan - Ban-tích (finno-ugric). Là ngôn ngữ chính thức của CH Estonia, 1,1 triệu người sử dụng.

    Finnish - tiếng Phần Lan, cũng có nguồn gốc Phần Lan - Ban-tích (finno-ugric). Ngôn ngữ chính thức của Phần Lan, cũng được sử dụng ở Nga (ở Karelia và St.Petersburg) và Thuỵ Điển, 6 triệu người sử dụng.

    French - tiếng Pháp, có nguồn gốc La Mã. Là ngôn ngữ được LHQ sử dụng; ngôn ngữ chính thức của Pháp, Bỉ, Thụy Sỹ, Luxemburg, Monaco, Andorra, Canada (vùng Québec), Haiti và một số nước châu Phi như Bê-nanh, Cote d''Ivoire, Burkina Faso, Gabon, Guinea, Zaire, Congo, Mali, Niger, Senegal, Togo, Tchad, Burundi, Rwanda, CH Trung Phi, Madagascar, Cameroon, Seychelles, Comoros, Jibuti, Vanuatu (Oceania). Là tiếng mẹ đẻ của 100 triệu người.

    German - tiếng Đức, có nguồn gốc german. Ngôn ngữ chính thức của Đức, Áo, Thuỵ Sỹ, Luxemburg, Bỉ, 128 triệu người sử dụng.

    Greek - tiếng Hy Lạp. Là ngôn ngữ chính thức của Hy Lạp và Đảo Síp (Cyprus), 12 triệu người sử dụng.

    Hungarian - tiếng Hung-ga-ri, có nguồn gốc ugric (uralic). Là ngôn ngữ chính thức của Hungary, ngoài ra còn được sử dụng ở các nước lân cận như Nam Tư (cũ), Áo, Slovakia, Romania, Ukraine, 14,5 triệu người sử dụng.

    Italian - tiếng Ý, có nguồn gốc La Mã. Ngôn ngữ chính thức của Italia, 70 triệu người sử dụng.

    Latvian - là ngôn ngữ vùng Ban-tích. Ngôn ngữ chính thức của Latvia, 2 triệu người sử dụng.

    Lithuanian - tiếng Lit-va (vùng Ban-tích). Ngôn ngữ chính thức của Lithuania, 4 triệu người sử dụng.

    Norwegian - tiếng Na Uy (nynorsk và bokmal), có nguồn gốc xcan-đi-na-vơ. Là ngôn ngữ chính thức của Na Uy. Có 2 dạng: nynorsk và bokmal (cái này thì gần giống tiếng Đan Mạch). Có 5 triệu người sử dụng nó như tiếng mẹ đẻ.

    Polish - tiếng Ba Lan, xuất xứ xla-vơ. Ngôn ngữ chính thức của Ba Lan, 44 triệu người sử dụng.

    Portuguese - tiếng Bồ Đào Nha, có nguồn gốc La Mã. Ngôn ngữ chính thức của Bồ Đào Nha, Brazil, Angola, Mozambique, Guinea-Bissau, Cape Verde, Sao Tome and Principe. Có 191 triệu người sử dụng.

    Romanian - tiếng Ru-ma-ni, có nguồn gốc La Mã. Là ngôn ngữ chính thức của Romania. 26 triệu người sử dụng.

    Russian - tiếng Nga, có nguồn gốc xla-vơ, là ngôn ngữ được LHQ sử dụng. Ngôn ngữ chính thức của LB Nga, sử dụng rộng rãi ở các nước Liên xô cũ, khoảng 277 người sử dụng như tiếng mẹ đẻ.

    Slovak - có nguồn gốc xla-vơ. Là ngôn ngữ chính thức của Slovakia, cũng được sử dụng ở các nước lân cận như Hungary, Romania và Ukraine. 5,6 triệu người sử dụng.

    Spanish - tiếng Tây Ban Nha, có nguồn gốc La Mã. Là ngôn ngữ chính thức của Tây Ban Nha, tất cả các nước Mỹ-Latin (trừ Brazil) và Equatorial Guinea. Được LHQ sử dụng làm một trong các ngôn ngữ chính. Là tiếng mẹ đẻ của 417 triệu người.

    Swedish - tiếng Thuỵ Điển, có nguồn gốc xcan-đi-na-vơ. Là ngôn ngữ chính thức của Thuỵ Điển và Phần Lan, 11 triệu người sử dụng.

    Tatar - tiếng Tác-ta, có nguồn gốc Thổ Nhĩ Kỳ. Được sử dụng ở Nga (các vùng Tatarstan, Bashkir, Chuvashiya, Mari El...). Có 7 triệu người sử dụng.

    Turkish - tiếng Thổ Nhĩ Kỳ. Là ngôn ngữ chính thức của Thổ Nhĩ Kỳ và Đảo Síp (Cyprus), cũng được dùng ở Hy Lạp, Bulgaria, Romania, Iran và Iraq. 61 triệu người sử dụng.

    Ukrainian - có nguồn gốc xla-vơ. Là ngôn ngữ chính thức của Ukraine, ngoài ra còn được sử dụng ở Nga và Belarus. 47 triệu người sử dụng.
  2. scouter

    scouter Thành viên mới

    Tham gia ngày:
    08/07/2003
    Bài viết:
    1.565
    Đã được thích:
    0
    Các ngôn ngữ được FineReader 7.0 hỗ trợ
    (tiếp theo và hết)​
    2- Các ngôn ngữ phụ:
    Gồm có hơn 100 ngôn ngữ chính thức và thổ ngữ khác nhau. Đáng tiếc là cho đến nay (phiên bản 7.0) FineReader vẫn chưa hỗ trợ tiếng Việt (có lẽ do chưa thống nhất bảng mã).
    3- Các ngôn ngữ nhân tạo:

    Esperanto - đây là ngôn ngữ nhân tạo phổ biến nhất, được L.L.Zamenhoff sáng tạo và giới thiệu vào năm 1887. Được khoảng 100 nghìn người sử dụng tại 33 nước trên khắp thế giới.

    Interlingua - quốc tế ngữ, được biết đến từ năm 1903 do nhà toán học nổi tiếng Giuseppe Peano sáng tạo, đến giữa thế kỷ 20 được nhà ngôn ngữ học A. Gode phát triển.

    Ido - được L. de Beaufront đưa ra năm 1907. Đây là một phiên bản cải tiến của Esperanto, thế nhưng nó chưa bao giờ được sử dụng rộng rãi.

    Occidental - được A. Wale sáng tạo và giới thiệu vào năm 1921-1922, nó chưa được sử dụng rộng rãi.
    4- Các ngôn ngữ lập trình, công thức:

    Basic - ngôn ngữ lập trình BASIC (Beginners All-purpose Symbolic Instruction Code), được hai giáo sư trường Dartmouth college ở New Hampshire (Mỹ) sáng tạo và phát triển vào thập kỷ 1960.

    C/C++ - ngôn ngữ lập trình, được Dennis M. Ritchie - một lập trình viên mạng của "AT&T Bell Laboratories" sáng tạo và phát triển từ năm 1972.

    COBOL - ngôn ngữ lập trình COBOL (Common Business-Oriented Language), được Bộ Quốc phòng Mỹ phát triển vào năm 1959.

    Fortran - ngôn ngữ lập trình FORTRAN (FORmula TRANslator), được IBM phát triển từ giữ thập niên 1950.

    JAVA - ngôn ngữ lập trình Java, được phát triển từ ngôn ngữ lập trình Oak, được Sun Microsystems giới thiệu vào năm 1995. Java được sử dụng để viết các chương trình sử dụng trên Internet.

    Pascal - ngôn ngữ lập trình Pascal, được đặt theo tên của nhà toán học, nhà triết học nổi tiếng người Pháp Blaise Pascal, được Niklaus Wirth (trường Federal Institute of Technology, Zurich, Thuỵ Sỹ) sáng tạo và phát triển vào cuối thập niên 1960.

    Các công thức hoá học đơn giản - thí dụ như H2O, C2H5OH.
  3. scouter

    scouter Thành viên mới

    Tham gia ngày:
    08/07/2003
    Bài viết:
    1.565
    Đã được thích:
    0
    Fine Reader 7.0: Các dạng file nhập/xuất được FR hỗ trợ​
    Các định dạng tệp tin hình ảnh FR đọc được:

    BMP: black and white, gray, color

    PCX, DCX: black and white, gray, color

    JPEG: gray, color

    JPEG 2000: gray, color

    PNG: black and white, gray, color

    TIFF: black and white, gray, color, multi-image. Methods of compression: Unpacked, CCITT Group 3, CCITT Group 3 FAX(2D), CCITT Group4, PackBits, JPEG, ZIP

    PDF
    Các định dạng tệp tin FR hỗ trợ để lưu/xuất bản kết quả nhận dạng:

    Microsoft Word 2003/XP/2000/97/95

    Microsoft Excel 2003/XP/2000/97/95

    Microsoft PowerPoint 2003/XP

    Rich Text Format

    Text, Unicode Text

    HTML, Unicode HTML

    DBF, CSV, Unicode CSV

    PDF (Text and pictures only, page image only, text over the page image, text under the page image)

    Microsoft Word 2003 XML
    Các bạn có thể tìm hiểu thêm thông tin chi tiết trên trang chủ của ABBYY. Bạn nào muốn dùng thử thì hãy download ở ĐÂY.
    [​IMG]

    À, còn nữa, tớ dặn luôn là các bạn đừng mất công tìm crack làm gì, có tìm được thì cũng chỉ sử dụng được một thời gian thôi rồi nó vẫn tèo như thường.
    Được scouter sửa chữa / chuyển vào 04:21 ngày 19/05/2004

Chia sẻ trang này