1. Tuyển Mod quản lý diễn đàn. Các thành viên xem chi tiết tại đây

Nhận dạng ký tự từ văn bản giấy và lưu thành file Word

Chủ đề trong 'Hỏi đáp Tin học' bởi Namdinh80, 30/03/2004.

  1. 1 người đang xem box này (Thành viên: 0, Khách: 1)
  1. Namdinh80

    Namdinh80 Thành viên gắn bó với ttvnol.com

    Tham gia ngày:
    26/02/2003
    Bài viết:
    6.248
    Đã được thích:
    2.696
    Nhận dạng ký tự từ văn bản giấy và lưu thành file Word

    Bác nào cho em hỏi mình có thể scan những trang tài liệu mình cần (Không có file) thành những file và quan trọng là, dùng một phần mềm nào đó chuyển thành Word để chỉnh sửa không ạ?
    Hoặc có cái gì làm tương tự thế cũng được. Miễn là làm không khó lắm. Thanks các bác trước nhá!

    ...Có chăng chừa rượu với chừa trà.
  2. dmat

    dmat Thành viên mới

    Tham gia ngày:
    30/01/2004
    Bài viết:
    641
    Đã được thích:
    0
    Có rất nhiều chương trình. Ví dụ Dùng VnDoc... nhận dạng tiếng việt. PDF2DOC,... nói chung là mình không nhớ chính xác tên của chương trình. Nhưng bạn cứ vào google.com rồi tìm chắc chắn có.
    Quá khứ ở sau lưngTương lai ở trước mặtCuộc sống là sự đối mặtSống là chiến đấu
    Mạnh mẽ lên emEm sẽ vượt qua tất cảNhưng em không đơn độcEm không chỉ có một mìnhBên em có mọi người !
    Những người luôn mong những điều tốt nhất cho em...!
  3. the_sound_of_heart

    the_sound_of_heart Thành viên mới Đang bị khóa

    Tham gia ngày:
    29/03/2004
    Bài viết:
    155
    Đã được thích:
    0
    Trước đây em có mua hộ bác em một cái máy quét Epson 2400P (2400dpi, 48bit color, Scanfilm, USB), và được họ khuyến mãi một chương trình có tên VNDOC2.5 bản demo. Chương trình này chuyên dùng để nhận dạng chữ viết, nó thoả mãn yêu cầu của anh Namdinh80 là scan tài liệu vào và nhận dạng ra văn bản. Nhưng em thấy dùng nó rất chán. Nó chỉ nhận dạng được những trang nào giấy trắng như trứng gà bóc , còn không thì chịu. Tiếng Anh thì tỉ lệ đúng là 70%~85%, còn tiếng Việt thì rất tệ , báo hại em mất uy tín quá đi. Sau đó đến hỏi thì kĩ thuật viên họ bảo phải mua bản VNDOC Plus thì mới tốt hơn, giá 8tr (!?) (mà em mua cái máy scan có 242$).
    Còn nếu dùng phần mềm nhận dạng tiếng Anh không thôi, đi kèm theo máy thì rất ấn tượng đấy ạ.
  4. Namdinh80

    Namdinh80 Thành viên gắn bó với ttvnol.com

    Tham gia ngày:
    26/02/2003
    Bài viết:
    6.248
    Đã được thích:
    2.696
    Thanks các bạn vì đã cung cấp thông tin giúp đỡ. Xem ra với nhận dạng tiếng Việt thì chưa khả thi, nhờ?
    (Vote cho 2 bạn 5 star). Nhà hơi nhiều sao
    ...Có chăng chừa rượu với chừa trà.
  5. cdrom1006

    cdrom1006 Thành viên quen thuộc

    Tham gia ngày:
    10/05/2002
    Bài viết:
    155
    Đã được thích:
    0
    Em cũng không rõ lắm nhưng hình như có phần mền Acrobat Reader phiên bản mới nhất có thể cho phép bác làm chuyện đó. Nhưng có chuyển thành File Word được hay không thì em cũng không biết!
    ....
    Nhưng phiên bản mới này thì mất tiền bác ạ!
    Chúc bác thành công.
    Nếu ai nhất thì tôi nhì,
    Còn ai hơn nữa thì tôi thứ ba.
  6. Namdinh80

    Namdinh80 Thành viên gắn bó với ttvnol.com

    Tham gia ngày:
    26/02/2003
    Bài viết:
    6.248
    Đã được thích:
    2.696
    Xin hỏi câu nữa ạ.
    Em có mấy dòng chữ nhưng là file pdf (Acrobat).
    Làm sao đưa sang file ảnh được nhỉ? Để up làm chữ ký ấy ạ.
  7. co_be_mat_tron_xoe

    co_be_mat_tron_xoe Thành viên mới

    Tham gia ngày:
    06/04/2004
    Bài viết:
    65
    Đã được thích:
    0
    Chào bạn.
    Cách đơn giản nhất để giải quyết chuyện của bạn, đó là resize đúng cỡ màn hình rồi nhấn phím PrintScreen. Sau đó bạn vào một chương trình xử lí ảnh nào đó (e.g: MsPaint) rồi nhấn Paste/Ctrl+V. Rồi bạn tuỳ biến thêm, sau đó nhớ Save As...*.jpg nhé!
    Chúc bạn sớm có một chữ kí đặc trưng của riêng mình.
  8. scouter

    scouter Thành viên mới

    Tham gia ngày:
    08/07/2003
    Bài viết:
    1.565
    Đã được thích:
    0
    Có một phần mềm cực hay do Nga sản xuất, tôi đang nghỉ phép nhưng thấy có người cần đến nó nên lên tiếng một chút. Bây giờ tôi đang vội vì có một cuộc hẹn vô cùng quan trọng, tối nay tôi sẽ post bài về phần mềm này cùng với link download bản demo (tôi có bản xịn đang cất ở trong tủ).
  9. scouter

    scouter Thành viên mới

    Tham gia ngày:
    08/07/2003
    Bài viết:
    1.565
    Đã được thích:
    0
    ABBYY FineReader 7.0
    [​IMG]
    Nhà sản xuất: ABBYY Software House (LB Nga)
    Website: www.abbyy.ru www.abbyy.com
    Thông tin về sản phẩm FineReader: www.abbyy.com/finereader
    Hỗ trợ: support@abbyy.com
    ABBYY FineReader là phần mềm nhận dạng ký tự cực đỉnh đã từng được nhận nhiều giải thưởng khác nhau. Chức năng chính của nó là nhận dạng ký tự từ trang giấy rồi chuyển thành các loại file văn bản khác nhau, kể cả file PDF.
    Độ chính xác của ký tự được nhận dạng bằng ABBYY FineReader rất cao (kinh nghiệm sử dụng của scouter cho thấy là trên 90%) và giữ nguyên format của văn bản gốc.
    Có thể nói ABBYY FineReader là giải pháp tốt nhất và nhanh nhất cho phép ta chuyển đổi văn bản từ các nguồn khác nhau như văn bản giấy, cá file hình ảnh và file PDF.
    Hiện nay trên thị trường có khá nhiều một phần mềm nhận dạng ký tự bởi vì đó là sản phẩm tối cần thiết đối với hoạt động văn phòng. Về nguyên lý hoạt động thì các sản phẩm của các hãng đều có nét giống nhau, nhưng chúng khác nhau ở chất lượng làm việc, các chức năng và sự thuận tiện trong sử dụng. ABBYY FineReader có độ chính xác rất cao, giữ nguyên định dạng của văn bản gốc. Thậm chí nó còn có thể nhận dạng những ký tự bị xiêu vẹo hay mờ, nhoè do photocopy, scan, chụp... Với FineReader, các văn bản có bảng, cột, bullet, có hình ảnh và sử dụng một lúc nhiều phông chữ đều được giữ nguyên định dạng. FineReader có khả năng tích hợp cao với các chương trình khác. Phiên bản FineReader mới nhất là FineReader 7.0 tương thích hoàn toàn với Microsoft Office Word 2003 và có khả năng xuất dữ liệu ra dạng XML (Extended Markup Language). Khi làm việc với FR, ta có thể xuất thẳng dữ liệu sang MS Word và soạn thảo/chỉnh sửa ngay (mà không cần phải lưu kết quả định dạng trong FR rồi mở ra bằng Word). Ngay bản thân FR với WYSIWYG Text E***or cũng cho phép ta soạn thảo/chỉnh sửa ngay trong chương trình. Ngoài ra, tính năng hỗ trợ PDF Input/Output cho phép ta nhận dạng ký tự từ file Acrobat Portable Document Format (PDF) và/hoặc xuất bản kết quả nhận dạng thành file PDF. ABBYY FineReader hỗ trợ xuất dữ liệu sang tất cả các chuẩn của file PDF (text and pictures only, text over image, text under image, and image only). Có tất cả 6 options ta có thể lựa chọn khi lưu dữ liệu từ FR thành file PDF.
    Một trong tính năng nổi bật nhất khiến cho PDF có khả năng đánh bại các phần mềm OCR khác chính là khả năng nhận dạng ký tự đa ngôn ngữ. FR 7.0 hỗ trợ 177 ngôn ngữ khác nhau, có khả năng kiểm tra chính tả (built-in spell check) 34 ngôn ngữ. Tính năng tuyệt vời này làm đơn giản hoá quá trình nhận dạng, nhất là khi ta phải làm việc với những văn bản được trình bày bằng nhiều ngôn ngữ khác nhau. Thậm chí, nó còn có sẵn từ điển chuyên ngành Luật và Y cho tiếng Anh và tiếng Đức, làm tăng cao tính chính xác khi nhận dạng những văn bản chuyên môn ngành Luật và Y học.
    Với FR, ta có thể xuất dữ liệu sang các chương trình như Microsoft Word, Microsoft Excel, Microsoft PowerPoint, Lotus Word Pro, Corel WordPerfect, and Sun StarWriter. FineReader cho phép ta lưu giữ kết quả nhận dạng thành các định dạng file PDF , HTML, Microsoft Word XML, DOC, RTF, XLS, PPT, DBF, CSV, và TXT.
    Còn gì nữa nhỉ? À, Barcode Recognition. FineReader 7.0 hỗ trợ nhận dạng barcode, kể cả PDF-417 2D barcodes.
    Sơ sơ là vậy, các bạn có thể tìm hiểu thêm thông tin trên trang chủ của ABBYY. Bạn muốn dùng thử thì hãy download ở ĐÂY.
    [​IMG]
    Được scouter sửa chữa / chuyển vào 23:48 ngày 18/05/2004
  10. scouter

    scouter Thành viên mới

    Tham gia ngày:
    08/07/2003
    Bài viết:
    1.565
    Đã được thích:
    0
    Cấu hình yêu cầu của FineReader 7.0​

    Intel Pentium/Celeron/ Xeon, AMD K6/Athlon/Duron 200 MHz trở lên

    Hệ điều hành Microsoft Windows XP, Windows 2000, Windows NT 4.0 có Service Pack 6 trở lên, Windows Me/98 (ABBYY có bản FineReader 7.0 dành riêng cho hệ điều hành Mac)

    64 MB RAM (Windows XP/2000/NT 4.0) hoặc 32 MB RAM (Windows Me/98)
    220 MB chỗ trống trong ổ cứng

    Máy scanner tương thích chuẩn TWAIN (hoặc máy ảnh, máy fax)

    Card màn hình Super VGA (800x600)
    Được scouter sửa chữa / chuyển vào 03:17 ngày 19/05/2004

Chia sẻ trang này