Nhận dạng ký tự quang học (OCR) công nghệ cho phép bạn chỉnh sửa văn bản trong hình ảnh đồ họa hoặc tài liệu được quét. Nó được sử dụng rộng rãi để chuyển đổi sách và tài liệu thành các tệp điện tử, để tin học hóa một hệ thống lưu giữ hồ sơ trong một văn phòng, hoặc để xuất bản văn bản trên một trang web.
OCR làm cho nó có thể chỉnh sửa văn bản, tìm kiếm một từ hoặc cụm từ và áp dụng các kỹ thuật như dịch máy, chuyển văn bản thành giọng nói và khai thác văn bản.
Microsoft Office bao gồm Microsoft Document Imaging OCR, tuy nhiên, một số giải pháp thay thế phần mềm miễn phí khác tồn tại cũng thực hiện công việc, bao gồm phần mềm ứng dụng đi kèm với máy quét hoặc thiết bị tất cả trong một của bạn. Về cơ bản, để quét và sau đó chuyển đổi hình ảnh thành văn bản bằng OCR, bạn cần làm theo các bước chuẩn:
- Đặt tài liệu trên giường máy quét.
- Trên máy tính, sử dụng phần mềm ứng dụng của máy quét và OCR làm loại.
- Chọn khu vực dự định để thực hiện quét OCR và kiểm tra xem trước.
- Quét và sau đó lưu tệp văn bản và bạn có thể chỉnh sửa như vậy trong bất kỳ ứng dụng xử lý văn bản nào.
Bạn cũng có thể chọn cài đặt ứng dụng để thực hiện OCR thay vì chương trình mặc định của máy quét.
FreeOCR có thể quét từ hầu hết các máy quét TWAIN và WIA và cũng có thể mở các ảnh TIFF được quét và ghép nhiều hình ảnh TIFF. OCR miễn phí bao gồm công cụ OCR Tesseract miễn phí do Windows biên dịch còn được gọi là GUI Tesseract. FreeOCR là phần mềm miễn phí, bao gồm cả cho mục đích thương mại. FreeOCR yêu cầu.NET Framework v2.0. FreeOCR v4 sẽ sớm được phát hành.
Có một số dịch vụ trực tuyến miễn phí trên Web cho phép bạn thực hiện một OCR trên một hình ảnh hoặc tài liệu được quét trong trình duyệt của bạn.
- NewOCR.com là dịch vụ OCR trực tuyến miễn phí. NewOCR.com phân tích văn bản trong bất kỳ tệp hình ảnh nào mà bạn tải lên, sau đó chuyển văn bản từ hình ảnh thành văn bản. Dịch vụ này cung cấp cho bạn tải lên không giới hạn và phân tích bố cục (nhận dạng văn bản nhiều cột). Các dịch vụ thân thiện không yêu cầu đăng ký, và hỗ trợ 29 ngôn ngữ, mặc dù trang web là khá cơ bản và nghiệp dư. Dịch vụ này lấy mọi định dạng JPEG, PNG, GIF, BMP và TIFF lên tới 5 MB cũng như ghép các tài liệu PDF lên tới 20 MB.
- Free-OCR.com là một công cụ OCR trực tuyến miễn phí khác. Bạn có thể tải lên các tệp hình ảnh của mình (JPG, GIF, TIFF BMP hoặc PDF) không lớn hơn 2MB, không rộng hơn hoặc cao hơn 5000 pixel và có giới hạn 10 lần tải lên hình ảnh mỗi giờ. Free-OCR có thể xử lý hình ảnh với văn bản nhiều cột và cũng hỗ trợ 29 ngôn ngữ. Một hạn chế duy nhất là nó chỉ lấy trang đầu tiên của một tài liệu PDF trong khi thực hiện OCR.
- Dịch vụ OCR trực tuyến miễn phí cho phép bạn nhận dạng văn bản và ký tự từ tài liệu được quét PDF (bao gồm các tệp nhiều trang), ảnh chụp và hình ảnh được chụp bằng máy ảnh kỹ thuật số. Nó cho phép người dùng chọn 32 ngôn ngữ để nhận ra các tài liệu đa ngôn ngữ và chuyển đổi trực tiếp sang một số định dạng như PDF, DOC, XLS, RTF, HTML và TXT. Bạn có thể chọn để lưu trữ các tập tin OCRed trực tuyến trong không gian làm việc an toàn của bạn, hoặc tải chúng về máy tính của bạn.
Tôi chắc rằng danh sách này không đầy đủ. Tại sao bạn không thêm nhiều dịch vụ và ứng dụng như nhận xét vào bài đăng này, nếu bạn biết thêm gì?