Làm thế nào để chuyển đổi một tập tin PDF để chỉnh sửa văn bản bằng cách sử dụng dòng lệnh trong Linux

Làm thế nào để chuyển đổi một tập tin PDF để chỉnh sửa văn bản bằng cách sử dụng dòng lệnh trong Linux
Làm thế nào để chuyển đổi một tập tin PDF để chỉnh sửa văn bản bằng cách sử dụng dòng lệnh trong Linux

Video: Làm thế nào để chuyển đổi một tập tin PDF để chỉnh sửa văn bản bằng cách sử dụng dòng lệnh trong Linux

Video: Làm thế nào để chuyển đổi một tập tin PDF để chỉnh sửa văn bản bằng cách sử dụng dòng lệnh trong Linux
Video: 07 mẹo tuyệt vời trên MacBook/MacOS! - YouTube 2024, Tháng tư
Anonim
Có nhiều lý do tại sao bạn có thể muốn chuyển đổi tệp PDF thành văn bản có thể chỉnh sửa. Có lẽ bạn cần phải sửa đổi một tài liệu cũ và tất cả những gì bạn có là phiên bản PDF của nó. Chuyển đổi tệp PDF trong Windows thật dễ dàng, nhưng nếu bạn đang sử dụng Linux thì sao?
Có nhiều lý do tại sao bạn có thể muốn chuyển đổi tệp PDF thành văn bản có thể chỉnh sửa. Có lẽ bạn cần phải sửa đổi một tài liệu cũ và tất cả những gì bạn có là phiên bản PDF của nó. Chuyển đổi tệp PDF trong Windows thật dễ dàng, nhưng nếu bạn đang sử dụng Linux thì sao?

Đừng lo lắng. Chúng tôi sẽ chỉ cho bạn cách dễ dàng chuyển đổi tệp PDF thành văn bản có thể chỉnh sửa bằng cách sử dụng công cụ dòng lệnh có tên pdftotext, đó là một phần của gói "poppler-utils". Công cụ này có thể đã được cài đặt. Để kiểm tra xem pdftotext có được cài đặt trên hệ thống của bạn hay không, nhấn “Ctrl + Alt + T” để mở cửa sổ dòng lệnh. Gõ lệnh sau tại dấu nhắc và nhấn "Enter".

dpkg –s poppler-utils

LƯU Ý: Khi chúng ta nói để gõ một cái gì đó trong bài viết này và có dấu ngoặc kép xung quanh văn bản, KHÔNG gõ dấu ngoặc kép, trừ khi chúng tôi chỉ định khác.

Nếu pdftotext không được cài đặt, gõ lệnh sau tại dấu nhắc và nhấn "Enter".
Nếu pdftotext không được cài đặt, gõ lệnh sau tại dấu nhắc và nhấn "Enter".

sudo apt-get install poppler-utils

Nhập mật khẩu của bạn khi được nhắc và nhấn “Enter”.

Có một số công cụ có sẵn trong gói poppler-utils để chuyển đổi PDF sang các định dạng khác nhau, thao tác các tệp PDF và trích xuất thông tin từ các tệp.
Có một số công cụ có sẵn trong gói poppler-utils để chuyển đổi PDF sang các định dạng khác nhau, thao tác các tệp PDF và trích xuất thông tin từ các tệp.
Sau đây là lệnh cơ bản để chuyển đổi tệp PDF thành tệp văn bản có thể chỉnh sửa. Nhấn “Ctrl + Alt + T” để mở cửa sổ Terminal, gõ lệnh tại dấu nhắc và nhấn “Enter”.
Sau đây là lệnh cơ bản để chuyển đổi tệp PDF thành tệp văn bản có thể chỉnh sửa. Nhấn “Ctrl + Alt + T” để mở cửa sổ Terminal, gõ lệnh tại dấu nhắc và nhấn “Enter”.

pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Thay đổi đường dẫn đến từng tệp tương ứng với vị trí và tên của tệp PDF gốc của bạn và nơi bạn muốn lưu tệp văn bản kết quả. Ngoài ra, thay đổi tên tệp để tương ứng với tên tệp của bạn.

Tệp văn bản được tạo và có thể được mở giống như khi bạn mở bất kỳ tệp văn bản nào khác trong Linux.
Tệp văn bản được tạo và có thể được mở giống như khi bạn mở bất kỳ tệp văn bản nào khác trong Linux.
Văn bản được chuyển đổi có thể có ngắt dòng ở những nơi bạn không muốn. Ngắt dòng được chèn sau mỗi dòng văn bản trong tệp PDF.
Văn bản được chuyển đổi có thể có ngắt dòng ở những nơi bạn không muốn. Ngắt dòng được chèn sau mỗi dòng văn bản trong tệp PDF.

pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Nếu bạn chỉ muốn chuyển đổi một loạt các trang trong một tệp PDF, hãy sử dụng cờ “-f” và “-l” (chữ thường “L”) để chỉ định trang đầu tiên và trang cuối cùng trong phạm vi bạn muốn chuyển đổi.
Nếu bạn chỉ muốn chuyển đổi một loạt các trang trong một tệp PDF, hãy sử dụng cờ “-f” và “-l” (chữ thường “L”) để chỉ định trang đầu tiên và trang cuối cùng trong phạm vi bạn muốn chuyển đổi.

pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Để chuyển đổi tệp PDF được bảo vệ và mã hóa bằng mật khẩu chủ sở hữu, hãy sử dụng cờ “-opw” (ký tự đầu tiên trong cờ là chữ thường “O”, không phải là số không).
Để chuyển đổi tệp PDF được bảo vệ và mã hóa bằng mật khẩu chủ sở hữu, hãy sử dụng cờ “-opw” (ký tự đầu tiên trong cờ là chữ thường “O”, không phải là số không).

pdftotext -opw ‘password’ /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Thay đổi "mật khẩu" thành mật khẩu được sử dụng để bảo vệ tệp PDF gốc đang được chuyển đổi. Đảm bảo có dấu nháy đơn, không phải gấp đôi, xung quanh “mật khẩu”.

Nếu tệp PDF được bảo vệ và mã hóa bằng mật khẩu người dùng, hãy sử dụng cờ “-upw” thay vì cờ “-opw”. Phần còn lại của lệnh là như nhau.
Nếu tệp PDF được bảo vệ và mã hóa bằng mật khẩu người dùng, hãy sử dụng cờ “-upw” thay vì cờ “-opw”. Phần còn lại của lệnh là như nhau.
Bạn cũng có thể chỉ định loại ký tự cuối dòng được áp dụng cho văn bản được chuyển đổi. Điều này đặc biệt hữu ích nếu bạn định truy cập tệp trên một hệ điều hành khác như Windows hoặc Mac. Để thực hiện điều này, hãy sử dụng cờ “-eol” (ký tự ở giữa trong cờ là chữ thường “O”, không phải là số không) theo sau là dấu cách và loại ký tự cuối dòng bạn muốn sử dụng (“unix”,“dos”hoặc“mac”).
Bạn cũng có thể chỉ định loại ký tự cuối dòng được áp dụng cho văn bản được chuyển đổi. Điều này đặc biệt hữu ích nếu bạn định truy cập tệp trên một hệ điều hành khác như Windows hoặc Mac. Để thực hiện điều này, hãy sử dụng cờ “-eol” (ký tự ở giữa trong cờ là chữ thường “O”, không phải là số không) theo sau là dấu cách và loại ký tự cuối dòng bạn muốn sử dụng (“unix”,“dos”hoặc“mac”).
LƯU Ý: Nếu bạn không chỉ định tên tệp cho tệp văn bản, pdftotext sẽ tự động sử dụng cơ sở của tên tệp PDF và thêm phần mở rộng ".txt". Ví dụ: “file.pdf” sẽ được chuyển thành “file.txt”. Nếu tệp văn bản được chỉ định là “-“, văn bản được chuyển đổi sẽ được gửi tới stdout, có nghĩa là văn bản được hiển thị trong cửa sổ Terminal và không được lưu vào một tệp.
LƯU Ý: Nếu bạn không chỉ định tên tệp cho tệp văn bản, pdftotext sẽ tự động sử dụng cơ sở của tên tệp PDF và thêm phần mở rộng ".txt". Ví dụ: “file.pdf” sẽ được chuyển thành “file.txt”. Nếu tệp văn bản được chỉ định là “-“, văn bản được chuyển đổi sẽ được gửi tới stdout, có nghĩa là văn bản được hiển thị trong cửa sổ Terminal và không được lưu vào một tệp.

Để đóng cửa sổ Terminal, nhấp vào nút “X” ở góc trên bên trái.

Để biết thêm thông tin về lệnh pdftotext, gõ "man page pdftotext" tại dấu nhắc trong cửa sổ Terminal.

Đề xuất: