Nếu phản ứng của bạn với sự sụp đổ đã được công bố của Google Reader là hét lên “Nhưng các mục có gắn dấu sao của tôi!”, Thì đây là hướng dẫn dành cho bạn. Đọc tiếp khi chúng tôi hiển thị cho bạn nhiều cách để trích xuất tất cả bài viết được gắn dấu sao của bạn từ Google Reader.
Tại sao tôi muốn làm điều này?
Google Reader sẽ ngừng hoạt động vào ngày 1 tháng 7. Nếu bạn, giống như hàng triệu người hâm mộ RSS trên toàn cầu, là một người hâm mộ của Google Reader, có khả năng bạn đã sử dụng chức năng dấu sao để gắn cờ bài viết để giữ, đọc sau hoặc cho một số mục đích khác.
Nếu bạn muốn yên tâm rằng tất cả các bài viết có gắn dấu sao đó đều an toàn và âm thanh bất chấp sự bùng nổ sắp xảy ra của Google Reader, bạn cần thực hiện một số bước nhỏ để đảm bảo bạn có dữ liệu trong sở hữu của mình và không bị quấy rầy trên Máy chủ Google.
Khi bạn hoàn thành theo hướng dẫn, bạn sẽ có (tối thiểu) một tệp chứa tất cả các mục được gắn dấu sao của bạn và (tùy thuộc vào phân đoạn của hướng dẫn bạn quyết định làm theo) các mục được gắn dấu sao của bạn trong một người dùng nhiều hơn- định dạng thân thiện.
Có một điều không có chút về ma thuật xuất khẩu hoặc tự động hóa có thể giúp, tuy nhiên, điều đó thực sự đang xử lý nội dung của các bài viết được gắn dấu sao. Nếu bạn đã gắn dấu sao các bài viết để đọc sau này trong nhiều năm thì có thể bạn sẽ bị sốc khi có bao nhiêu bài viết được xuất mà quá trình này tạo ra. Bạn có thể chỉ cần dành một chút thời gian mỗi ngày trong một vài tuần để đào qua bit kết xuất một chút.
Xuất dữ liệu Google Reader của bạn bằng Google Takeout
Google Takeout là một công cụ tuyệt vời để trích xuất dữ liệu của bạn từ tất cả các loại dịch vụ của Google, nhưng chúng tôi chỉ quan tâm đến Reader cho hướng dẫn này. Truy cập phần phụ Reader của công cụ Google Takeout tại đây. Sẽ mất một chút thời gian để tính toán kích thước của tệp Takeout. Sau khi hoàn thành, nhấp vào Tạo bản lưu trữ.
Khi hoàn tất, hãy nhấp vào nút Tải xuống xuất hiện ở góc dưới bên phải.
Tiếp tục và giải nén kho lưu trữ vào một thư mục làm việc, chẳng hạn như My Documents, và đặt bản lưu trữ vào một nơi an toàn. Các tệp lưu trữ được sắp xếp như sau:
[email protected]… [email protected] … Reader …. followers.json …. following.json …. liked.json …. notes.json …. shared-by-followers.json …. shared.json …. starred.json …. subscriptions.xml
Có hai loại tệp trong kho lưu trữ: JSON và XML. Các tệp JSON (JavaScript Object Notation) chỉ đơn giản là một loại định dạng trao đổi dữ liệu và các tệp XML (Extensible Markup Language) là một cách tiện dụng để đánh dấu một tài liệu sao cho nó vừa là máy vừa có thể đọc được. Tệp chúng tôi quan tâm nhất đối với hướng dẫn này là tệp starred.json vì tệp chứa tất cả các mục nhập cho các mục được gắn dấu sao của bạn.
Về tầm quan trọng như nhau trong chương trình lớn của giải phóng dữ liệu của bạn từ Google Reader và di chuyển lên đồng cỏ xanh hơn, tuy nhiên, là tập tin subscriptions.xml. Tệp này chứa tất cả các đăng ký RSS của bạn và, nếu bạn muốn nhập tất cả các đăng ký cũ của mình từ Google Reader vào một ứng dụng RSS mới, đây là tệp bạn sẽ sử dụng để làm như vậy. Chắc chắn giữ nó (và bản lưu trữ gốc bạn đã tải xuống từ Google Takeout) ở một nơi an toàn.
Chuyển đổi các mục có gắn dấu sao thành Dấu trang
Cài đặt tiện ích cho trình duyệt tương ứng của bạn và sau đó chỉ cần kéo và thả tệp starred.json vào ngăn trình duyệt mới. Lưu tệp kết quả dưới dạng tài liệu HTML. Sau đó, bạn có thể quay lại ngay và nhập tài liệu HTML vào trình duyệt web mà bạn chọn và nó sẽ nhập tất cả các liên kết dưới dạng dấu trang mới.
Tuy nhiên, có hai nhược điểm đối với kỹ thuật này. Đầu tiên là bạn sẽ kết thúc với một số URL trùng lặp trong tệp dấu trang của mình dưới dạng tên miền / URL nguồn chính của các bài viết bạn thường gắn dấu sao (như nói, các bài viết từ How-To Geek) sẽ xuất hiện nhiều lần. Đó là một chút khó chịu, nhưng không phải là lớn của một thỏa thuận.
Nhược điểm thứ hai là một máy cắt giao dịch cho những người có rất nhiều mặt hàng có gắn sao (những người trong chúng ta với hàng ngàn và hàng ngàn mặt hàng có gắn dấu sao); khi giao dịch với một HTML nhập khẩu thực sự rất lớn, hầu hết thời gian nó chỉ craps ra và không bao giờ kết thúc. Rõ ràng đây là giải pháp không đạt yêu cầu cao đối với người dùng Reader, vì nó không bao giờ kết thúc việc nhập các mục có gắn dấu sao của bạn. Nếu bạn là người dùng có quyền lực và bạn có hàng nghìn mục được gắn dấu sao để giải quyết, hãy nhập chúng dưới dạng dấu trang, sẽ không cắt nó.
Chuyển đổi các mục có gắn dấu sao sang liên kết riêng lẻ (và nhập vào Evernote)
Được phép của Paul Kerchen và Davide Della Casa, hai người dùng Google Reader muốn xuất tất cả các mục cũ của họ, chúng tôi có hai kịch bản Python rất tiện dụng có thể giúp chúng tôi thực hiện một trong hai điều sau: các tài liệu HTML khác biệt và / hoặc 2) nhập tất cả các mục có gắn dấu sao của chúng tôi vào Evernote.
Đối với cả hai thủ thuật, bạn sẽ cần phải cài đặt Python trên hệ thống của mình. Lấy một bản sao của Python cho hệ điều hành của bạn và cài đặt nó trước khi tiếp tục.
Sau khi cài đặt Python, hãy truy cập trang web cho dự án Google Reader Export của Kerchen / Casa và lưu tệp export2HTMLFiles.py và export2enex.py vào cùng thư mục mà bạn đã trích xuất tệp starred.json của mình.
Nếu bạn muốn chuyển đổi tất cả các mục có gắn dấu sao của mình thành các tệp HTML riêng biệt, bạn có thể làm như vậy bằng cách sử dụng export2HTMLFiles.py bằng cách thực hiện lệnh sau trong thư mục chứa tệp starred.json của bạn:
python export2HTMLFiles.py
(Nếu python không được chỉ định làm lệnh toàn hệ thống trên máy của bạn, hãy thay thế "python" bằng đường dẫn đầy đủ sang tệp thực thi python, ví dụ: C: Python2.7 python.exe)
Tùy thuộc vào số lượng mục có gắn dấu sao bạn có, quy trình này có thể mất từ vài giây đến vài phút. Mất khoảng ba phút để trích xuất 12.000 mục có gắn dấu sao trong quá trình thử nghiệm của chúng tôi.
Khi hoàn thành, bạn sẽ có một loạt tệp HTML được đánh số và được đặt tên (ví dụ: 1 bài viết bạn đã gắn dấu sao.html với 10000 bài viết khác mà bạn đã gắn dấu sao.html). Cách dễ nhất để xem tất cả chúng là chỉ cần tải thư mục cục bộ trong trình duyệt web của bạn.
Đây là cách tuyệt vời để giải phóng các mục có gắn dấu sao của bạn khỏi Google Reader và tệp JSON, nhưng như chúng tôi đã đề cập trước đó trong hướng dẫn, nếu bạn đã lưu các bài viết để đọc chúng sau này trong nhiều năm, bạn sẽ có một nhiệm vụ hoành tráng ban tay của bạn.
Một cách bạn có thể quản lý tốt hơn nhiệm vụ này là sử dụng Evernote làm không gian làm việc để sắp xếp, gắn thẻ và có khả năng xóa không còn các mục có gắn dấu sao hữu ích nữa.
Có hai cách bạn có thể đi về việc nhập các mục vào Evernote. Bạn có thể nhập các tệp HTML mà chúng tôi đã tạo một thời điểm trước bằng cách sử dụng Thư mục nhập. Trong máy khách Evernote, bạn có thể vào Tools -> Import Folders và sau đó tạo một thư mục dump cho các tập tin HTML. Chúng tôi đã tạo một thư mục con trong thư mục / Reader / work được gọi là Nhập khẩu và sổ ghi chép mới trong Evernote được gọi là Mục có gắn sao. Bằng cách kéo và thả các tệp HTML vào thư mục / Reader / Imports /, chúng tôi có thể nhập chúng dưới dạng ghi chú riêng biệt trong thư mục Evernote Mục có Gắn dấu sao. Chúng được lưu trữ vĩnh viễn ở đó để được xem xét giải trí của chúng tôi.
Ngoài ra, nếu bạn muốn chuyển đổi tất cả các mục được gắn dấu sao của bạn thành sổ ghi chép Evernote gốc trong một lần hoán đổi, bạn có thể sử dụng tập lệnh Python thứ hai mà bạn đã tải xuống, export2enex.py để làm như vậy. Lợi thế để làm như vậy là nó thực hiện công việc tốt hơn một chút để duy trì định dạng của tài liệu.
Trong thư mục chứa tệp starred.json của bạn, hãy thực hiện lệnh sau:
python export2enex.py > StarredImport.enex
Lấy tập tin kết quả là StarredImport.enex và nhập nó vào máy khách Evernote trên máy tính để bàn của bạn bằng cách sử dụng File -> Import -> Evernote Export Files.
Tại thời điểm này, bạn đã giải phóng các mục có gắn dấu sao của mình, tính tổng thể, từ Google Reader và bạn đã sẵn sàng để tiếp cận công việc kinh doanh (có thể kéo dài) sắp xếp thông qua cọc.
Có cách thông minh để thao tác tệp JSON và trích xuất các mục có gắn dấu sao? Tham gia thảo luận bên dưới và chia sẻ mẹo và thủ thuật của bạn với bạn đọc đồng nghiệp của bạn.