網頁備份工具的使用時機

網頁備份工具最為人知的使用時機有兩點分別是「備份」跟「還原」。「備份」這點不用說,就是先備份可能消失的網頁資料。

而「還原」則是利用前人的備份,還原到網址過去的時間點,例如我想看某網頁是否經過編輯,或是我手上的資料是否是最原始的,又或我手上握有的網址已是404、網頁不存在,如果它曾經被備份過,我就能透過備份工具回到它被刪除前的時間點。

另一個我自己愛用備份工具的時機,是透過備份工具來檢視某些限制網域的網址。例如在台灣是無法檢視俄國國防部網站的,但由於備份網站的主機在其它未受限制的國家因此你可以透過立即備份網頁來檢視俄國國防部網站。(其實這一點可以靠VPN克服,但如果你沒有VPN,可以試著這麼做。)

關於備份頁面中的連結

大部份的備份工具都是備份那個網址對應的網頁,即使你的網址是.jpg或.pdf,都可備份到,但這不代表網頁中的連結網址所導向的網頁會被備份到。

舉例來說,在2024年的今天,網頁A上有一個PDF檔案B供人下載,我想確認2023年該網頁內容是否與今天相同,我要確認什麼?

從這個例子中我們至少有網頁A的連結,以及檔案B的連結,我們用「’」來表示備份的頁面,大部分人都會知道要比較A與A’是否相同,也會比較B與B’的內容,但如果只停在這裡,你會漏掉去確認A’與B’的關係

因為我們是在2024年的網頁A中得到檔案B的連結,但你能確認2023年A’中所提供的連結是指向B的連結嗎?有沒有可能A’所提供的連結根本不是B的連結呢?這是我在過去確實遇過的事件。因此我們比較A與A’時,不能只是匆匆看了外觀,也要去看A’中供人點擊的檔案連結是否真的與B連結相同。

補充與注意事項

★每個備份工具的時區不一樣,因此使用前後記得確認、換算時區。

★不是每個備份工具都能完整備份PDF檔案的連結,例如我最常用的Archive.today,只能備份檔案的第一個畫面,無法向下滑動檢視PDF的後續頁面。

Archive.todayWayback Machine不一定能順利備份Facebook的貼文(備份頁面常會顯示為登入畫面),Ghost Archive是社群貼文的備份好幫手。