相信許多老司機對「Xvideos.com」這個網站應該不陌生,此專案「XD」全名為「Xvideos Downloader」,顧名思義就是下載 Xvideos 影片用的程式 (不需擁有 Xvideos 帳號)。同時,這也是我第一個 Python 專案。


前言 (初次接觸 Python)

近期突然想玩玩看爬蟲 (Crawler),也在此刻才開始接觸腳本語言 - Python (蟒蛇)
其實早在兩三年前,友人「Honor」就推坑過我,可惜當時在我心中 C 語言的那種架構才是王道 (其他都邪教) ,所以我只接觸諸如 C#PHP 這類語言。至於爬蟲,基本上是 0 經驗,硬要說的話,只有以前高中做專題時,用 PHP 去抓 OpenData 的資料來使用的經驗而已。

而我必須說,Python 當初開發時的構想「易懂易學」真的做到了!
這個專案是我接觸 Python 兩個小時後就開始製作的,約不到兩天就成功產出。
建議還沒玩過 Python 的朋友們可以開始入坑了 (X


題材選擇 (為什麼是 Xvideos?)

雖然說下定決心要學習並製作個爬蟲小工具,但我這是屬於為了「學」而「做」,而不像一般專案一樣,先有「目的」再來「做」跟「學」,所以我很煩惱...要爬什麼呢? 我的理想是,這個專案必須是符合大眾族群,而不是單純針對工程師或者資訊領域的人,我也會希望當我把成品分享給身邊朋友們時,他們是感興趣的。

人的生理需求中,就有那麼一項可以當作題材 - 「」。
很多時候我會想,如果我要架服務,怎樣的服務賺錢最輕鬆?

  • 社交網站:使用者胃口永遠餵不飽,必須一直新增功能,太複雜。
  • 搜尋引擎:目前可以說 Google 一家獨大,太競爭。
  • 影音平台:跟搜尋引擎的問題一樣,如何與 Youtube 抗衡?
  • 色情網站:完美!

雖然說 Pornhub 已經是主流,但「色情」不像 Google 跟 Youtube 這麼嚴重,只要有色的地方,就會有流量!今天不管世界上色情網站有多少個 (競爭者多),但只要有新的一出現,一樣會有不少人潮來光顧 (人類本性)。
總有一部分的使用者,會因為網站風格、界面跟操作方式而被吸引成為常客、加入會員甚至使用付費服務。

於是我開始嘗試製作 Pornhub 爬蟲,但最終還是放棄。
原因是,研究了半個小時過去,還是不明白哪裡可以爬,影片請求的部份有 Hash 驗證,在加上自己本身這方面知識不足,如果繼續研究太浪費時間了。
雖說登入會員就有資料可以給它 Hash ,但是既然都要登入會員了,那就用 Pornhub 自己提供的下載功能就好了… 而我也不可能創建公共帳號給各位去使用吧 (奇特思路),畢竟「大多數人」看片是不註冊會員的,所以我想製作的爬蟲是不用登入也可以抓檔的。

於是矛頭指向了同樣位於色情影片網站高地位的「Xvideos」。


我該如何使用?

我已經將專案放在我的 Github 上了。
你可以透過 Python3 (或更高版) 運行目錄下的 main.py 來使用。
若你不清楚什麼是 Python 腳本,你可以在 Wiki 得到答案,安裝方法也可以透過 Google 搜尋輕鬆找到。
也推薦 Windows 用戶可以使用「PyInstaller」來將 .py 打包成 windows 的 .exe 執行檔。

這也算不上是什麼專案,應該說是我自己的「Python 爬蟲練習」而已,如果你不喜歡,那麼請看看就好,請勿使用。

喔對了,你可以任意的修改使用發布更新,若你覺得不錯也可以轉傳給朋友們,但請聲明來源,這是一個對創作者的尊重。