此庫在手,好片無憂!Python爬片,小手不抖

2021-02-14 Java研究所

作者:鄧旭東HIT,Python愛好者社區專欄作者 https://zhuanlan.zhihu.com/pythoncoder 

個人微信公眾號: 大鄧帶你玩轉python  

也許你也經歷過想下載幾部視頻以便未來有空再看,可是視頻網站有的內容不提供下載。這種情況真的讓你很無奈,也很無助。今天在github瀏覽python熱門項目,發現的這個you-get庫,可以幫助你下載想要的視頻資源。
github連結:https://github.com/soimort/you-get

是一種輕量級的命令行工具。
這是用you-get從 該網站(http://www.fsf.org/blogs/rms/20140407-geneva-tedx-talk-free-software-free-society)下載視頻的運行效果圖

$ you-get http://www.fsf.org/blogs/rms/20140407-geneva-tedx-talk-free-software-free-societySite:       fsf.orgTitle:      TEDxGE2014_Stallman05_LQType:       WebM video (video/webm)Size:       27.12 MiB (28435804 Bytes)Downloading TEDxGE2014_Stallman05_LQ.webm ...100.0% ( 27.1/27.1 MB)     ├████████████████████████████████████████┤[1/1]   12 MB/s

這裡是為什麼你可能想使用它:

你喜歡在網際網路上的東西,只是為快樂而想下載。

您可以通過計算機在線觀看自己喜愛的視頻,但不能保存。你覺得你不能控制自己的電腦。 (這不是一個開放的網絡應該如何工作。)

您希望擺脫任何封閉原始碼技術或專有JavaScript代碼,並禁止在您的計算機上運行Flash等操作。

你是一個黑客文化和自由軟體的堅持。


你可以為你做什麼:

從流行的網站(如YouTube,優酷,Niconico等)下載視頻/音頻。 (查看支持的網站的完整列表)

在媒體播放器中串流播放線上影片。沒有網絡瀏覽器,沒有更多的廣告。

通過抓取網頁下載圖像(感興趣的)。

下載任意非HTML內容,即二進位文件。

感興趣?現在安裝它,並通過示例開始。
你是Python程式設計師嗎?然後檢查源和fork它!

安裝先決條件

以下依賴關係是必需的,必須單獨安裝,除非您在Windows上使用預構建的軟體包或巧克力軟體包:

Python 3

FFmpeg(強烈推薦)或Libav(可選)RTMPDump


通過pip安裝

你獲得的官方發布是在PyPI上分發的,可以通過pip包管理器從PyPI鏡像輕鬆安裝。 注意,你必須使用Python 3的pip:

$ pip3 install you-get


開始吧

下載視頻

當您收到感興趣的視頻時,您可能需要使用 --info / -i 選項查看所有可用的質量和格式:

$ you-get -i 'https://www.youtube.com/watch?v=jNQXAC9IVRw'site:                YouTubetitle:               Me at the zoostreams:             # Available quality and codecs[ DEFAULT ] _________________________________- itag:          43  container:     webm  quality:       medium  size:          0.5 MiB (564215 bytes)# download-with: you-get --itag=43 [URL]- itag:          18  container:     mp4  quality:       medium# download-with: you-get --itag=18 [URL]- itag:          5  container:     flv  quality:       small# download-with: you-get --itag=5 [URL]- itag:          36  container:     3gp  quality:       small# download-with: you-get --itag=36 [URL]- itag:          17  container:     3gp  quality:       small# download-with: you-get --itag=17 [URL]

下載其他任何內容

如果您已擁有所需資源的網址,可以直接通過以下網址下載:

$ you-get https://stallman.org/rms.jpgSite:       stallman.orgTitle:      rmsType:       JPEG Image (image/jpeg)Size:       0.06 MiB (66482 Bytes)Downloading rms.jpg ...100.0% (  0.1/0.1  MB)     ├████████████████████████████████████████┤[1/1]  127 kB/s

在Google視頻中搜索並下載

你可以傳遞任何東西給你。 如果網址不是有效的網址,您就會進行Google搜尋,並為您下載最相關的影片。 (這可能不是你想看到的,但仍然很可能。)

$ you-get "Richard Stallman eats"

支持下載的視頻媒體列表: soimort/you-get ( https://github.com/soimort/you-get#supported-sites  )務必收藏感謝各位小夥伴們點讚,後續更多精彩分享。


火爆參團:

崔老師聯合天善學院帶來爬蟲視頻《自己動手,豐衣足食!Python3網絡爬蟲實戰案例》,正在火爆參團中~

參團方式:閱讀原文 | 長按掃碼

相關焦點

  • Python常用庫大全
    python-nameparser – 把一個人名分解為幾個獨立的部分。 python-user-agents – 瀏覽器 user agent 解析器。 sqlparse – 一個無驗證的 SQL 解析器。 特殊文本格式處理一些用來解析和操作特殊文本格式的庫。通用 tablib – 一個用來處理中表格數據的模塊。
  • 如何在Visual Studio開發工具安裝python庫
    >技術pythonDjango在python語言開發工具的pycharm中,可以安裝第三方庫。那麼,在Visual Studio開發工具中,如何安裝python第三方庫呢?下面利用實例說明:操作步驟:1、打開Visual Studio 2019開發工具,創建python項目
  • 讓所有程式設計師絕不能錯過的59個Python庫總結!
    Python有以下三個特點:易用性和靈活性全行業高接受度:Python無疑是業界最流行的數據科學語言用於數據科學的Python庫的豐富數量優勢本文介紹了python人最常用的59個python庫。一起來看看吧~用於數據收集的Python庫1.
  • 深圳Python培訓班打造行業高標準Python人才
    Python火的原因1、python相比別的高級語言集成度更高,除了執行的效率低些,開源可以調用的類庫實在太多了,要實現一個功能,如果換作傳統的程式語言,需要實現基本的功能模塊,但直接調用類庫很方便的搞定,特別適合零基礎的學習, 幾行代碼就能實現很強大的功能。
  • 初學者如何用「python爬蟲」技術抓取網頁數據?
    想要入門Python 爬蟲首先需要解決四個問題:1.熟悉python編程2.了解HTML3.了解網絡爬蟲的基本原理4.學習使用python爬蟲庫1、熟悉python編程剛開始入門爬蟲,初學者無需學習python的類,多線程,模塊和其他稍微困難的內容。
  • Python 打包的現狀:包的三種類型
    為了有一個具體的示例,讓我介紹一下我的很棒的示例庫:pugs 。這個庫相當簡單:它只生成一個名為 pugs 的包,僅包含一個名為 logic 的模塊。關於 pugs,你猜對了,logic 被用於生成隨機的引號。
  • 如何用PYTHON代碼寫出音樂
    下面我們就介紹下生成MIDI文件所使用的Python庫。python-midi庫介紹市面上差不多有十多種python庫可以編寫MIDI格式的文件,本文會推薦大家使用PYTHON-MIDI。我覺得python-midi的優勢是不光可以自己寫程序生成MIDI,而且還可以對MIDI文件進行解析。
  • 最好的Python機器學習庫
    有很多代碼並未在此列出,在這裡我只會發布一些非常相關或知名的庫。下面,來看看這份清單吧。最受歡迎的庫我已經對一些比較流行的庫和它們擅長的方向做了一個簡短的描述,在下一節,我會給出一個更完整的項目列表。Tensorflow這是清單中最新的神經網絡庫。在前幾天剛剛發行,Tensorflow是高級神經網絡庫,可以幫助你設計你的網絡架構,避免出現低水平的細節錯誤。
  • Python Tool 101 - Tool 002 - Python 情感分析 SnowNLP
    SnowNLP是咋們中國人受到了TextBlob的啟發後開發的python類庫,能夠非常方便的處理中文文本內容,劃重點方便處理中文的類庫!!!,類庫中的算法和訓練好的字典都已經準備好了。唯一需要注意的是要使用unicode編碼,所以使用時請自行decode成unicode。知道這個SnowNLP是什麼之後,我們開始設計下實驗方案。
  • 【python】Array Programming with Numpy
    在正文中,作者主要圍繞摘要中的內容進行展開,主要介紹了Numpy的歷史,Numpy是什麼,現有的python科學生態,數組的激增以及互用性以及最後的討論。在Numpy的歷史中,作者主要講述了在Numpy出現之前便已經存在的兩個第三方庫的歷史以及主要功能,優劣勢,再講述了Numpy從出現到現今的發展程度,執行方式以及發展方式。
  • python的繪圖利器--海龜繪圖turtle
    我們之前提到Python是一種超級語言,因為其提供了極其豐富的庫,需要什麼拿來黏合一下就可以直接使用。就像現在的有些汽車工廠一樣,根本不用重新發明生產什麼,只需要買來相應部件等把它們組裝起來就好。作為你學習python的第一個程序,樹哥決定直接來一個實戰乾貨程序:利用海龜turtle來畫一個奧運五環。這樣就既可以理解庫的概念和使用,又可以理解程序的基本概念。
  • 單片機上運行Python-MicroPython(三)
    內存狀態報告有許多庫函數可用於報告內存的分配情況和控制垃圾回收器的執行。其多存在於gc模塊和micropython模塊。可將下面的示例代碼粘貼到REPL中運行查看效果。(Ctrl+E 進入粘貼模式,然後Ctrl+D運行)import gcimport micropythongc.collect()micropython.mem_info()print('----')print('Initial free: {} allocated: {}'.format(gc.mem_free(), gc.mem_alloc
  • 使用Python製作表白小程序
    對於正在學習python的小編來說,更讓我感興趣的還是小程序背後的代碼了。看完之後我就在想,作為萬能的python來說,實現這種功能應該不在話下吧。果不其然,在知乎上看到過一篇文章就是用python來實現一個表白程序。看完之後,小編就驚呆了,原來用python可以這麼簡單的實現這個程序。
  • Python和C/C++交互的幾種方法總結
    但是很多時候,我們既想使用python的簡介優美,又不想損失太多的性能,這個時候有沒有辦法將python與C/C++結合到一起呢?這樣在性能與速度要求不高的地方,可以用pyhton寫,而關鍵的運算部分用C/C++寫,這樣就太好了。python在做科學計算或者數據分析時,這是一個非常普遍的需求。要想實現這個功能,python為我們提供了不止一種解決辦法。下面我就逐一給大家介紹。
  • Python 3.9來啦!細數十個值得關注的新特性
    簡而言之,從字典更新 / 合併到添加新的字符串方法,再到zoneinfo庫的引入,Python 3.9 添加了許多新特性。此外,該版本還引入了一種穩定、高性能的新型解析器。標準庫更新了許多新特性,並添加了新模塊zoneinfo和graphlib。
  • Metaflow:Netflix 的 Python / R數據科學框架
    · 相同軟體包的多個版本: 希望能夠在項目中使用sklearn庫的多個版本:0.20版本用於預處理步驟,0.22版本用於建模。典型的Meta(工作)流是什麼樣子的?Metaflow架構的這個關鍵方面能夠從 Metaflowsconda 生態系統中注入幾乎所有的外部庫,無需插件。這也是Metaflow 與其他通用解決方案(如Airflow)的不同之處。
  • Python應用:文本詞頻統計(以哈姆雷特和三國演義為例)
    文本詞頻統計是一個python的一個非常重要的應用。利用文本詞頻統計,我們可以大致了解文章的關鍵詞是什麼,更加有助於理解作者的思想。中文詞頻統計需要用到python的第三方庫:jieba庫。中文詞頻統計——《三國演義》中文詞頻統計需要用到jieba庫,將詞語劃分開來。應當反覆修改、更新上述代碼,才能去除噪聲,提取出想要的結果。
  • 人生苦短,我用Python
    響應請求返回數據使用java來做,而爬取數據存入資料庫使用python來做,這樣分別使用不同語言來做是因為這兩種語言各有優勢,java效率比python高些,適合做web端,而爬取數據並不是太追求性能且python語言和大量的庫適合做爬蟲。
  • python圖像處理-gif動圖
    圖片合成動圖導入os庫,利用listdir方法將lion文件夾中的圖片全部讀取出來,循環打開每一張圖片,接著將圖片對象添加到frames列表中,最後利用save方法,保存為一張動圖。python圖像處理-1
  • 學了Python一般可以用來幹什麼呢?
    youtube 世界最大的視頻網站也是Python開發的哦.還有非常出名的instagram 也是用python開發的2,網絡爬蟲爬蟲是屬於運營的比較多的一個場景吧,比如谷歌的爬蟲早期就是用跑Python寫的. 其中有一個庫叫 Requests ,這個庫是一個模擬HTTP請求的一個庫,非常的出名!