登入
|
註冊
|
會員中心
|
結帳
|
培訓課程
魔法弟子
|
自資出版
|
電子書
|
客服中心
|
智慧型立体會員
書名
出版社
作者
isbn
編號
5050魔法眾籌
|
NG書城
|
國際級品牌課程
|
優惠通知
|
霹靂英雄音樂精選
|
App程式設計入門:iPhone、iPad(附光碟)
此作者無相關書籍
文學小說
文學
|
小說
商管創投
財經投資
|
行銷企管
人文藝坊
宗教、哲學
社會、人文、史地
藝術、美學
|
電影戲劇
勵志養生
醫療、保健
料理、生活百科
教育、心理、勵志
進修學習
電腦與網路
|
語言工具
雜誌、期刊
|
軍政、法律
參考、考試、教科用書
科學工程
科學、自然
|
工業、工程
家庭親子
家庭、親子、人際
青少年、童書
玩樂天地
旅遊、地圖
|
休閒娛樂
漫畫、插圖
|
限制級
偏不讓你抓:最強Python 爬蟲vs反爬蟲大戰實錄
作者:
韋世東
分類:
電腦與網路
/
程式語言
出版社:
深智數位
出版日期:2020/6/22
ISBN:9789865501389
書籍編號:kk0513513
頁數:480
定價:
780
元
優惠價:
79
折
616
元
書價若有異動,以出版社實際定價為準
絕版書
絕版書:確定不再版的商品,僅提供書籍資訊參考。
評價數:
(請將滑鼠移至星星處進行評價)
目前平均評價:
文字連結
複製語法
偏不讓你抓:最強Python 爬蟲vs反爬蟲大戰實錄
圖片連結
複製語法
分
享
內容簡介
作者介紹
書籍目錄
同類推薦
偏不讓你抓:最強Python 爬蟲vs反爬蟲大戰實錄 內容簡介 爬蟲大戰,爾虞我詐,利用熟練的Python3瀏覽器知識,加上人工智慧 的幫助,讓百度、微軟、Google都沒辦法從你的網站爬走一點點資料! 資訊型反爬蟲、動態繪製反爬蟲、文字混淆反爬蟲、特徵識別反爬蟲、app反爬蟲、程式混淆反爬蟲、驗證碼反爬蟲,再強大的爬蟲機器人也就地當機! 本書主要內容 本書共10 章,首先對各種反爬蟲技術進行合理的歸類,然後透過剖析多個案例幫助讀者了解各種反爬蟲技術的原理。內容包含但不限於Cookie反爬蟲、WebSocket反爬蟲、字型反爬蟲、WebDriver反爬蟲、App反爬蟲、驗證碼反爬蟲,幾乎涵蓋市面上所有的反爬蟲技術類型,內容十分詳盡。另外,還針對各種反爬蟲列出對應的繞過和破解方案。 從開發環境設定到原理,再到實際的反爬蟲案例剖析,內容循序漸進。建議讀者按照章節順序閱讀,並在閱讀過程中親自動手練習。 內容如下: ►第1 章 介紹本書所相關的大部分開發環境設定,需要時查閱即可。 ►第2 章 介紹Web 網站的組成和頁面繪製。了解伺服器端、用戶端的組成,工作形式和通訊協定。 ►第3 章 簡單說明動態網頁和靜態網頁對爬蟲造成的影響,並對反爬蟲概念進行介紹和約定。 ►第4 章 以資訊驗證型反爬蟲為主線,說明基於HTTP 協定和WebSocket 協定對用戶端請求進行驗證的反爬蟲原理和具體實作方法,並以爬蟲工程師的角度示範繞過過程。 ►第5 章 介紹常見的動態繪製反爬蟲,透過場景假設的方式來說明不同需求的應對方法。 ►第6 章 介紹目前被廣泛使用的文字混淆反爬蟲知識,包含圖片偽裝、CSS 偏移、SVG 對映和字型反爬蟲等。以爬蟲工程師的角度示範繞過過程,再剖析其原理。最後討論文字混淆反爬蟲的通用解決方法。 ►第7 章 介紹特徵識別反爬蟲,包含繞過過程和實現原理。特徵識別反爬蟲具有一定的隱蔽性。它在爬蟲程式發起時識別和過濾,能有效地減輕伺服器的壓力。 ►第8 章 介紹App資料爬取的關鍵和常用的反爬蟲方法,包含程式混淆、參數加密和安全強化等,同時還介紹封包截取和App逆向方面的知識。 ►第9 章 驗證碼相關的內容,包含市面上常見的驗證碼類型,每個驗證碼案例均以爬蟲工程師的角度示範繞過過程,再以開發者的角度示範驗證碼的實現過程。部分驗證碼的繞過用到了深度學習中的卷積神經網路和用於目標檢測的YOLO 演算法,並對商用驗證碼廠商的產品進行基本介紹和難度分析。 ►第10 章 綜合知識的介紹。如常見的編碼和加密原理,並以對應的RFC 文件為基礎,說明編碼、解碼、加密和解密的過程。然後介紹常見的JavaScript 程式混淆知識,並動手實現一個簡單的混淆器。接著學習前端禁止事件方面的知識,如禁止滑鼠右鍵、禁止鍵盤按鍵等。最後透過幾個案例了解與爬蟲相關的法律知識和風險點。 適合讀者群 爬蟲工程師、反爬蟲工程師、開發者,或對爬蟲、反爬蟲感興趣的讀者。 本書特色 ◎系統說明爬蟲和反爬蟲技術 ◎爬蟲工程師不可錯過的武功秘笈 ◎幫你從0到1理清爬蟲與反爬蟲的紅藍對抗
作者簡介 韋世東 資深爬蟲工程師,也是Python 開發者和Rust 開發者。 2019年華為雲·雲享專家,掘金社區優秀作者,GitChat認證作者,夜幕團隊(NightTeam)成員。 擁有七年互聯網從業經驗,擅長反爬蟲的設計和繞過技巧。
目錄 前言 01 開發環境設定 1.1 作業系統的選擇 1.2 練習平台Steamboat 1.3 協力廠商函數庫的安裝 1.4 常用軟體的安裝 1.5 深度學習環境設定 1.6 Node.js 環境設定 02 Web 網站的組成和頁面繪製 2.1 nginx 伺服器 2.2 瀏覽器 2.3 網路通訊協定 03 爬蟲與反爬蟲 3.1 動態網頁與網頁原始程式碼 3.2 爬蟲知識回顧 3.3 反爬蟲的概念與定義 04 資訊驗證型反爬蟲 4.1 User-Agent 反爬蟲 4.2 Cookie 反爬蟲 4.3 簽名驗證反爬蟲 4.4 WebSocket 驗證驗證反爬蟲 4.5 WebSocket 訊息驗證反爬蟲 4.6 WebSocket Ping 反爬蟲 05 動態繪製反爬蟲 5.1 常見的動態繪製反爬蟲案例 5.2 動態繪製的通用解決辦法 06 文字混淆反爬蟲 6.1 圖片偽裝反爬蟲 6.2 CSS 偏移反爬蟲 6.3 SVG 對映反爬蟲 6.4 字型反爬蟲 6.5 文字混淆反爬蟲通用解決辦法 07 特徵識別反爬蟲 7.1 WebDriver 識別 7.2 瀏覽器特徵 7.3 爬蟲特徵 7.4 隱藏連結反爬蟲 08 App 反爬蟲 8.1 App 封包截取 8.2 APK 檔案反編譯 8.3 程式混淆反爬蟲 8.4 App 應用強化知識擴充 8.5 了解應用程式自動化測試工具 09 驗證碼 9.1 字元驗證碼 9.2 計算型驗證碼 9.3 滑動驗證碼 9.4 滑動拼圖驗證碼 9.5 文字點選驗證碼 9.6 滑鼠軌跡的檢測和原理 9.7 驗證碼產品賞析 10 綜合知識 10.1 編碼與加密 10.2 JavaScript 程式混淆 10.3 前端禁止事件 10.4 法律法規
Go 學習手冊 第二
ChatGPT超級應
最新Python基礎
新手也能學會的Git
深入淺出軟體架構
因果推論的商業應用:
Canva零基礎入門
聰明提問AI的技巧與
文科生也能輕鬆實現!
Raspberry
為了保障您的權益,新絲路網路書店所購買的商品均享有到貨七天的鑑賞期(含例假日)。退回之商品必須於鑑賞期內寄回(以郵戳或收執聯為憑),且商品必須是全新狀態與完整包裝(商品、附件、內外包裝、隨貨文件、贈品等),否則恕不接受退貨。