欧美阿v视频在线大全_亚洲欧美中文日韩V在线观看_www性欧美日韩欧美91_亚洲欧美日韩久久精品

主頁 > 知識庫 > python爬取豆瓣電影排行榜(requests)的示例代碼

python爬取豆瓣電影排行榜(requests)的示例代碼

熱門標(biāo)簽:深圳網(wǎng)絡(luò)外呼系統(tǒng)代理商 外呼系統(tǒng)前面有錄音播放嗎 鎮(zhèn)江人工外呼系統(tǒng)供應(yīng)商 千呼ai電話機器人免費 柳州正規(guī)電銷機器人收費 申請辦個400電話號碼 騰訊地圖標(biāo)注有什么版本 高德地圖標(biāo)注字母 400電話辦理費用收費

'''
  爬取豆瓣電影排行榜
  設(shè)計思路:
       1、先獲取電影類型的名字以及特有的編號
       2、將編號向ajax發(fā)送get請求獲取想要的數(shù)據(jù)
       3、將數(shù)據(jù)存放進excel表格中
'''

環(huán)境部署:

軟件安裝:

Python 3.7.6

官網(wǎng)地址:https://www.python.org/

安裝地址:https://www.python.org/ftp/python/3.7.6/python-3.7.6-amd64.exe

PyCharm 2020.2.2 x64 位

官網(wǎng)地址:https://www.jetbrains.com/pycharm/download/#section=windows

參考教程:https://www.jb51.net/article/197466.htm

模塊安裝(打開cmd或powershell進行下面的命令安裝【前提需要有python】):安裝requests模塊、lxml模塊(發(fā)送請求,xpath獲取數(shù)據(jù))

pip install requests #(主要用來發(fā)送請求,獲取響應(yīng))

pip install lxml #(主要引用里面的etree里面的xpath方法)

安裝xpathhelper插件(可以在網(wǎng)頁中復(fù)制相應(yīng)的節(jié)點xpath路徑并查看)

1、下載地址:

鏈接: https://pan.baidu.com/s/1zfpnrnFtZaxrgqrUX9y5Yg

提取碼: fmsu

2、window平臺下:
    · 把文件的后綴名crx改為rar,然后解壓到同名文件夾中
    · 打開谷歌的擴展程序 ——> 進入到管理管理擴展程序中
    · 打開開發(fā)者模式,通過加載已解壓的擴展程序,將插件導(dǎo)入
3、ios平臺下:
    · 直接將crx文件拖進擴展程序中

安裝xlwt模塊(將數(shù)據(jù)存放進excel表格)

pip install xlwt

項目中需要引入的模塊:

import requests
from lxml import etree
import xlwt
import time

使用流程:

  • 在列表中填寫所需要獲取的電影類型名
  • 輸入開始時獲取的start以及獲取多少數(shù)據(jù)的limit
  • 填寫所要輸出的excel表格的名字(代碼中默認douban.xls)
  • 程序運行結(jié)束后打開excel驗證數(shù)據(jù)是否獲取
  • 觀察自己所需的數(shù)據(jù)

完整代碼:

# encoding=utf8
# 編程者 :Alvin
'''
 爬取豆瓣電影排行榜
 設(shè)計思路:
 1、先獲取電影類型的名字以及特有的編號
 2、將編號向ajax發(fā)送get請求獲取想要的數(shù)據(jù)
 3、將數(shù)據(jù)存放進excel表格中
'''
import requests
from lxml import etree
import xlwt
import time

class DouBan():
 # 初始化數(shù)據(jù),獲取最外層的數(shù)據(jù)
 def __init__(self, name_list):
 self.headers = {
 "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.3",
 "Connection": "close",
 "Referer": "https://movie.douban.com/"
 }
 # 獲取最外層的數(shù)據(jù),并拿到url中的type中的name 和 類型
 self.url = 'https://movie.douban.com/chart'
 self.dydata_list = []
 # 電影的類型名
 self.name_list = name_list
 # 實例化excel表格對象
 self.wb = xlwt.Workbook()


 # 通過電影的類型名字獲取對應(yīng)的類型號
 def get_data_typenum(self, name):
 for data in self.dydata_list:
 if data['name'] == name:
 typenum =data['dytype']
 else:
 continue
 return typenum

 # 獲取數(shù)據(jù)
 def get_data_p1(self):
 response = requests.get(self.url , headers = self.headers)
 # 判斷長度是否足夠大
 # print(len(response.content.decode()))
 return response.content.decode()

 # 獲取下一層的頁面數(shù)據(jù)
 def get_data_p2(self, typenum, num, limit):
 url = 'https://movie.douban.com/j/chart/top_list'
 params = {
 'type': typenum,
 'interval_id': '100:90',
 'action':'',
 'start': num*20,
 'limit': limit
 }
 response = requests.get(url,params=params,headers=self.headers)
 # print(response.json())
 return response.json()

 # 處理數(shù)據(jù)
 def data_parse_p1(self, data):
 html = etree.HTML(data)
 data_list = html.xpath('//div[@class="types"]/span/a/@href')
 # 用于收集類型名字
 name_list = []
 dytype_list = []
 # 用于收集類型號
 for data in data_list:
 name = data.split('?')[-1].split('')[0].split('=')[-1]
 dytype = data.split('?')[-1].split('')[1].split('=')[-1]
 name_list.append(name)
 dytype_list.append(dytype)
 for (name,dytype) in zip(name_list,dytype_list):
 dydict = {}
 dydict['name'] = name
 dydict['dytype'] = dytype
 self.dydata_list.append(dydict)
 # print(self.dydata_list)
 return self.dydata_list

 def data_parse_p2(self, data_list,name):
 print(len(data_list))
 douban = self.wb.add_sheet(name)
 style = xlwt.XFStyle() # 初始化一個style對象,用來保存excel的樣式
 font = xlwt.Font() # 創(chuàng)建一個font對象,用來保存對字體進行的操作
 font.name = '微軟雅黑' # 字體設(shè)置為'微軟雅黑'
 font.bold = True # 字體加粗
 al = xlwt.Alignment() # 創(chuàng)建一個對齊對啊想,用來改變文本內(nèi)容的字體
 style.font = font # 將字體信息保存到style對象中
 style.alignment = al

 # 水平對齊方式、水平居中
 al.horz = 0x02
 # 垂直對齊方式、垂直居中
 al.vert = 0x01

 # 電影的標(biāo)題
 douban.col(0).width = 256 * 25
 # 電影演員的名字
 douban.col(1).width = 256 * 50
 # 電影上映的年份
 douban.col(2).width = 256 * 15
 # 電影上映的國家
 douban.col(3).width = 256 * 15
 # 電影的標(biāo)簽
 douban.col(4).width = 256 * 20
 # 電影的評分
 douban.col(5).width = 256 * 8
 # 豆瓣中該電影的頁面鏈接
 douban.col(6).width = 256 * 40

 douban.write(0, 0, '電影標(biāo)題', style)
 douban.write(0, 1, '電影演員名字', style)
 douban.write(0, 2, '電影上映年份', style)
 douban.write(0, 3, '電影上映國家', style)
 douban.write(0, 4, '電影標(biāo)簽', style)
 douban.write(0, 5, '電影評分', style)
 douban.write(0, 6, '豆瓣中該電影的頁面鏈接', style)
 row = 1
 for data in data_list:
 # 電影的標(biāo)題
 title = data['title']
 # 電影演員的名字
 actors = data['actors']
 # 電影上映的年份
 release_date = data['release_date']
 # 電影上映的國家
 regions = data['regions'][0]
 # 電影的標(biāo)簽
 types = data['types']
 # 電影評分
 score = data['score']
 # 豆瓣查看的鏈接
 link = data['url']
 douban.write(row, 0, title)
 douban.write(row, 1, actors)
 douban.write(row, 2, release_date)
 douban.write(row, 3, regions)
 douban.write(row, 4, types)
 douban.write(row, 5, score)
 douban.write(row, 6, link)
 row += 1
 self.wb.save('douban.xls')


 # 運行程序
 def run(self, num, limit):
 # 獲取第一層中的所需要的類型名字和數(shù)字
 self.data_parse_p1(self.get_data_p1())
 for name in self.name_list:
 typenum = self.get_data_typenum(name)
 # 向指定的分類進行數(shù)據(jù)的訪問
 data_list = self.get_data_p2(typenum,num,limit)
 # 對獲取的數(shù)據(jù)進行解析保存
 self.data_parse_p2(data_list,name)


if __name__ == '__main__':
 # 需要查看的類型
 douban = DouBan(['喜劇','懸疑','驚悚'])
 # 需要查看的開始值start,以及需要查看的數(shù)量limit
 douban.run(0,100)
 time.sleep(2)

效果圖pycharm 運行臺

excel表格顯示

本案例筆者的想法是打算先獲取到每一個電影類型的前100個數(shù)據(jù),然后在excel表格中進行評分的篩選,最后觀察現(xiàn)階段某個電影類型中哪些電影在豆瓣電影中評分較高的

到此這篇關(guān)于python爬取豆瓣電影排行榜(requests)的文章就介紹到這了,更多相關(guān)python爬取豆瓣電影內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python使用re模塊爬取豆瓣Top250電影
  • 用Python 爬取貓眼電影數(shù)據(jù)分析《無名之輩》
  • Python爬蟲爬取電影票房數(shù)據(jù)及圖表展示操作示例
  • python實現(xiàn)的爬取電影下載鏈接功能示例
  • Python爬蟲——爬取豆瓣電影Top250代碼實例
  • python使用BeautifulSoup與正則表達式爬取時光網(wǎng)不同地區(qū)top100電影并對比
  • python使用requests模塊實現(xiàn)爬取電影天堂最新電影信息
  • Python趣味爬蟲之爬取愛奇藝熱門電影

標(biāo)簽:海南 合肥 郴州 烏蘭察布 哈爾濱 大慶 平頂山 烏蘭察布

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python爬取豆瓣電影排行榜(requests)的示例代碼》,本文關(guān)鍵詞  python,爬取,豆瓣,電影,排行榜,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《python爬取豆瓣電影排行榜(requests)的示例代碼》相關(guān)的同類信息!
  • 本頁收集關(guān)于python爬取豆瓣電影排行榜(requests)的示例代碼的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    欧美阿v视频在线大全_亚洲欧美中文日韩V在线观看_www性欧美日韩欧美91_亚洲欧美日韩久久精品
  • <rt id="w000q"><acronym id="w000q"></acronym></rt>
  • <abbr id="w000q"></abbr>
    <rt id="w000q"></rt>
    wwwxxxx在线观看| 日本精品视频一区二区三区| 欧美日韩国产三级| 亚洲精品视频观看| 不卡av电影在线播放| 搜索黄色一级片| 国产精品丝袜一区| 福利视频网站一区二区三区| 欧美福利在线视频| 中文乱码免费一区二区| 国产精品自拍av| 色偷偷www8888| 国产精品看片你懂得| 风流少妇一区二区| 久久久久亚洲AV成人| 亚洲欧洲精品一区二区三区 | 中文字幕av一区二区三区人妻少妇| 国产麻豆视频在线观看| 中文字幕av一区二区三区| 粉嫩一区二区三区在线看| 国精产品一区一区| 国产精品女上位| av电影天堂一区二区在线观看| 一本色道亚洲精品aⅴ| 亚洲女子a中天字幕| 久久发布国产伦子伦精品| 欧美群妇大交群的观看方式| 日一区二区三区| 国产精品无码久久久久久| 26uuu亚洲综合色欧美 | 麻豆精品新av中文字幕| 中文字幕第20页| 国产日本欧洲亚洲| 不卡视频一二三| 欧美色中文字幕| 日韩国产欧美在线观看| 日本一区二区视频在线播放| 国产欧美va欧美不卡在线| 成+人+亚洲+综合天堂| 欧美日韩午夜精品| 麻豆国产欧美一区二区三区| 美女100%露胸无遮挡| 国产精品久久久久影院亚瑟 | 欧美一二三区在线| 国产自产2019最新不卡| 爱爱视频免费在线观看| 亚洲精品va在线观看| 香蕉视频黄色在线观看| 国产免费观看久久| 自拍视频第一页| 精品福利一区二区三区免费视频| 国产成人免费在线观看不卡| 欧美亚洲国产一区二区三区va| 日韩高清在线电影| 在线看的片片片免费| 亚洲国产精品麻豆| 中文字幕免费在线看线人动作大片| 中文字幕制服丝袜一区二区三区| 91精品国产高清91久久久久久 | 亚洲综合激情网| 97超碰在线资源| 中文字幕中文字幕一区| 久久久久麻豆v国产精华液好用吗| 久久久精品国产99久久精品芒果 | 国产999精品久久久久久绿帽| 欧美日韩日日骚| 国模娜娜一区二区三区| 欧美色视频在线观看| 激情久久久久久久久久久久久久久久| 色吧成人激情小说| 久久www免费人成看片高清| 在线欧美日韩精品| 久久成人久久爱| 欧美性大战久久| 国模一区二区三区白浆| 欧美久久久久中文字幕| 国产福利视频一区二区三区| 在线成人小视频| 不卡的av网站| 久久精品这里都是精品| 99免费观看视频| 中文字幕中文乱码欧美一区二区 | 亚洲欧洲国产视频| 中文字幕不卡在线观看| 中文字幕影片免费在线观看| 中文字幕一区二区在线播放| 无码一区二区三区在线| 一区二区三区在线视频播放| 亚洲精品国产精品乱码在线观看| 午夜精品123| 91成人免费在线| 国产成人自拍在线| 精品国产乱码久久久久久浪潮| www.四虎精品| 中文字幕视频一区二区三区久| 精品人伦一区二区| 无吗不卡中文字幕| 在线观看成人小视频| 国产成人啪午夜精品网站男同| 欧美成人高清电影在线| 国产人妖在线观看| **欧美大码日韩| 欧美日韩国产一二三区| 免费观看在线综合| 7777精品伊人久久久大香线蕉| 97精品国产露脸对白| 国产精品天美传媒| 黄大色黄女片18免费| 麻豆精品一区二区av白丝在线| 欧美日高清视频| 91麻豆自制传媒国产之光| 国产精品欧美一级免费| 美女网站视频色| 精品一区二区成人精品| 欧美成人一区二区三区片免费| 中文字幕人妻一区| 亚洲午夜在线观看视频在线| 91国偷自产一区二区三区观看 | 国产一区二区在线电影| 精品国产一区二区亚洲人成毛片| 国产真实乱人偷精品| 亚洲chinese男男1069| 欧美日韩的一区二区| 免费观看污网站| 亚洲成av人在线观看| 欧美日韩国产综合视频在线观看| 91老师国产黑色丝袜在线| 亚洲精品视频在线看| 91搞黄在线观看| 在线观看网站黄| 一区二区国产视频| 欧美日韩国产综合视频在线观看| 亚洲欧美综合视频| 亚洲1区2区3区视频| 69久久夜色精品国产69蝌蚪网 | 亚洲人成人一区二区在线观看| 少妇影院在线观看| 99久久精品费精品国产一区二区| 亚洲裸体在线观看| 欧美日韩视频在线一区二区| 国产综合内射日韩久| 视频一区国产视频| 精品国产凹凸成av人导航| 欧美成人短视频| 成人精品视频一区二区三区尤物| 自拍偷拍亚洲欧美日韩| 欧美中文字幕一区二区三区亚洲| 中文字幕18页| 日本女优在线视频一区二区| 精品国产91久久久久久久妲己| 综合 欧美 亚洲日本| 粉嫩aⅴ一区二区三区四区五区| 亚洲视频中文字幕| 欧美色国产精品| 国产精品第七页| 狠狠色狠狠色综合系列| 国产精品久久久久久久久免费丝袜 | 狠狠色丁香婷综合久久| 国产欧美精品一区二区色综合| 2021亚洲天堂| 久久久久亚洲av成人网人人软件| 奇米四色…亚洲| 国产日韩在线不卡| 91国偷自产一区二区使用方法| 国产精品一区二区在线免费观看| 秋霞成人午夜伦在线观看| 国产亚洲精品久| 色成年激情久久综合| 制服丝袜第一页在线观看| 精品一区二区三区香蕉蜜桃| 国产精品短视频| 欧美放荡的少妇| 五月激情四射婷婷| 91老师片黄在线观看| 强制捆绑调教一区二区| 欧美韩国日本不卡| 欧美日韩国产天堂| 成人在线观看免费高清| 91啪九色porn原创视频在线观看| 日本免费在线视频不卡一不卡二| 国产人成亚洲第一网站在线播放| 在线看日本不卡| 欧洲美一区二区三区亚洲 | 亚洲天堂黄色片| www.com日本| 国产在线播放一区| 亚洲综合一区在线| 久久毛片高清国产| 精品视频免费在线| 粉嫩精品久久99综合一区| 国产精品熟女一区二区不卡| 美女性感视频久久| 亚洲日本中文字幕区| 2020国产精品自拍| 欧美日韩在线精品一区二区三区激情| 国产免费无遮挡吸奶头视频| 91网站视频在线观看| 精品一区二区av| 亚洲123区在线观看| 专区另类欧美日韩|