欧美阿v视频在线大全_亚洲欧美中文日韩V在线观看_www性欧美日韩欧美91_亚洲欧美日韩久久精品

主頁 > 知識庫 > Python如何利用正則表達式爬取網頁信息及圖片

Python如何利用正則表達式爬取網頁信息及圖片

熱門標簽:地圖標注微信發送位置不顯示 地圖標注的意義點 上海機器人外呼系統哪家好 蓋州市地圖標注 地圖制圖標注位置改變是移位嗎 南京銷售外呼系統軟件 房產電銷外呼系統 浙江電銷卡外呼系統好用嗎 315電話機器人廣告

一、正則表達式是什么?

概念:

正則表達式是對字符串操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個“規則字符串”,這個“規則字符串”用來表達對字符串的一種過濾邏輯。

正則表達式是一個特殊的字符序列,它能幫助你方便的檢查一個字符串是否與某種模式匹配。

個人理解:

簡單來說就是使用正則表達式來寫一個過濾器來過濾了掉雜亂的無用的信息(eg:網頁源代碼…)從中來獲取自己想要的內容

二、實戰項目

1.爬取內容

獲取上海所有三甲醫院的名稱并保存到.txt文件中

2.訪問鏈接

上海三甲醫院網站 link:https://yyk.99.com.cn/sanjia/shanghai/

3.正則表達式書寫的靈感

進入網站查看本頁面的源代碼發現 :醫院的名稱都是放在一個

div class="province-box"> ...... /div>

盒子里我們只需要直接把這個盒子里面的數據過濾一下就行

正則表達式:

法一:

1.一級過濾 : 

   div class="province-box">(.*)div class="wrap-right">

開頭是:div class="province-box"> (.*)  結尾是:div class="wrap-right">

2.二級過濾:

 title="(.*[院心部])*)" 獲取title=" " 里面的信息

法二:

優化后一次性過濾:

 li>a href="/[^/].*/" rel="external nofollow" rel="external nofollow" target="_blank" title="(.*)">

貼圖片

開頭是:

結尾是:

4.項目源代碼

import requests
import re

url = "https://yyk.99.com.cn/sanjia/shanghai/"
# 模擬瀏覽器的訪問
headers ={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:87.0) '
                        'Gecko/20100101 Firefox/87.0'}
res = requests.get(url,headers=headers)

if res.status_code == 200:
	#1.獲取網頁源代碼
    raw_text = res.text
    
    #2.正則表達式書寫:
    #2.2注意:正則表達式默認匹配的是一行  我們的源代碼是多行匹配的要加另一個參數 re.DOTALL
	#2.3正則法一:
		#re.findall() 返回的是lsit集合 一次過濾
    re_res = re.findall(r'div class="province-box">(.*)div class="wrap-right">', raw_text,re.DOTALL)
    	#re_res[0] 獲取下標是的數據    二次過濾
    res=re.findall(r'title="(.*[院心部])*)"',re_res[0])
    	#檢查打印獲取到的信息
	print(res)
	
	#2.4正則法二:
		#(優化)不用二次過濾 一次過濾就解決了
    # re_list = re.findall(r'li>a href="/[^/].*/" rel="external nofollow"  rel="external nofollow"  target="_blank" title="(.*)">', res.text)
    #print(re_list)

    # 寫入文件中
    read = open("上海醫院名單", "w", encoding='utf-8')
    for i in res:
        read.write(i)
        read.write("\n")
    read.close()
else:
    print("error")

項目目錄:

部分結果:

python 正則表達式-提取圖片地址

import os,sys,time,json,time
import socket,random,hashlib
import requests,configparser
import json,re
from datetime import datetime
from multiprocessing.dummy import Pool as ThreadPool


def getpicurl(url):
    url = "http://www.mzitu.com/zipai/comment-page-352"
    html = requests.get(url).text
    pic_url = re.findall('img src="(.*?)"',html,re.S)
    for key in pic_url:
        print(key + "\r\n")
    #print(pic_url)
    
getpicurl("http://www.mzitu.com/zipai/comment-pag.e-352")

輸出結果:

python mmm.py
http://wx3.sinaimg.cn/mw1024/9d52c073gy1fsvu6578k1j20sg15nk4x.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu64q4lgj20j60nz0ua.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu67hhbaj20sg110toc.jpg

http://wx2.sinaimg.cn/mw1024/9d52c073gy1fsvu66bw56j20sg0zjtlr.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu65vvvtj20sg0mmtfc.jpg

http://wx2.sinaimg.cn/mw1024/9d52c073gy1fsvu66gtnzj20sg0zk48h.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu65q1qyj20sg11vtmo.jpg

http://wx3.sinaimg.cn/mw1024/9d52c073gy1fsvu64wgejj20e60iwtax.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsvu66a8xfj20lt0rptgw.jpg

http://wx4.sinaimg.cn/mw1024/9d52c073gy1fsnr6n7n66j20k00ozn52.jpg

http://wx1.sinaimg.cn/mw1024/9d52c073gy1fsnr6njhjyj20sg0zkn88.jpg

http://wx3.sinaimg.cn/mw1024/9d52c073gy1fsnr6n2zmyj20sg0ldten.jpg

總結

到此這篇關于Python如何利用正則表達式爬取網頁信息及圖片的文章就介紹到這了,更多相關Python正則表達式爬取內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python正則表達式中的量詞符號與組問題小結
  • Python正則表達式的應用詳解
  • 淺談Python中的正則表達式
  • python正則表達式re.search()的基本使用教程
  • python通過re正則表達式切割中英文的操作
  • Python驗證的50個常見正則表達式
  • python re模塊和正則表達式
  • Python中正則表達式對單個字符,多個字符和匹配邊界等使用
  • python正則表達式re.match()匹配多個字符方法的實現
  • 如何利用python正則表達式匹配版本信息
  • python使用正則表達式匹配txt特定字符串(有換行)
  • Python爬蟲教程之利用正則表達式匹配網頁內容
  • python中使用正則表達式將所有符合條件的字段全部提取出來
  • Python使用正則表達式實現爬蟲數據抽取
  • Python 通過正則表達式快速獲取電影的下載地址
  • python正則表達式 匹配反斜杠的操作方法
  • 帶你精通Python正則表達式

標簽:克拉瑪依 赤峰 雙鴨山 臨汾 陽泉 貴州 日照 金華

巨人網絡通訊聲明:本文標題《Python如何利用正則表達式爬取網頁信息及圖片》,本文關鍵詞  Python,如何,利用,正則,表達式,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python如何利用正則表達式爬取網頁信息及圖片》相關的同類信息!
  • 本頁收集關于Python如何利用正則表達式爬取網頁信息及圖片的相關信息資訊供網民參考!
  • 推薦文章
    欧美阿v视频在线大全_亚洲欧美中文日韩V在线观看_www性欧美日韩欧美91_亚洲欧美日韩久久精品
  • <rt id="w000q"><acronym id="w000q"></acronym></rt>
  • <abbr id="w000q"></abbr>
    <rt id="w000q"></rt>
    国产精品久久毛片a| 国产高清不卡一区二区| 人妻巨大乳一二三区| 成人免费视频网站入口::| 国产色产综合色产在线视频 | 亚洲精品伦理在线| 成人h动漫精品| 91高清免费看| 亚洲欧洲日产国产综合网| 成人性生交大合| 18岁成人毛片| 亚洲啪啪综合av一区二区三区| 波多野结衣精品在线| 色综合久久天天| 亚洲欧美日韩国产综合| 99国产欧美久久久精品| 在线日韩一区二区| 亚洲综合图片区| 成年人小视频在线观看| 欧美一区二区三区视频在线观看| 午夜国产精品一区| 久久国产精品无码一级毛片| 欧美一区二区三区四区久久| 久久综合综合久久综合| 青娱乐国产视频| 国产精品色哟哟网站| 不卡欧美aaaaa| 欧美视频中文字幕| 爽好多水快深点欧美视频| 一卡二卡三卡四卡| 久久精品一二三| 成人美女视频在线观看18| 在线观看国产91| 天天色综合成人网| 国产肥白大熟妇bbbb视频| 欧美激情一区二区三区在线| 成人国产电影网| 欧美日韩www| 美国毛片一区二区三区| 国产又色又爽又高潮免费| 亚洲欧美在线视频观看| 午夜福利三级理论电影| 精品裸体舞一区二区三区| 国产精品主播直播| 91久久精品一区二区| 天天av天天翘天天综合网| 久久中文字幕精品| 成人免费在线观看入口| 国产十八熟妇av成人一区| 久久影院午夜论| 99久久精品免费| 日韩一区二区影院| 国产不卡高清在线观看视频| 欧美性高清videossexo| 久久爱另类一区二区小说| 欧美老熟妇一区二区三区| 亚洲va欧美va人人爽| 能直接看的av| 亚洲影院久久精品| 欧美大波大乳巨大乳| 亚洲日本乱码在线观看| 性久久久久久久久久| 国产精品久久久久久妇女6080 | 99精品视频在线观看| 欧美一区永久视频免费观看| 国产精品一区二区男女羞羞无遮挡| 欧美在线免费视屏| 精品亚洲国产成人av制服丝袜| 18岁成人毛片| 久久精品国产网站| 欧美性猛片aaaaaaa做受| 国产乱子伦视频一区二区三区 | 精品日韩一区二区三区 | 国产成都精品91一区二区三| 欧美日韩视频一区二区| 国产精品一区免费在线观看| 欧美精品视频www在线观看| 国产盗摄女厕一区二区三区| 91麻豆精品国产91久久久资源速度| 国产成人精品影院| 日韩欧美精品三级| 91蜜桃传媒精品久久久一区二区| 精品国产网站在线观看| 午夜性福利视频| 国产精品午夜春色av| 日韩片在线观看| 亚洲另类在线制服丝袜| 亚洲天堂av中文字幕| 视频一区中文字幕| 色系网站成人免费| 国产一区二区三区免费看 | 日本女优在线视频一区二区| 日本乱人伦一区| 国产精品一区二区三区网站| 日韩一级免费观看| 色哟哟免费视频| 亚洲欧洲av另类| 国产免费美女视频| 九色综合狠狠综合久久| 欧美一区二区三区小说| 国产精九九网站漫画| 亚洲天堂av一区| 国产探花在线视频| 日本伊人精品一区二区三区观看方式| 色猫猫国产区一区二在线视频| 亚洲精品va在线观看| 欧美激情视频二区| 免费成人性网站| 欧美精品高清视频| 99热这里只有精品2| 亚洲欧洲精品一区二区三区不卡 | 两女双腿交缠激烈磨豆腐| 中文字幕欧美激情一区| 极品蜜桃臀肥臀-x88av| 麻豆国产精品777777在线| 欧美一区二区三区思思人| 污污免费在线观看| 亚洲第一二三四区| 欧美日韩精品一区视频| 国产探花一区二区三区| 亚洲免费伊人电影| 一本大道av一区二区在线播放 | 亚洲一级生活片| 国产寡妇亲子伦一区二区| 久久久久久久久久久久久女国产乱 | 轻轻草成人在线| 91精品国产高清一区二区三区| 亚洲精品久久一区二区三区777 | 美国欧美日韩国产在线播放| 日韩一级免费一区| 成人精品999| 久久超碰97人人做人人爱| 久久综合久久鬼色中文字| a级片在线观看| jizzjizzjizz国产| 国产欧美一区二区精品婷婷| 天天操天天干天天操天天干| 极品少妇xxxx偷拍精品少妇| 久久久久久久电影| 2014亚洲天堂| 成人黄色一级视频| 亚洲婷婷在线视频| 欧美亚洲国产一区在线观看网站| 潘金莲一级淫片aaaaaaa| 亚洲福中文字幕伊人影院| 911国产精品| 成人乱码一区二区三区av| 久久99蜜桃精品| 国产精品素人一区二区| 成人观看免费视频| 亚洲国产欧美日韩在线| 视频一区二区中文字幕| 亚洲精品一线二线三线无人区| 久久精品国产亚洲AV成人婷婷| 国产1区2区3区精品美女| 亚洲人成网站色在线观看| 欧美三级欧美一级| 色天使在线视频| 国产一区二区三区四区五区入口 | 欧美日韩国产一二三区| 成人综合婷婷国产精品久久| 亚洲免费三区一区二区| 9191成人精品久久| 农村老熟妇乱子伦视频| 91在线看国产| 青青草原综合久久大伊人精品优势| 精品国产sm最大网站| 希岛爱理中文字幕| 久久久高清视频| 国产在线播放一区| 一区二区在线看| 欧美变态tickle挠乳网站| 欧美色视频一区二区三区在线观看 | 国产网红主播福利一区二区| 三级黄色免费观看| 99视频热这里只有精品免费| 亚洲第一在线综合网站| 久久先锋影音av鲁色资源| 一本久道中文字幕精品亚洲嫩| 亚洲高清无码久久| 国产一区二区视频在线| 亚洲影院在线观看| 久久精品一级爱片| 欧美老女人在线| 懂色av蜜臀av粉嫩av永久| 一级全黄裸体片| 国产一区二区精品久久| 亚洲一区二区三区爽爽爽爽爽| 2020国产精品自拍| 欧美午夜精品理论片a级按摩| 波多野结衣福利| 99精品欧美一区二区蜜桃免费| 免费成人深夜小野草| 亚洲精品免费在线| 国产视频一区二区在线观看| 91麻豆精品国产91久久久资源速度| 三级av在线免费观看| 免费观看av网站| 亚洲 自拍 另类 欧美 丝袜| 国产经典欧美精品|