温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

python怎么爬取京东商品评论

发布时间:2021-06-30 16:50:14 来源:亿速云 阅读:137 作者:chen 栏目:大数据

本篇内容介绍了“python怎么爬取京东商品评论”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import requests
import re
import json
import time
import xlwt
import random

#
#
#配置表格
#不需要明白是干啥的
#有下面4行代码就可以往表格写中文了
#
style=xlwt.XFStyle()
font=xlwt.Font()
font.name='SimSun'
style.font=font

#创建一个表格
w=xlwt.Workbook(encoding='utf-8')
#添加个sheet
ws=w.add_sheet('sheet 1',cell_overwrite_ok=True)
#当前写入表格到第 row行
row=1
#
#写入表格头
#
ws.write(0,0,'content')
ws.write(0,1,'userClientShow')
ws.write(0,2,'creationTime')
ws.write(0,3,'userLevelName')
ws.write(0,4,'productColor')
ws.write(0,5,'userLevelId')
ws.write(0,6,'score')
ws.write(0,7,'referenceName')
ws.write(0,8,'referenceTime')
ws.write(0,9,'isMobile')
ws.write(0,10,'nickname')

#
#接受一个json对象
#将内容写进表格
#一次一页评论
#
def write_json_to_xls(dat):

    global row
    for comment in dat['comments']:
        ws.write(row,0,comment['content'])
        ws.write(row,1,comment['userClientShow'])
        ws.write(row,2,comment['creationTime'])
        ws.write(row,3,comment['userLevelName'])
        ws.write(row,4,comment['productColor'])
        ws.write(row,5,comment['userLevelId'])
        ws.write(row,6,comment['score'])
        ws.write(row,7,comment['referenceName'])
        ws.write(row,8,comment['referenceTime'])
        ws.write(row,9,comment['isMobile'])
        ws.write(row,10,comment['nickname'])
        row+=1

#
#
# 循环获取数据
#
#
hearders = {"Referer": "https://item.jd.hk/2990360.html",
"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'"}
auto_jquery = 8809536
for i in range(1,10+1):
    #url='https://club.jd.com/comment/productPageComments.action?productId=1475512465&score=0&sortType=5&page=%d&pageSize=100&isShadowSku=0&fold=' % i
    #url = 'https://sclub.jd.com/comment/productPageComments.action?callback=jQuery2663266&productId=2990360&score=2&sortType=5&page=%d&pageSize=10&pin=null&_=1563330030798' % i
    url = 'https://sclub.jd.com/comment/productPageComments.action'
    #print(url)
    try:

        auto_jquery = auto_jquery+1
        jquery = 'jQuery%d' % auto_jquery
        times = random.randint(100,999)
        print times
        auto_tims = int(time.time())
        true_string = '%d%d' %(auto_tims, times)
        print true_string


        params = {'callback':jquery,'productId':'2990360','sortType':'5','page':i,'pageSize':'10','pin':'null','_':true_string,'score':'2'}
        json_req = requests.get(url,params=params,headers=hearders)
        print('11111111111111111111111')
        print (json_req.url)
        print (json_req.text)
        print('22222222222222222222222')

        flag = json_req.text.split('(')
        flag_two = flag[1].split(')')
        print flag_two[0];
        print ('666666666666666666')
        json_flag = json.loads((flag_two[0]))
        print json_flag['comments']
        #dat = json_req.json()
        write_json_to_xls(json_flag)
        print(u'写入第%d页数据'%i)
    except Exception as e:
       print(u'获取数据失败数据',e)
    time.sleep(0.5)


#将数据存进表格
w.save('result.xls')

“python怎么爬取京东商品评论”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI