微博爬虫

2024/4/26 9:17:33

【python爬虫案例】爬了上千条m端微博签到数据

一、爬取目标 大家好,我是马哥python说,一枚10年程序猿。 今天分享一期python爬虫案例,爬取目标是新浪微博的微博签到数据,字段包含: 页码,微博id,微博bid,微博作者,发布时间,微博内容,签到地点,转发数,评论数,点赞数…

爬取与电话销售有关的微博

因为公司原因,需要写个微博爬虫,爬点数据做个分析来进行研究,哈哈 俗话说:360行,行行出状元 主要是我想看看微博上网友们对 电话销售 这行有什么样的评价 所以有了下面这么一个爬虫 1. 网页URL分析 这里我选择爬取的…

【爬虫实战】用python爬取微博任意关键词搜索结果、exe文件

项目功能简介: 1.交互式配置; 2.两种任意关键词来源(直接输入、本地关键词文件); 3.自动翻页(无限爬取); 4.指定最大翻页页码; 5.数据保存到csv文件; 6.程序支持打包成exe文件…

微博签到poi打卡历史数据

微博签到数据集,目前全网搜到的多为较老的 800w 数据集或已下线的接口,没有多大参考价值。 所以自研了一个系统,可以抓取全国任意城市的微博签到数据,单城市签到微博去重最多可达 100w,字段包括经纬度、签到地点、微博…

微博签到打卡点数据集—北上广深杭

微博签到打卡信息,字段包括经纬度、签到地点、微博链接、博主链接、内容、图片链接(图片可下载)、发布时间、转发数、评论数、点赞数等数十个字段。 2022 年 8 月初抓取的北上广深杭热门的微博打卡点约 20w 数据集,时间跨度为 20…

微博签到数据——北京、上海、昆明、深圳(2018-2022已更新完毕)

微博签到数据——北京、上海、昆明、深圳 任意城市2018年至2022年均可获取,GCJ-02 坐标系,可转成WGS84坐标系。 上海 2.深圳 3.南京 4.昆明 5.武汉 6.北京 等城市2018年-2022年微博签到数据均可获取。 数据获取方式见评论区,也可后台私信获…

基于Python的新浪微博爬虫程序设计与实现

完整下载:基于Python的新浪微博爬虫程序设计与实现.docx 基于Python的新浪微博爬虫程序设计与实现 Design and Implementation of a Python-based Weibo Web Crawler Program 目录 目录 2 摘要 3 关键词 4 第一章 引言 4 1.1 研究背景 4 1.2 研究目的 5 1.3 研究意义…