IT人力外包人才简历库

返回列表

数据采集工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:1次 发布时间:近期

技能标签

Python Scrapy Selenium Playwright 异步协程 分布式爬虫 反反爬策略 Redis MySQL MongoDB 数据清洗 数据可视化 IP代理池 User-Agent伪装 请求频率控制

专业技能

精通Python爬虫全栈技术,掌握Scrapy框架及Requests/BeautifulSoup等主流工具,擅长静态/动态网页数据采集。深入实践异步协程(aiohttp/asyncio)与分布式爬虫架构,具备高并发场景下的数据采集方案设计能力。熟练运用Selenium/Playwright处理JavaScript渲染页面,熟悉MySQL/MongoDB数据库存储优化及Redis增量爬取技术。具备反反爬策略设计能力,包括IP代理池管理、User-Agent伪装、请求频率控制等。精通数据清洗、结构化处理及可视化分析,可输出可落地的业务洞察。

工作履历(脱敏处理)

独立负责电商平台商品数据采集项目,设计并实现分布式爬虫系统,采用Scrapy框架结合异步协程(aiohttp/asyncio)优化采集效率,日均处理百万级数据。针对JavaScript渲染页面,使用Playwright实现动态内容抓取,解决反爬虫机制问题。通过Redis构建增量爬取系统,结合IP代理池和User-Agent伪装策略,有效应对平台反爬措施。完成MySQL数据存储优化及MongoDB分库分表设计,实现数据结构化处理。最终输出商品价格波动分析报告,为业务决策提供数据支撑。

项目经验(脱敏处理)

电商平台商品数据采集与分析项目:主导分布式爬虫系统架构设计,采用Scrapy-Redis实现任务分发与结果存储,结合异步协程技术提升采集效率300%。针对电商平台JavaScript动态渲染页面,使用Playwright实现自动化浏览器控制,解决动态内容抓取难题。设计反反爬策略体系,通过IP代理池动态切换、User-Agent随机伪装及请求频率控制,突破平台限速机制。构建Redis增量爬取系统,实现数据去重与增量更新,日均处理数据量达200万条。完成MySQL数据库分库分表优化及MongoDB数据存储方案设计,确保数据高效存储与查询。最终输出商品价格波动分析报告,为业务决策提供数据支撑。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接