IT人力外包人才简历库

返回列表

数据采集工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:16次 发布时间:近期

技能标签

Python开发 Scrapy框架 反爬虫技术 HTML解析 AJAX处理 HTTP协议 数据库管理 代理池搭建 Cookie池使用 数据提取工具 分布式爬虫 日志监控 任务调度 网络协议分析 爬虫架构设计

专业技能

精通Python编程语言,掌握Scrapy框架核心原理与分布式爬虫架构设计。具备反爬虫攻防技术体系,包括验证码识别、IP代理池构建、请求头模拟等。熟练运用XPath/Jsonpath/RE进行结构化数据提取,精通HTML/AJAX/HTTP协议分析。熟悉MySQL数据库优化及Redis缓存机制,具备分布式任务调度与日志监控能力。

工作履历(脱敏处理)

专注于数据采集系统开发,主导构建分布式爬虫架构,实现日均百万级数据采集。设计反爬虫策略,成功突破目标网站的验证码识别与IP封锁机制。开发代理池与Cookie池管理系统,提升爬虫稳定性与效率。优化数据解析流程,采用XPath/Jsonpath进行结构化提取,降低数据清洗工作量。实施数据库分库分表方案,提升数据存储与查询性能。

项目经验(脱敏处理)

某大型翻译平台数据采集项目(2021.03-2021.03):构建多线程分布式爬虫系统,实现双语对照数据自动采集。攻克目标网站的动态渲染反爬机制,采用Selenium+Playwright工具链进行页面渲染,结合OCR技术识别验证码。设计IP代理池与Cookie池管理系统,实现请求流量的智能调度与身份模拟。开发数据解析模块,通过XPath与Jsonpath提取结构化数据,日均处理数据量达50万条。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接