IT人力外包人才简历库

返回列表

数据采集工程师

驻场外包人员
工作年限:1年 意向城市:上海 浏览:1次 发布时间:近期

技能标签

Python Selenium XPath Requests 反爬策略 异常处理 文件系统 模块化开发 动态页面处理 正则表达式

专业技能

精通Python编程语言,掌握Requests库实现HTTP请求与会话管理,具备反爬策略应对能力。熟练运用XPath、lxml、正则表达式进行静态页面解析,擅长复杂结构数据提取。精通Selenium框架控制浏览器,具备无头模式配置、自动化特征隐藏等高级操作能力。熟悉动态页面处理技术,掌握显式等待、随机延迟等反反爬策略。具备完善的异常处理机制,支持网络超时、解析失败等场景的重试机制。精通文件系统操作,实现文件名标准化、版本号追加、多路径权限校验等功能。具备模块化开发能力,通过函数封装提升代码复用性与可维护性。持续优化爬虫架构,建立40+常见问题解决方案知识库。

工作履历(脱敏处理)

主导动态招聘网站数据采集系统开发,实现关键词搜索、多页翻页、详情页跳转等核心功能。设计浏览器自动化方案,配置无头模式、图片禁用、自动化特征隐藏等参数,提升采集效率。开发数据解析模块,完成职位名称、薪资、地区等字段提取,建立反爬策略应对机制。构建日志监控系统,实现采集过程可视化管理。开发豆瓣电影Top250采集工具,完成分页采集、信息结构化存储及图片下载功能,支持全量数据采集。

项目经验(脱敏处理)

动态招聘网站数据采集系统:基于Selenium实现浏览器自动化,配置无头模式、图片禁用及自动化特征隐藏,解决动态渲染页面数据采集难题。设计显式等待机制应对元素加载延迟,实现随机延迟策略应对反爬。开发多线程采集框架,支持日志系统接入与运行监控,提升采集稳定性。完成职位信息结构化存储,建立反爬策略知识库,保障采集系统持续运行。

豆瓣电影Top250采集工具:开发分页采集模块,支持全量250条电影数据抓取。实现电影基本信息提取,包括片名、导演/演员、上映年份等字段。构建图片下载系统,完成电影海报存储与结构化处理。设计异常处理机制,确保采集过程稳定性,实现数据自动校验与存储。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接