IT人力外包人才简历库

返回列表

Python爬虫开发工程师

驻场外包人员
工作年限:2年 意向城市:杭州 浏览:8次 发布时间:近期

技能标签

Python Scrapy Selenium 正则表达式 XPath MySQL 分布式爬虫 数据清洗 数据库优化 Linux 日志分析 异常监控 自动化测试 办公自动化 爬虫架构设计 高并发处理

专业技能

精通Python编程语言,掌握Scrapy、Selenium等主流爬虫框架,具备分布式爬虫架构设计能力。熟练运用正则表达式、XPath等解析技术处理HTML文档,擅长数据清洗与结构化处理。精通MySQL数据库管理,具备数据库性能优化及高并发场景下的事务处理经验。熟悉Linux服务器环境部署,掌握日志分析与异常监控技术。

工作履历(脱敏处理)

作为Python开发工程师,主要负责企业级爬虫系统的架构设计与开发工作。主导设计基于Scrapy-Redis的分布式爬虫框架,实现日均百万级数据采集能力,通过任务队列分片和异常重试机制保障数据采集稳定性。优化MySQL数据库索引结构,将数据查询响应时间缩短60%,并设计缓存机制降低数据库负载。开发自动化测试脚本,实现测试覆盖率提升至95%。主导办公自动化工具开发,通过openpyxl实现Excel文件自动化处理,提升数据处理效率300%。

项目经验(脱敏处理)

1. 构建分布式爬虫系统:基于Scrapy-Redis框架设计分布式爬虫架构,采用多线程调度和任务队列分片技术,实现日均100万条数据采集。通过设置重试机制和异常处理模块,保障数据采集稳定性,系统可用性达99.9%。

2. 数据解析与清洗系统:研发基于XPath和正则表达式的数据解析模块,处理HTML文档结构化数据提取。设计数据清洗规则引擎,实现数据去重、格式标准化和异常值过滤,最终数据准确率提升至99.8%。

3. 自动化测试平台开发:基于Selenium构建浏览器自动化测试框架,实现接口功能测试和UI自动化测试。通过引入测试用例管理模块和报告生成系统,使测试覆盖率提升至95%,测试执行效率提升40%。

4. 办公自动化工具开发:使用openpyxl开发Excel自动化处理工具,实现数据批量导入导出、报表生成和格式标准化处理。通过脚本自动化处理每月2000+份报表,提升数据处理效率300%,减少人工操作错误率90%。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

2年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接