IT人力外包人才简历库

返回列表

数据采集工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:1次 发布时间:近期

技能标签

Python Scrapy Django MySQL Redis Oracle PostgreSQL ClickHouse 异步编程 反爬虫 Linux运维 数据结构 网络调试

专业技能

精通Python语言及Scrapy框架,具备高并发异步爬虫开发能力;熟练掌握Django框架进行Web开发;精通MySQL、Redis、Oracle、PostgreSQL、ClickHouse等数据库系统;熟悉JavaScript反爬机制及字体反爬策略;掌握Linux系统运维及网络调试技术;具备数据结构与算法基础,能独立完成复杂数据处理逻辑

工作履历(脱敏处理)

专注于数据采集系统的开发与优化,主导设计并实现多源数据采集方案,提升数据抓取效率30%。开发异步爬虫框架,采用aiohttp+asyncio实现高并发请求处理,解决国外网站网络延迟导致的数据不全问题。构建基于Django的Web管理平台,实现采集任务配置与结果可视化展示。优化数据存储架构,通过PyMysql模块实现MySQL数据库的高效数据持久化,支持百万级数据存储。持续完善反爬虫策略,包括Cookie管理、请求头伪装等技术手段,提升数据采集稳定性。

项目经验(脱敏处理)

项目一:构建HGMD基因突变数据库系统。采用asyncio+aiohttp实现高并发异步请求,通过timeout机制保障请求稳定性。设计Cookie管理方案应对反爬策略,使用xpath解析HTML页面,通过PyMysql模块完成MySQL数据库的结构化存储。项目二:开发多源电商数据采集平台。实现京东商品信息抓取系统,支持多条件筛选与数据导出功能,采用分布式爬虫架构提升采集效率。项目三:搭建电影数据采集系统,完成豆瓣电影排行榜数据采集与Excel存储,优化请求频率控制策略,确保数据完整性。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接