中高级爬虫工程师
成都搜江湖科技信息有限公司ChengduUpdate time: January 1,1
Job Description
岗位职责:
1、 负责互联网站、网页、链接的特征挖掘
2、 负责设计和开发分布式的网络爬虫应用,包括调度、抓取、入库等内容,进行互联网相关信息的抓取和分析。
3、 实现大规模文本、图像、数据的抓取、抽取,去重、分类,垃圾过滤,质量识别、解析入库等工作 。
4、 提供分布式爬虫和数据采集系统的技术实现方案;
5、 分析静态网页结构,解析网页数据,对数据进行过滤,去重,结构化处理;
任职要求:
1、全日制本科以上,计算机相关专业具备1年及以上开发项目经验;
2、扎实的Java/Python基础,熟悉多线程编程环境,熟悉常见开源框架;
3、熟悉前端技术,HTML,JavaScript,Ajax等;
4、熟悉抓取原理及技术,熟悉Scrapy、Pyspider、nutch等主流爬虫框架使用,有获取电商数据经验者优先;
5、熟练使用Mysql 、mongodb、 Redis等数据库;
6、具有构建分布式爬虫系统的经验,具有海量高并发网页爬取项目经验优先;
7、具备较好的数据分析能力和解决问题的能力、具有机器学习、数据挖掘等经验者优先
职能类别: 高级软件工程师 软件工程师
微信分享
联系方式
上班地址:滨江中路9号万达瑞华中心
Get email alerts for the latest"中高级爬虫工程师 jobs in Chengdu"
