分享
定制
項目經(jīng)歷(案例一)
項目時間:2017-01到2011-10
項目名稱:引物自動化設(shè)計軟件
項目描述:
項目介紹
這個軟件開發(fā)原因是因為隨著每日數(shù)據(jù)分析量的加大,組內(nèi)人員較少,對引物設(shè)計這種工作變成了工作效率的阻礙,遂提出了設(shè)計軟件以達到自動化設(shè)計的目的。
而且引物設(shè)計主要費時在于多種驗證操作,可以通過軟件自動驗證減少人力成本。
我的職責(zé)
1,軟件基礎(chǔ)功能設(shè)計,完成相關(guān)函數(shù)如自連互連驗證,溫度驗證等功能
2,分析NCBI網(wǎng)頁格式,設(shè)計API調(diào)用接口
3,編寫測試腳本對軟件進行測試
項目經(jīng)歷(案例二)
項目時間:2017-01到2011-10
項目名稱:分布式爬蟲爬取北京市企業(yè)信用信息網(wǎng)
項目描述:
項目介紹
這個項目是通過scrapy-redis搭建分布式爬蟲爬取企業(yè)信用信息網(wǎng)公布欄,爬取列表頁每一項下的子頁獲取數(shù)據(jù)
我的職責(zé)
首先爬取首頁后通過xpath匹配每個的信息塊的span后構(gòu)建請求,并通過scrapy.Request發(fā)送請求,用xpath匹配需要的信息。
同時循環(huán)創(chuàng)建下一頁請求的form表單,通過scrapy.FormRequest發(fā)送POST請求。
所有爬取的信息緩存到redis數(shù)據(jù)庫中,
最后通過編寫python腳本將redis數(shù)據(jù)庫中數(shù)據(jù)讀取出來加入mysql數(shù)據(jù)庫。
其他爬取的網(wǎng)站:搜狐新聞、豆瓣、騰訊新聞網(wǎng)
項目經(jīng)歷(案例三)
項目時間:2016-03到2011-10
項目名稱:基于django的基因產(chǎn)品選購系統(tǒng)
項目描述:
項目介紹
該項目為了滿足部分人群不方便抽血,但是又想通過基因檢測了解自己情況的人群,通過讓客戶在線選購基因檢測套餐,而后通過快遞將唾液采集器送達客戶家中,客戶只需按流程收集唾液后快遞給公司,就可以在規(guī)定的天數(shù)后在系統(tǒng)中查詢自己的檢測項目結(jié)果
我的職責(zé)
1,通過bootstrap,及js,css完成前端頁面的構(gòu)建
2,通過django搭建后端框架,使用cookie和session共同保存用戶的登錄狀態(tài),通過ajax發(fā)送post請求將用戶選擇的套餐編號發(fā)送到服務(wù)器
3,測序結(jié)果使用ajax請求,返回json數(shù)據(jù),通過判定json中result鍵的值判斷是否有測序結(jié)果,如果有結(jié)果便通過jquery動態(tài)加載到頁面上
項目經(jīng)歷(案例四)
項目時間:2015-12到2011-10
項目名稱:通過異步爬蟲爬取HGMD,構(gòu)建mysql數(shù)據(jù)庫
項目描述:
項目介紹
對高通量測序數(shù)據(jù)進行數(shù)據(jù)分析時,需要對snp數(shù)據(jù)進行相關(guān)性篩選,為此需要構(gòu)建基于mysql的基因突變數(shù)據(jù)庫,對HGMD網(wǎng)站相關(guān)基因突變信息進行爬取,爬取內(nèi)容包括基因名,染色體坐標(biāo),突變信息,致病信息等。
爬取結(jié)果存儲于mysql。
我的職責(zé)
1,采用asyncio+aiohttp以達成高并發(fā),異步請求。
2,通過timeout設(shè)置超時重發(fā)機制,因為HGMD為國外網(wǎng)站,防止因為網(wǎng)絡(luò)卡頓導(dǎo)致頁面抓取不到產(chǎn)生數(shù)據(jù)不全的現(xiàn)象。
3,通過繼承aiohttp.ClientSession類來保存cookie對象,以應(yīng)對基于cookie的反扒策略
4,使用xpath進行頁面解析,解析出的數(shù)據(jù)通過PyMysql模塊存儲于mysql數(shù)據(jù)庫中
【使用錘子簡歷小程序制作簡歷】
零經(jīng)驗實習(xí)簡歷模板
21254人用過
學(xué)生求職簡歷模板
52754人用過
申請研究生簡歷模板
2324人用過
經(jīng)典工作簡歷模板
6254人用過
投行咨詢簡歷模板
12465人用過
產(chǎn)品經(jīng)理簡歷模板
7532人用過
程序員簡歷模板
7457人用過
留學(xué)英文簡歷模板
4554人用過