닥터노아바이오텍 인턴쉽 - 4
2020. 8. 3. 14:43
📌 Internship/닥터노아바이오텍
새로 업데이트된 질병 데이터의 수 추가하기 CREATE TABLE `2020_NoteP`.`GEODATA_List_2` SELECT `GEODATA_List`.`Category`, `GEODATA_List`.`DescriptorUI`, `GEODATA_List`.`MeSH_Disease_Term`, `GEODATA_List`.`Disease_Name`, `GEODATA_List`.`Dataset_Possess`, `GEODATA_List`.`Dataset_Possess_P`, `GEODATA_List`.`Dataset_Possess_New`, IFNULL(`MeSH_Count`, 0) AS Dataset_Possess_Update, `GEODATA_List`.`TreeNumbers` FROM `GEODA..
닥터노아바이오텍 하계 인턴쉽 - 3
2020. 7. 31. 15:07
📌 Internship/닥터노아바이오텍
# Disease count SELECT `MeSH_Disease_Term`,`MeSH_Descriptor`, COUNT(*)AS `MeSH_Count` FROM `2020_NoteP`.`ALL_NOTE_P_2020` GROUP BY `MeSH_Disease_Term`; SELECT 로 보고 싶은 컬럼들 보여주기, COUNT(*) `중복개수 확인할 컬럼명` FROM `테이블명` GROUP BY `컬럼명` HAVING COUNT(*)>=1; # 한 개 이상의 것들만 세기
닥터노아바이오텍 하계 인턴쉽 - 2
2020. 7. 30. 15:01
📌 Internship/닥터노아바이오텍
ALTER TABLE `2020_NoteP_DH`.`ALL_NOTE_P_DH_20200729` DROP NOTEPID; ALTER TABLE 2020_NoteP_WC.ALL_NOTE_P_WC_20200729 DROP NOTEPID; # NULL to 0 UPDATE `ALL_NOTE_P_IS` SET memoGPL_islee = 0, WGCNA_success = 0, memo_DEGs = 0, memo_Median = 0, memo_WGCNA = 0, memo_input = 0, memo_Ver2 = 0, memo_Ver3 = 0, memo_Ver4 = 0, memo_Ver5 = 0, memo_Ver22 = 0, memo_Ver44 = 0; # NULL to 0 UPDATE `ALL_NOTE_P_SH` ..
웹 크롤링
2020. 7. 15. 10:30
📌 Internship/닥터노아바이오텍
cmd pip install 메타태그는 strong 이고 클래스는 acc 이다. 이제 우리는 html을 parsing 하는 BeautifulSoup라이브러리와 우리가 찾은 태그를 이용해서 크롤링을 해보자. strong 메타에서 클래스가 acc인 키들을 다 가지고 오자 grep : binary 파일을 문자열로 변환하여 리스트에 저장한다. def grep(lines, searchtext): lineList = [] for line in lines: if searchtext in line.decode('utf_8'): line = line.decode('utf_8') lineList.append(line) return lineList split : 문자열을 리스트로 >>> time_str = "10:34:17..
닥터노아바이오텍 하계 인턴쉽
2020. 7. 6. 17:37
📌 Internship/닥터노아바이오텍
https://www.ncbi.nlm.nih.gov/ National Center for Biotechnology Information www.ncbi.nlm.nih.gov NCBI sample 검색 1. 검색 카테고리에서 MeSH로 Disease 검색 >> Disease 2. 검색한 Disease의 Mesh Disease term 찾기 >> Mesh_Disease_term 3. Mesh Disease의 unique ID 찾기 >> Mesh_Discription 4. GEO Datasets 카테고리에서 Mesh Disease term 검색 5. Disease 필터링 Custom range : 2017/05/01 ~ Study type : Expression profiling by array Entry t..