cmd
pip install
메타태그는 strong 이고
클래스는 acc 이다.
이제 우리는 html을 parsing 하는 BeautifulSoup라이브러리와 우리가 찾은 태그를 이용해서 크롤링을 해보자.
strong 메타에서 클래스가 acc인 키들을 다 가지고 오자
grep : binary 파일을 문자열로 변환하여 리스트에 저장한다.
def grep(lines, searchtext):
lineList = []
for line in lines:
if searchtext in line.decode('utf_8'):
line = line.decode('utf_8')
lineList.append(line)
return lineList
split : 문자열을 리스트로
>>> time_str = "10:34:17"
>>> time_str.split(':')
['10', '34', '17']
join : 리스트를 문자열로
>>> time_list
['10', '34', '17']
>>> ':'.join(time_list)
'10:34:17'
replace : 문자열 변경
replace(old, new, [count]) -> replace("찾을값", "바꿀값", [바꿀횟수])
'📌 Internship > 닥터노아바이오텍' 카테고리의 다른 글
닥터노아바이오텍 인턴쉽 - 5 (0) | 2020.08.07 |
---|---|
닥터노아바이오텍 인턴쉽 - 4 (0) | 2020.08.03 |
닥터노아바이오텍 하계 인턴쉽 - 3 (0) | 2020.07.31 |
닥터노아바이오텍 하계 인턴쉽 - 2 (0) | 2020.07.30 |
닥터노아바이오텍 하계 인턴쉽 (1) | 2020.07.06 |