cmd 

pip install 

 

메타태그는 strong 이고 

클래스는 acc 이다.

 

이제 우리는 html을 parsing 하는 BeautifulSoup라이브러리와 우리가 찾은 태그를 이용해서 크롤링을 해보자.

 

strong 메타에서 클래스가 acc인 키들을 다 가지고 오자

 

 


grep : binary 파일을 문자열로 변환하여 리스트에 저장한다.

def grep(lines, searchtext):
    lineList = []
    for line in lines:
        if searchtext in line.decode('utf_8'):
            line = line.decode('utf_8')
            lineList.append(line)
    return lineList

 

split : 문자열을 리스트로

>>> time_str = "10:34:17"
>>> time_str.split(':')
['10', '34', '17']

 

join : 리스트를 문자열로

>>> time_list
['10', '34', '17']
>>> ':'.join(time_list)
'10:34:17'

 

replace : 문자열 변경

replace(old, new, [count]) -> replace("찾을값", "바꿀값", [바꿀횟수])

복사했습니다!