본문 바로가기

Computer Science/Python 노마드코더 웹 스크래퍼

210815 Python 노마드코더 웹스크래퍼 -02. 완성!!

https://www.crummy.com/software/BeautifulSoup/bs4/doc.ko/

 

뷰티플수프 문서 — 뷰티플수프 4.0.0 문서

find_all() 메쏘드는 태그의 후손들을 찾아서 지정한 여과기에 부합하면 모두 추출한다. 몇 가지 여과기에서 예제들을 제시했지만, 여기에 몇 가지 더 보여주겠다: 어떤 것은 익숙하지만, 다른 것

www.crummy.com

뷰티풀숩 데이터 출력

 

#2.3

Extracting Indeed Pages part one 

extracting from indeed page number from 1 to 5. 

 

#2.4 Extracting Indeed Pages part Two (07:34)

Finding max page ! 

 

#2.5 Requesting Each Page (10:29)

각 페이지를 요청해서 정상 작동하는지 테스트

 

#2.6 Extracting Titles (08:27)

인디드에 있는 홈피에서 타이틀 추출 성공

 

#2.7 Extracting Companies (09:13)

지저스 왜 하나밖에 안나와 ㅡㅡ

 

#2.8 Extracting Locations and Finishing up (13:09)

하나밖에 안나오지만 출력성공

 

#2.9 Stackover flow

#2.10 StackOverflow extract jobs (09:02)

잡코드 불러오기 성공

마지막 페이지 불러오기 성공 

 

#2.11 StackOverflow extract job (10:11)

 

일잦리 가져오기 !!

리스트안에 이미 뭐가 들어간지 안다 ( company and location 두개를 동시에 불러올 수 있다.)

print에서도 동시에  프린트 가능. 

 

회사이름

장소

span뽑아내기 성공 

 

#2.13 Stack overflow finish

1.main에서 stackoverlfow와 indeed를 합쳐줄 수 있다.

2. 스크래핑 해주는 상태창을 볼 수 있음

 

csv 불러오기 

 

 

csv 파일을 자동 생성할 수 있는 코드

좋은 비즈니스 모델이 될 수있다.

 정보싸움이니까...