https://www.crummy.com/software/BeautifulSoup/bs4/doc.ko/
뷰티플수프 문서 — 뷰티플수프 4.0.0 문서
find_all() 메쏘드는 태그의 후손들을 찾아서 지정한 여과기에 부합하면 모두 추출한다. 몇 가지 여과기에서 예제들을 제시했지만, 여기에 몇 가지 더 보여주겠다: 어떤 것은 익숙하지만, 다른 것
www.crummy.com
뷰티풀숩 데이터 출력
#2.3
Extracting Indeed Pages part one

extracting from indeed page number from 1 to 5.
#2.4 Extracting Indeed Pages part Two (07:34)

Finding max page !
#2.5 Requesting Each Page (10:29)


각 페이지를 요청해서 정상 작동하는지 테스트
#2.6 Extracting Titles (08:27)

인디드에 있는 홈피에서 타이틀 추출 성공
#2.7 Extracting Companies (09:13)

지저스 왜 하나밖에 안나와 ㅡㅡ
#2.8 Extracting Locations and Finishing up (13:09)

하나밖에 안나오지만 출력성공
#2.9 Stackover flow

#2.10 StackOverflow extract jobs (09:02)

잡코드 불러오기 성공
마지막 페이지 불러오기 성공
#2.11 StackOverflow extract job (10:11)
일잦리 가져오기 !!
리스트안에 이미 뭐가 들어간지 안다 ( company and location 두개를 동시에 불러올 수 있다.)
print에서도 동시에 프린트 가능.

회사이름
장소
span뽑아내기 성공
#2.13 Stack overflow finish
1.main에서 stackoverlfow와 indeed를 합쳐줄 수 있다.
2. 스크래핑 해주는 상태창을 볼 수 있음


csv 불러오기


csv 파일을 자동 생성할 수 있는 코드
좋은 비즈니스 모델이 될 수있다.
정보싸움이니까...
'Computer Science > Python 노마드코더 웹 스크래퍼' 카테고리의 다른 글
210814 Python 노마드코더 웹스크래퍼 -01 (0) | 2021.08.14 |
---|