CS_Project/WebCrawler_Venture
1. 전체적인 구도
Chang_Tree
2020. 3. 23. 01:33
목표는 투자회사가 주어지면, 그 투자회사가 투자한 기업들의 리스트 생성
기업들을 https://thevc.kr/ 에 검색, 엑셀에 사명, 제품/서비스명, 업종, 회사설립연도, 직전라운드, 일시, 총투자금액, 투자자리스트를 자동으로 만들어 내는 것이다.
하나 어려운 문제가 투자자리스트는, 뉴스에 들어가 상단 문단을 긁어서 파싱해야한다.
일주일동안 만들 것은 기업들 리스트가 있다고 가정하고, 위 사이트 검색을 통해 원하는 데이터들을 가져오는 웹크롤링 장치이다.
동적웹이 많아, 셀레니움을 이용할 것 같다.